DE60223517T2 - Semiotisches Analysesystem, computerlesbares Speichermedium und Verfahren - Google Patents

Semiotisches Analysesystem, computerlesbares Speichermedium und Verfahren Download PDF

Info

Publication number
DE60223517T2
DE60223517T2 DE60223517T DE60223517T DE60223517T2 DE 60223517 T2 DE60223517 T2 DE 60223517T2 DE 60223517 T DE60223517 T DE 60223517T DE 60223517 T DE60223517 T DE 60223517T DE 60223517 T2 DE60223517 T2 DE 60223517T2
Authority
DE
Germany
Prior art keywords
dimension
elements
semiotic
query
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60223517T
Other languages
English (en)
Other versions
DE60223517D1 (de
Inventor
Josiah Lee Sommerville Auspitz
Kilian Stoffel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Application granted granted Critical
Publication of DE60223517D1 publication Critical patent/DE60223517D1/de
Publication of DE60223517T2 publication Critical patent/DE60223517T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Holo Graphy (AREA)
  • Debugging And Monitoring (AREA)
  • Machine Translation (AREA)

Description

  • HINTERGRUND DER ERFINDUNG
  • 1. Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft allgemein Vorrichtungen und Verfahren zum Analysieren, sowie Vorrichtungen und Verfahren zum Kategorisieren von Daten.
  • 2. Diskussion des Stands der Technik
  • Im Stand der Technik gibt es Vorrichtungen und Verfahren, welche Textdaten kategorisieren und analysieren. Ein Beispiel wird im US-Patent Nr. 6 006 221 (dem "Patent '221") beschrieben. Das Patent '221 beschreibt ein Dokumenten-Retrieval-System, bei welchem ein Benutzer eine Abfrage eingeben kann, und Dokumente aus einer Datenbank zurückholen kann. Bei jedem Dokument in der Datenbank wird eine Gruppe von Verarbeitungsschritten durchgeführt, um eine sprachunabhängige Konzept-Darstellung des Inhalts des Dokuments zu erzeugen. Mit einer Abfrage wird ebenfalls eine Gruppe von Verarbeitungsschritten durchgeführt, um eine sprachenunabhängige, konzeptionelle Darstellung des Gegenstands der Abfrage zu erzeugen. Mit den Dokumenten und Abfragen können ebenfalls zusätzliche Analysen durchgeführt werden, um zusätzliche Term-basierende Darstellungen zur Verfügung zu stellen, beispielsweise das Abziehen von an Information reichen Termen und Phrasen. Dokumente werden dann mit Abfragen abgeglichen, auf Grundlage des Konzeptniveau-Inhalts des Dokuments und der Abfrage, und wahlweise auf Grundlage der Term-basierenden Darstellung. Die Darstel lung der Abfrage wird dann mit jeder Darstellung eines Dokuments verglichen, um ein Maß für die Relevanz des Dokuments in Bezug auf die Abfrage zu erzeugen.
  • Das Dokument "Scott Deerwester et al., Indexing by Latent Semantic Analysis, Journal of the American Society for Information Science, 41 (1990), 391 bis 407" beschreibt ein Inhaltsbasierendes System zum Auffinden von Dokumenten, die in Beziehung zu einer Abfrage stehen. Insbesondere findet das Verfahren nach diesem Stand der Technik Dokumente auf, die in Bezug zu der Abfrage stehen, durch Untersuchung der Terme, die in der Abfrage verwendet werden, und der Terme, die in dem Dokument verwendet werden. Auf Grundlage dieser Terme findet das Verfahren die Abfrage in einem mehrdimensionalen Raum auf, und findet die Dokumente in der Suche in diesem mehrdimensionalen Raum auf. Das Verfahren vergleicht dann den Ort der Abfrage in dem Raum mit dem Ort der Dokumente in dem Raum, und wählt Dokumente als Reaktion auf die Abfrage auf Grundlage des Ausmaßes der Nähe der Dokumente und der Abfrage in dem Raum aus. Dieses Verfahren nach dem Stand der Technik beruht daher auf der Bedeutung ("dem thematischen Inhalt") der Terme.
  • Die Systeme nach dem Stand der Technik leiden manchmal an der Unfähigkeit, ordnungsgemäß einige relevante Dokumente zu identifizieren. Die Systeme nach dem Stand der Technik leiden manchmal an der Unfähigkeit, ordnungsgemäß die Relevanz eines Dokuments in Bezug auf die Abfrage zu messen.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die hier geschilderte und beanspruchte Erfindung stellt eine Verbesserung gegenüber Systemen nach dem Stand der Technik in der Hinsicht dar, dass bei zahlreichen Situationen die Erfindung besser ordnungsgemäß relevante Dokumente identifizieren kann, und besser ordnungsgemäß die Relevanz des betreffenden Dokuments in Bezug auf die Abfrage beurteilen kann. Darüber hinaus stellt die Erfindung eine vereinigte Architektur zum Vereinigen mehrerer Medien und heterogener Datenbanken zur Verfügung, so dass diese mit einer einzigen Abfrage analysiert und durchsucht werden können. Die Erfindung strukturiert Daten, um komplexe analytische Operationen zu ermöglichen, und automatisierte Agenten so auszubilden, dass diese Operationen in Wechselwirkung mit von einem Benutzer zur Verfügung gestellten Signalen durchführen können, bei einer sich ändernden Datenumgebung, oder bei anderen automatisierten Agenten. Die Erfindung ist ebenfalls dazu fähig, semiotische Information aufrechtzuerhalten, die nicht von Systemen nach dem Stand der Technik aufgenommen wird.
  • Hierbei betrifft die Erfindung ein semiotische Analysesystem, bei welchem vorgesehen sind:
    ein Computer, welcher Software aufweist, welche den Computer zur Annahme einer Abfrage veranlassen kann, und zum Durchsuchen einer Datenbank nach Einträgen in der Datenbank in Bezug auf die Abfrage, wobei die Abfrage zumindest einem Bedeutungselement zugeordnet ist, welches eine semiotische Eigenschaft der Abfrage identifiziert; und
    eine Datenbank in Verbindung mit dem Computer, wobei die Datenbank einen Eintrag aufweist, der einem Teil eines Mediums entspricht, bei welchem ein Abschnitt des Teils des Mediums zumindest einem Beschreibungselement zugeordnet ist, das eine semiotische Eigenschaft des Abschnitts identifiziert, wobei die semiotische Eigenschaft ein Teil einer Gruppe semioti scher Eigenschaften ist, die eine vorbestimmte Anzahl zwischen zwei und zehn unterschiedlichen Dimensionen semiotischer Beziehungen umfassen, bei welchen jede Dimension auf eine vorbestimmte Anzahl von zumindest drei Arten von Zeichenelementen unterteilt ist, von denen jede weiter unterteilt werden kann, und bei welchen jede semiotische Eigenschaft unabhängig von dem thematischen Inhalt ist, der durch Zeichen angegeben wird, und
    wobei die Software die semiotische Ähnlichkeit zwischen der Abfrage und dem Abschnitt bestimmen kann, auf Grundlage von
    zumindest einer semiotischen Eigenschaft, welche der Abfrage zugeordnet ist; und
    zumindest einer semiotischen Eigenschaft, die dem Abschnitt zugeordnet ist.
  • Die Erfindung weist ein System auf, das eine durchsuchbare Datenbank aufweist. Die Datenbank weist Teile von Medien auf. Zumindest einigen der Teile der Medien ist ein Beschreibungselement zugeordnet. So kann beispielsweise ein Beschreibungselement eine Beziehung zwischen Abschnitten der Teile der Medien angeben, oder kann ein Beschreibungselement angeben, wie der Abschnitt eingesetzt oder interpretiert wird, oder wie dessen Auswirkung ist.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • Zum besseren Verständnis der Art und Weise und der Ziele der Erfindung wird Bezug auf die folgende, detaillierte Beschreibung im Zusammenhang mit den beigefügten Zeichnungen genommen, bei welchen:
  • 1 eine schematische Darstellung eines Systems gemäß der vorliegenden Erfindung ist, das einen Computer in Kommunikationsverbindung mit einer Datenbank aufweist; und 2 eine zehndimensionale semiotische Unterteilung des globalen Informationsraums gemäß der vorliegenden Erfindung repräsentiert.
  • DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
  • 1 zeigt ein System gemäß der vorliegenden Erfindung. Das System weist einen Computer 10 auf, mit zugehöriger Software. Wenn die Software läuft, akzeptiert der Computer 10 eine Anfrage von einem Benutzer, und durchsucht dann eine Datenbank 20 nach Teilen von Medien, die in Bezug auf die Abfrage relevant sein können.
  • Das System weist weiterhin eine Datenbank 20 auf, die in Kommunikation mit dem Computer 10 steht. Der Computer 10 weist Teile von Medien auf. Teile von Medien können beispielsweise ein Text eines Dokuments sein, oder eine Aufnahme einer Audio- oder Video-Darstellung. Die Datenbank 20 kann auf einem Computer-lesbaren Medium vorhanden sein, und kann die Teile der Medien enthalten. Beispiele für Computer-lesbare Medien sind eine Floppy-Disk, eine Kompaktdiskette, ein Speicher mit wahlfreiem Zugriff, und ein Nur-Lese-Speicher. Zumindest eines der Teile der Medien weist einen Abschnitt auf, der durch zumindest ein Beschreibungselement identifiziert wird. Das Beschreibungselement gibt eine semiotische Eigenschaft des Abschnitts an.
  • Die Beschreibungselemente stellen Information in Bezug auf Abschnitte der Teile von Medien zur Verfügung. Wenn bei spielsweise die Teile der Medien Text enthalten, kann es wünschenswert sein, ein oder mehrere Beschreibungselemente Abschnitten des Textes zuzuordnen, um zusätzliche Information in Bezug auf den Abschnitt zur Verfügung zu stellen.
  • Wenn gewünscht wird, die Datenbank 20 nach relevanten Medien zu durchsuchen, wird eine Abfrage entwickelt, und können bestimmte Abschnitte der Abfrage einem oder mehreren Bedeutungselementen zugeordnet sein. Die Abfrage kann beispielsweise Wörter umfassen, von denen einige Bedeutungselementen zugeordnet sind, und die voranstehend geschilderte Datenbank 20 kann nach den Worten durchsucht werden, und wenn die Worte in der Datenbank 20 aufgefunden werden, erfolgt eine Festlegung, ob Beschreibungselemente vorhanden sind, die zu den Bedeutungselementen passen. Die Abfrage wird in den Computer 10 eingegeben, der dann die Datenbank 20 nach Teilen von Medien durchsucht, welche in Bezug auf die Abfrage relevant sein können. Wenn beispielsweise Wörter und Bedeutungselemente zu Wörtern und Beschreibungselementen in der Datenbank 20 passen, wird das entsprechende Teil der Medien so identifiziert, dass es möglicherweise besonders relevant in Bezug auf die Abfrage ist.
  • Ein Abschnitt eines Teils von Medien kann entsprechende Beschreibungselemente aufweisen. Ein Abschnitt einer Abfrage kann auch entsprechende Bedeutungselemente aufweisen. Teile von Medien, die stark relevant in Bezug auf eine Abfrage sind, weisen stärkere Übereinstimmungen zwischen Beschreibungselementen und Bedeutungselementen auf als Teile von Medien, die in keiner erheblichen Beziehung zur Abfrage stehen. Es lässt sich beispielsweise ein Abschnitt einer Abfrage überlegen, bei welchem fünf Bedeutungselemente zugeordnet sind, ein erstes Dokument vorhanden ist, das einen Textab schnitt aufweist, welchem vier Bedeutungselemente zugeordnet sind, und ein zweites Dokument, das denselben Textabschnitt aufweist, dem sieben Beschreibungselemente zugeordnet sind. Es wird angenommen, dass die Beschreibungselemente des ersten Dokuments vier oder fünf Bedeutungselemente enthalten, jedoch beim zweiten Dokument nur zwei der fünf Bedeutungselemente vorhanden sind. Wenn die Datenbank 20 durchsucht wird, wird das erste Dokument mit der Abfrage in stärkerem Ausmaß durchsucht als bei dem zweiten Dokument, da eine größere Anzahl der Beschreibungselemente des ersten Dokuments zu den Bedeutungselementen der Abfrage passen. Dem Benutzer kann dann eine Prioritätsliste von Dokumenten zur Verfügung gestellt werden, welche in Bezug auf die Abfrage steht. Beispielsweise kann das erste Dokument auf der Prioritätsliste vor dem zweiten Dokument angeordnet sein.
  • Bei einigen Fällen können einige Beschreibungselemente besser zur Anzeige des Inhalts der Medien als andere Beschreibungselemente geeignet sein, so dass diesen mehreren anzeigenden Beschreibungselementen ein größeres Gewicht als den weniger anzeigenden Beschreibungselementen verliehen wird. Entsprechend können einige Bedeutungselemente stärker anzeigefähig für den Inhalt der Abfrage als andere Bedeutungselemente sein, so dass den mehr anzeigekräftigen Bedeutungselementen ein größeres Gewicht als den weniger anzeigekräftigen Bedeutungselementen verliehen wird. In einem derartigen System gewichteter Beschreibungselemente und gewichteter Bedeutungselemente kann dann, wenn sich eine Übereinstimmung zwischen einem Beschreibungselement und einem Bedeutungselement findet, das Gewicht, das einem Beschreibungselement oder einem Bedeutungselement zuschreibbar ist, dazu verwendet werden, eine Anzeige zur Verfügung zu stellen, dass die entsprechenden Medien von größerer Relevanz in Bezug auf die Abfrage sind als andere Medien, welche passende, jedoch nicht-gewichtete Beschreibungselemente und Bedeutungselemente aufweisen. Beispielsweise können die Gewichte von Beschreibungselementen oder Bedeutungselementen mathematisch kombiniert werden, beispielsweise zueinander addiert oder miteinander multipliziert werden, um ein Gesamtgewicht des zusammenpassenden Paars aus Beschreibungselement und Bedeutungselement zur Verfügung zu stellen. Um dies zu erläutern, lässt sich eine Abfrage überlegen, bei welcher zehn Bedeutungselemente einem bestimmten Abschnitt der Abfrage zugeordnet sind, von denen eines mit einem Faktor von zwei gewichtet ist, um anzuzeigen, dass das gewichtete Bedeutungselement besonders anzeigekräftig für die Abfrage ist. Es ist lässt sich auch ein Abschnitt eines ersten Teils von Medien überlegen, welcher fünf Beschreibungselemente aufweist, von denen zwei mit einem Faktor von drei gewichtet sind, um anzuzeigen, dass die gewichteten Beschreibungselemente besonders anzeigekräftig für den Abschnitt sind. Es lässt sich auch ein zweites Teil von Medien überlegen, bei welchem sieben Beschreibungselemente vorhanden sind, von denen keines gewichtet ist, zugeordnet zu demselben Abschnitt, den man in dem ersten Teil der Medien auffindet. Wenn die Datenbank 20 durchsucht wird, lässt sich vermuten, dass die Abfrage das Ergebnis hat, dass der Abschnitt des ersten Teils der Medien identifiziert wird, und dazu führt, dass der Abschnitt des zweiten Teils der Medien identifiziert wird. Wenn zwei der Beschreibungselemente in dem Abschnitt des ersten Teils der Medien zu drei von den Bedeutungselementen passen, und die gewichteten Beschreibungselemente und Bedeutungselemente unter jenen sind, die zusammenpassen, dann wird das erste Teil der Medien als so identifiziert, dass es besonders relevant in Bezug auf die Abfrage ist. Wenn jedoch drei der Beschreibungselemente in dem Abschnitt des zweiten Teils der Medien zu drei von den Bedeutungselementen passen, wird zwar das zweite Teil der Medien identifiziert, jedoch wird das zweite Teil der Medien nicht so identifiziert, dass es speziell relevant in Bezug auf die Abfrage ist. Bei diesem Beispiel wird das erste Teil der Medien als stärker relevant in Bezug auf die Abfrage bestimmt als das zweite Teil der Medien. Bei einer Prioritätsliste von Medien, die durch die Suche entdeckt wird, wird das erste Teil der Medien als stärker relevant aufgelistet als das zweite Teil der Medien. Es wird darauf hingewiesen, dass die Suchabfrage verallgemeinert werden kann, um kompliziertere Lern- und Bedeutungs-Algorithmen zu umfassen, sowie Agenten-Kommunikationsprotokolle, wie nachstehend beschrieben.
  • Eine Einrichtung zur Bereitstellung von Beschreibungselementen und Bedeutungselementen (nachstehend zusammengefasst als "Indikatoren" bezeichnet) besteht darin, eine mehrdimensionale Gruppe an Indikatoren einzusetzen, die dazu verwendet werden können, Abschnitte von Teilen von Medien und Abschnitte von Teilen einer Abfrage zu beschreiben und zu kategorisieren. Wenn ein Beschreibungselement oder ein Bedeutungselement benötigt wird, kann daher das Beschreibungselement oder das Bedeutungselement aus den Indikatoren ausgesucht werden. Es sollte nunmehr deutlich sein, dass Beschreibungselemente Indikatoren darstellen, welche Medien entsprechen, während Bedeutungselemente Indikatoren darstellen, welche Abfragen entsprechen. Die mehrdimensionale Gruppe von Indikatoren, die hier beschrieben wird, stellt ein Beispiel für ein semiotisches Verfahren gemäß der vorliegenden Erfindung dar, welches Abschnitte von Teilen von Medien oder Abfragen unterteilt und klassifiziert.
  • Auf dem Gebiet der Semiotik ist die Zeichenrelation ("S") ein triadisches Grundelement, welches das Objekt ("O") mit sich bringt, das Zeichen ("R" für "Repräsentamen"), wobei eine gewisse Auswirkung des Zeichens auf einen interpretierenden Verstand oder quasi-Verstand ("I" "Interpretant") vorhanden sein kann. O-R-I stellt daher eine irreduzible triadische Beziehung dar, welche Objekt-Repräsentamen-Interpretant darstellt. Traditionell wird der globale Informationsraum auf drei Dyaden unterteilt. Eine erste Dyade befasst sich mit der Beziehung R-O, und ist als "Semantik" bekannt, und befasst sich mit der Beziehung eines Zeichens zu einem Objekt. Eine zweite, traditionelle Dyade betrifft die Beziehung R-R, die als "Syntaktik" bekannt ist, und sich mit der Beziehung von Zeichen zu Zeichen befasst. Eine dritte, traditionelle Dyade betrifft die Beziehung R-I, und ist als "Pragmatik" bekannt, welche sich mit der Bedeutung oder Beziehung von Zeichen zum Interpretanten befasst. Diese herkömmliche Unterteilung des globalen Informationsraums verringert eine tryadische Beziehung auf drei Dyaden, was nach dem Reduktions-Theorem von Peirce nicht ohne einen semiotischen Verlust möglich ist. In Bezug auf das Peirce-Reduktions-Theorem vergleiche A. Peircean Reduction Thesis: The Foundations Of Topological Logic, von Robert W. Burch, 1991. Wer mit der Lehre von Peirce vertraut ist, weiß, das Beziehungen von mehr als drei auf Triaden reduziert werden können, jedoch Triaden nicht auf Dyaden und Monaden reduzierbar sind, ohne einen semiotischen Verlust. Ein Ziel der Erfindung besteht darin, den semiotischen Verlust zu verringern oder sogar auszuschalten, der bei der herkömmlichen Unterteilung des globalen Informationsraums auftritt.
  • Anstatt der Unterteilung des globalen Informationsraums auf drei Dyaden von Anfang an behandelt die Erfindung die triadi sche Beziehung als durchgehend in Bezug auf die Breite und die Tiefe. In Bezug auf die Breite kann jeder Interpretant selbst als Zeichenbeziehung angesehen werden, mit ihrem eigenen Objekt und Interpretanten; so dass die O-R-I-Beziehung ein Continuum der Semiose mit sich bringt, wobei jedes Zeichen das andere erzeugt.
  • In Bezug auf die Tiefe bringt jeder Breakpoint zahlreiche Möglichkeiten mit sich, die auflösbar und in triadische Muster umwandelbar sind. Zum Zweck der Beschreibung der Erfindung werden zehn Breakpoints (auch hier als "Dimensionen" bezeichnet) entlang einem O-R-I-Continuum festgelegt, und es ist jede Dimension in drei Zeichenelemente aufteilbar. 2 zeigt ein derartiges zehndimensionales Continuum. Jedes Zeichenelement kann auf Unterelemente aufgeteilt werden. Zeitweilig ist es hilfreich, die Zeichenelemente als "Wertigkeits"-Repräsentationen der entsprechenden Dimension anzusehen, und ist es hilfreich, die Unterelemente als "körnige" Repräsentationen des entsprechenden Zeichenelements anzusehen. Auf diese Art und Weise kann ein "Reichtum" oder eine "Dichte" erzielt und ausgenutzt werden, um ordnungsgemäß ein Teil eines Mediums mit einer Abfrage zu identifizieren. Es wird darauf hingewiesen, dass jedes Datum durch zahlreiche Zeichenelemente in jeder vorgegebenen Dimension repräsentiert werden kann. Die Fähigkeit, ein Datum mit mehr als einem Zeichenelement zu beschreiben, wird nachstehend als "Verfassungsmöglichkeit" beschrieben. Der Aspekt in Bezug auf das Verfassungsvermögen gemäß der vorliegenden Erfindung bewahrt Information auf, die nicht durch Darstellungen von Daten aufbewahrt wird, die nur ermöglichten, dass ein Zeichenelement einem Datum zugeordnet ist.
  • Die Abmessungen bei diesem Beispiel sind nicht willkürlich dargestellt. Die Darstellung der Abmessungen wird durch drei Kategorien festgelegt, die als fundamental festgelegt werden. Zuerst werden das "unmittelbare" Konzept eines isolierten Gegenstands (wobei nur ein Element vorhanden sein muss); das "dynamische" Konzept des ersten Gegenstands in direkter Beziehung zu einem anderen (wobei zwei Elemente benötigt werden); und drittens das "endgültige" Konzept der drei Gegenstände in Beziehung zueinander (wobei drei Elemente benötigt werden) festgelegt. Diese drei Kategorien können dann als Erkenntnismomente angesehen werden, wobei man zunächst den Gegenstand der Erkenntnis isoliert wahrnimmt (als Festlegung gegenüber irgendeinem anderen Gegenstand (einer "zweiten Größe"), wobei eine erste Größe dann in Beziehung zu einem zweiten Konzept steht), wie dies dann durch ein anderes Zeichen oder eine andere Zwischengröße ausgeglichen wird (eine "dritte Größe"). Es werden die Indices i, d und f für dazwischen, dynamisch bzw. endgültig verwendet.
  • Zum Zweck der Unterscheidung zwischen den Dimensionen werden nachstehend römische Ziffern I bis X verwendet. Die Verwendung der römischen Ziffern soll jedoch keine Hierarchie bedeuten. Damit die Abmessungen eine bessere Beschreibung erfahren, verwenden wir einige der häufig schwierigen Terme von Peirce für die zusammenstellbaren Zeichenelemente, jedoch wird darauf hingewiesen, dass die Terme für die Zeichenelemente erläuternd sind, und nicht deren Auswirkung einschränken sollen. Jedes Zeichenelement kann als Gegenwert für die Dimension angesehen werden, welche es zugeordnet ist. Die Kategorien "zuerst", "zweitens" und "drittens" können durch die gesamte Erfindung hindurch verstanden werden. Wenn Beispiele gegeben werden, sollte dies entsprechend nicht so verstanden werden, dass das Beispiel einschränkend verstanden sein soll, bei welchem kein anderes Zeichenelement einsetzbar ist, sondern so, dass es in starker Beziehung zu der speziellen Vorgehensweise steht, die geschildert wird. Es wird darauf hingewiesen, dass der Einsatz eines Zeichenelements nicht andere innerhalb derselben Dimension ausschließt. Wenn man dies berücksichtigt, sind die Dimensionen folgendermaßen:
    • I. R-O Index i: Der Repräsentame in Bezug auf das unmittelbare Objekt, also das Objekt, wie es nur in der Information des Zeichens vorhanden ist. Dies ist tatsächlich die einzige Art und Weise, auf welche ein Computer das Objekt "kennt". Bei dieser Dimension gibt es drei Zeichenelemente: beschreibend, benennend, distributiv. Beispiele für Zeichenelemente in dieser Dimension sind (1) ein Beschreibungselement des Objekts: beispielsweise "blau", (2) ein Name des Objekts, der ihn von einem oder mehreren Objekten unterscheidet, beispielsweise "Blue Boy" (das Gemälde von Gainsborough), (3) eine verteilte Eigenschaft, eine Regel oder regelartige Beziehung (oder "Copulant" in der Terminologie von Peirce) eine Klasse von Objekten, beispielsweise der Aspekt der "Bläue", oder das Gleichheitszeichen ("=") oder das Folgezeichen (">") in ihrer Rolle als universelle Copulantien.
    • II. R-O Index d: Der Repräsentamen in Bezug auf das dynamische Objekt, also das Objekt in seiner Beziehung zu der Welt. In dieser Dimension haben wir die berühmten Icon-Index-Symbolzeichenelemente von Peirce. Wenn die Beziehung des Zeichenelements zu seinem dynamischen Objekt ikonisch ist, repräsentiert das Zeichenelement das Objekt durch Gleichheit oder Ähnlichkeit, beispielsweise dadurch, dass Blue Boy als Porträt des Modells angesehen wird. Wenn die Beziehung des Zeichens zu seinem dynamischen Objekt indexikalisch ist, wird das Objekt unter Bezugnahme auf gewisse Zusatz-Information repräsentiert, beispielsweise die Gesichtsfarbe des Gesichts von Blue Boy, betrachtet von einem Arzt als Symptom für einen Ernährungsmangel. Wenn die Beziehung von dem Zeichen zu seinem dynamischen Objekt symbolisch ist, repräsentiert das Zeichen das Objekt durch eine Vereinbarung oder normale Zuordnung, wobei beispielsweise das englische Wort "boy" ein Symbol ist, das aus den Buchstaben b, o, y besteht.
    • III. R-O Index f: Der Repräsentamen in Bezug auf die Art und Weise, das Objekt darzustellen, also das Objekt, sobald man ihm ein bestimmtes Konzept zugeordnet hat, also das "endgültige" Objekt, im Gegensatz zu dem "dynamischen" oder "unmittelbaren" Objekt. In dieser Dimension kann das Objekt zusammengesetzt abstraktiv, konkret oder kollektiv sein. Das Objekt lässt sich insoweit abstrahieren, als das Zeichen es als isoliert repräsentiert, beispielsweise "Atom". Dies bezieht sich auf die etymologische Bedeutung ein Element unter Ausschluss von anderen "herauszuziehen". Das Objekt ist insoweit konkret, als das Zeichen es so repräsentiert, dass es aus Beziehungen besteht, beispielsweise "Molekül". Dies betrifft die etymologische Bedeutung des "Zusammenwachsens" eines Elements mit einem anderen. Das Objekt ist insoweit kollektiv, als das Zeichen es als eine Zusammenschau oder Gruppierung repräsentiert, beispielsweise "Materie". Dies betrifft die etymologische Bedeutung einer Sammlung wie beispielsweise "miteinander verbinden".
  • Dimensionen entlang dem Continuum zwischen Repräsentamen und Interpretanten, R-I, werden unter Verwendung der unmittelbar dynamischen endgültigen Momente der Analyse eingestellt. Allerdings gibt es hier eine weitere Aufteilung auf zwei Schritte, abhängig davon, ob der Interpretant als eine Ereignisgröße oder eine Fortsetzung betrachtet wird, also als ein diskreter Effekt oder als Aufnahme eines Aktivitätsstroms (hier manchmal als ein "Prozess" bezeichnet). Hierbei wird I' für den Interpretanten und I'' für den Interpretanten als Fortsetzung verwendet, und werden erneut die Indices i, d und f für unmittelbar, dynamisch und endgültig verwendet.
    • IV. I-R' Index i: Der Repräsentamen in Bezug auf seinen unmittelbar auftretenden Interpretanten, also den Interpretanten bei dessen ersten Auftauchen der Bedeutung. Bei dieser Dimension kann der Interpretant in der Terminologie von Peirce hypothetisch, kategorisch oder relativ sein, abhängig davon, ob es sich im Zusammenhang mit einem Kontext um "könnte möglicherweise sein" handelt, um "ist" oder "ist ein Zeichen von".
    • V. R-I' Index d: Der Repräsentamen in Bezug auf seinen dynamischen Ereignisgrößen-Interpretanten, also den Interpretanten, wenn dieser andere Zeichen bewirkt oder erzeugt. In dieser Dimension kann der Interpretant sympathetisch, perkussiv/schockierend, normal/gewöhnlich sein.
    • VI. R-I' Index f: Was der Repräsentamen bedeuten könnte, wenn er bei seinem endgültigen Umfang oder Umkreis oder Einfluss eingesetzt wird. Bei einem ersten Gegenwert in dieser Dimension kann der endgültige Interpretant der Ereignisgröße ein reines Bedeutungselement oder Term sein, oder allgemeiner ein "Seme" in der aus dem Griechischen abgeleiteten Terminologie von Peirce, beispielsweise "Theorie" bei seinem reinsten Bedeutungsinhalt. Bei einem zweiten Gegenwert kann der endgültige Interpretant der Ereignisgröße eine Aussage sein, oder allgemeiner ein "Pheme", aus dem Griechischen zum Bestätigen oder Sicherstellen, beispielsweise die "Relativitätstheorie" in ihrer Aussagekraft. Bei einem dritten Gegen wert kann der endgültige Interpretant der Ereignisgröße ein Argument sein, oder allgemein ein "Delome" auf Grundlage des griechischen Begriffs zum Bekanntgeben, Zeigen oder Erläutern, beispielsweise "E = mc2" mit seinem Bedeutungsinhalt.
    • VII. R-I'' Index i: Der Repräsentamen in Bezug auf den Strom der Aktivität oder den Prozess seines unmittelbaren Interpretanten, also wenn er Bestätigung von der Aktivität der Interpretation empfangt. In dieser Dimension kann der Interpretant instinktiv, experimentell oder formal sein.
    • VIII. R-I'' Index d: Der Repräsentamen in Bezug auf den Prozess seines dynamischen Interpretanten, also wie er bei einer momentanen Aktivitäts-Interpretation auftritt oder Teil von dieser wird. In dieser Dimension kann der Interpretant suggestiv, imperativ/interrogativ oder indikativ sein.
    • IV. R-I'' Index f: Der Repräsentamen in Bezug auf seinen endgültigen Zweck, also angesichts der Tatsache, wohin er führt. In dieser Dimension kann die Mode des Interpretanten belohnend (zur Emotion hinführend) sein, energetisch (zu einer Aktion hinführend), logisch (zu einem Verständnis und in Bezug auf eine Selbstkontrolle hinführend) sein.
    • X. Schließlich können wir das Zeichen an sich überlegen, ohne Bezugnahme auf seine Beziehung zu einem Objekt oder Interpretanten. In dieser Dimension umfassen relevante Zeichenelemente einen Ton-Token-Typ, oder allgemeiner bei den Neologismen von Peirce Qualisigns, Sinsigns oder Legisigns. Der Ton ist die Mode der Intensität des Zeichens. Der Token ist die Mode von dessen Besonderheit. Der Typ ist die Mode seiner Allgemeinheit. Es wird darauf hingewiesen, dass "Ton" weiter differenziert werden kann, unter Verwendung anderer Zeichenelemente des Interpretanten in anderen Dimensionen, beispielsweise sympathisch-perkussorisch-üblich aus Dimension V, instinktiv aus dem Gegenwert I der Dimension VII, suggestiv aus dem Gegenwert I der Dimension VIII, emotional aus dem Gegenwert 1 der Dimension IX).
  • Zusammenfassend sind die zehn Dimensionen nachstehend aufgelistet, zusammen mit drei Zeichenelementen in jeder Dimension. Die Zeichenelemente sind nachstehend mit einem entsprechenden Bezugszeichen (1, 2 oder 3) angegeben, das hier als die Gegenwertzahl bezeichnet wird.
    Dimension I. R-O Index i (1) beschreibend, (2) benennend und (3) distributiv;
    Dimension II. R-O Index d: (1) Icon, (2) Index und (3) Symbol;
    Dimension III. R-O Index f: (1) abstrakt, (2) konkret und (3) kollektiv;
    Dimension IV. R-I' Index i: (1) hypothetisch, (2) kategorisch und (3) relativ;
    Dimension V. R-I' Index d: (1) sympathisch, (2) perkussorisch und (3) normal;
    Dimension VI. R-I' Index f: (1) Term, (2) Aussage und (3) Argument;
    Dimension VII. R-I'' Index I: (1) instinktiv, (2) experimentell und (3) formal;
    Dimension VIII. R-I'' Index d: (1) suggestiv, (2) imperativ und (3) indikativ;
    Dimension IX: R-I'' Index f: (1) emotional, (2) energetisch und (3) logisch;
    Dimension X. R-R: (1) Ton, (2) Token und (3) Typ.
  • Nunmehr wird erkannt, dass die Erfindung eine erweiterte Syntaktik aufweist (der Begriff "Syntaktik" soll hierbei die Beziehung zwischen Zeichen ohne Berücksichtigung ihrer Bedeutung oder ihrer Objekte bedeuten). Anders als die herkömmliche Definition von "Syntaktik" ist die Syntaktik gemäß der Erfindung nicht auf Beziehungen in der Dimension X beschränkt, das Zeichen an sich betrachtet, sondern kann auch andere Zeichenelemente in anderen Dimensionen betreffen, beispielsweise distributiv, symbolisch, kollektiv, relativ, normal, delomik/Argument, formal, indikativ und logisch, sowie Zeichenelementen in anderen Gegenwerten aus selektiven Dimensionen, wobei beispielsweise Icons aus Dimension II eine syntaktische Relevanz in Bezug auf jede Diskussion einer Betrachtung in Form eines Diagramms haben können.
  • Jedes Zeichenelement kann auf kleinere Unterelemente aufgelöst werden. Wenn man das Zeichenelement "Icon" als ein Beispiel nimmt, kann man daher ein indexikalisches Icon von einem symbolischen Icon unterscheiden. Ohne Bezeichnungen an den granulären Verfeinerungen anzubringen, wird die Granularität in dem "kollektiven" Zeichenelement der Dimension "Of" in 2 als "1.", "2." Und "3." Dargestellt. Jeder numerische Index kann weiter zu Gegenwerten verfeinert werden, die in 2 als "a.", "b." und "c." dargestellt sind. Wie aus 2 hervorgeht, kann dieser Prozess der Verfeinerung weitergehen (also "i", "ii" und "iii"), und kann dazu verwendet werden, Zeichenelemente und Unterelemente in einer oder mehreren der Dimensionen zu verfeinern. Es sollte nunmehr deutlich geworden sein, dass das Reichtum einer Dimension direkt proportional zur Anzahl an Zeichenelementen und Unterelementen in der Dimension ist.
  • Ein System, das die zehndimensionale Gruppe von Indikatoren aufweist, enthält eine relationale Datenbank für die Datenbank 20 aufweist, die von dem Computer 10 durchsucht werden kann. Die relationale Datenbank ordnet ein Teil von Medien einem oder mehreren Beschreibungselementen zu, die aus einer Liste möglicher Beschreibungselements ausgewählt sind. Wenn beispielsweise die Beschreibungselemente die zehn Dimensionen enthalten, und jede Dimension drei Zeichenelemente aufweist, werden 30 unterschiedliche Beschreibungselemente benötigt, ein Beschreibungselement für jedes mögliche Paar aus Dimension/Zeichenelement. Beispielweise kann ein Teil von Medien ein Wort oder eine Gruppe von Wörtern enthalten, die zum Zuordnen von einem oder mehreren Beschreibungselementen identifiziert werden. Die identifizierten Wörter in dem Teil des Mediums werden dann einem Vektor mit 32 Bit zugeordnet. Die Bits entsprechend den Beschreibungselementen, welche den identifizierten Wörtern zugeordnet werden sollen, werden beispielsweise dadurch eingeschaltet, dass das Bit von einer Null auf eine Eins geändert wird. Wenn dann eine Suchanfrage formuliert wird, so dass die identifizierten Wörter in der Suchabfrage zusammen mit Bedeutungselementen entsprechend den eingeschalteten Bits auftauchen, wird ein erhöhtes Gewicht den Teilen der Medien zugeordnet, um sie als besonders wesentlich in Bezug auf die Abfrage zu identifizieren.
  • Bei dem voranstehend geschilderten Beispiel reserviert jeder Vektor 30 Bits, eins für jedes mögliche Beschreibungselement, so dass zwei Bits für andere Zwecke verbleiben. Die übrigen zwei Bits können als Wildcards zum Angeben von Information in Bezug die identifizierten Wörter verwendet werden, die nicht von den 30 möglichen Beschreibungselementen zur Verfügung gestellt wird. Beispielsweise können die beiden verbleibenden Bits als Trigger verwendet werden, für eine stärkere Verfeinerung in einer vorgegebenen Information.
  • Die semiotischen Dimensionen mit ihren Zeichenelementen und Gegenwerten sind unabhängig von der Art der Medien, der Sprache und dem Inhalt der Medien. Daher können die semiotischen Dimensionen über heterogenen Formaten und Bereichen eingesetzt werden.
  • Als Beispiel dafür, wie die Erfindung für formatierten Text implementiert werden kann, können Standard-HTML- und -XML-Tags als Beschreibungselemente verwendet werden, um Information über ein Textdokument zur Verfügung zu stellen. HTML-Tags für kursiv, Fettdruck, zentriert, Unterstreichen, und Titel, können beispielsweise als "Ton" in der Dimension X abgebildet werden, dadurch, dass sie Emphase oder Intensität zeigen, und dazu verwendet werden, Standard-Gewichtungsverfahren von Suchmaschinen zu bereichern. Es wird angenommen, dass ein derartiger Einsatz der Erfindung unter Verwendung von HTML-Tags, beispielsweise ergänzt durch die Wortposition, eine wesentliche Verbesserung beim ordnungsgemäßen Identifizieren von Dokumenten erreicht.
  • Entsprechend können HTML-Tags für Bild- oder Grafik-Einschübe semiotisch als ein "Icon" in de Dimension II identifiziert werden. HTML-Hypertext-Zeiger können semiotisch sowohl als "Index" in der Dimension II als auch "energetisch" in der Dimension IX identifiziert werden. XML-Wildcards können semiotisch in Bezug auf den "Typ" in der Dimension X und als "distributiv" in der Dimension I identifiziert werden. In der Dimension X würde ein Eingangs-Verfassungsvermögen, das als Ton, Token (Standardlösung) und Typ identifiziert wird, selbstverständlich ein größeres Gewicht aufweisen, falls es in einer Suchabfrage angegeben wird, im Vergleich zu der gleichen Eingabe ohne eine derartige Identifizierung. Wenn Zeichensetzung und die englische Orthographie als eine Auszeichnungssprache betrachtet werden, ist ein weiter automatisiertes Parsing und Abbilden in das zehndimensionale System möglich, unter Verwendung orthographischer Elemente als Trigger zur automatischen Zuordnung semiotischer Indikatoren. Selbstverständlich müssen nicht sämtliche Daten in einem Teil von Medien einem Beschreibungselement zugeordnet werden, und müssen nicht sämtliche semiotischen Dimensionen aktiviert werden. Es wird darauf hingewiesen, dass diese beispielsweise im wesentlichen textorientiert sind, wobei die gleichen Grundlagen des Einsatzes anderen Medien und über diese Medien hinaus betreffen.
  • Die Erfindung vergleichmäßigt nicht nur Information in Bezug auf Medien, sondern kann zusammen mit weiterentwickelten und ökonomischen Lern- und Datenerfassungs-Algorithmen verwendet werden, logischen Operationen, Mustererkennung, und anderer Verwaltung, um zu ermöglichen, dass bei einer Suche mehr Information herausgefunden wird. Wenn man beispielsweise berücksichtigt, wie Sprache normalerweise kombiniert wird, um eine Idee auszudrücken, können allgemeine Regeln unterschieden werden. Beispielsweise können sich derartige Regeln auf Grundlage der Tatsache ergeben, wie Wörter logisch vereinigt oder grammatikalisch kombiniert werden, oder es können sich derartige Regeln auf die Möglichkeit konzentrieren, dass eine bestimmte Idee einem Abschnitt eines speziellen Mediums zugeordnet ist, abhängig davon, welches Beschreibungselement "eingeschaltet" ist.
  • Die Erfindung kann sich auf dem sich entwickelnden Gebiet der Ontologie-Konstruktion implementiert werden, welche eine Schlussfolgerung dadurch ermöglicht, dass eine Typen-Hierarchie zur Verfügung gestellt wird, die durch Vererbungsbeziehungen von Termen oberer Niveaus zu unteren Niveaus gekennzeichnet ist. Diese Vererbungsbeziehungen sind variabel, und reichen von den weiteren und engeren Termen eines Thesaurus zu gitterartigen Mehrfachvererbungs-Beziehungen, bei Artifakten, welche Logik erster Ordnung implementieren, und als teilweise geordnete Gruppen konstruiert sind. Die am weitesten entwickelten Ontologien sind typischerweise auf Gesamtteil- und Klassenteil-Beziehungen begrenzt. Die Erfindung stellt eine Vorgehensweise zur Verfügung, durch welche eine Ontologie angereichert werden kann, so dass eine Differenzierung unter den Hierarchien stattfindet, unter Verwendung beispielsweise der Dimensionen III, VI und IX, um verschiedene Variationen der Implikation und des Erfordernisses und der Objekte zu unterscheiden, welche sie betreffen. Unter Verwendung dieser drei Dimensionen kann eine Matrix mit neun Zellen für sämtliche Ontologien eingesetzt werden:
    D-III D-VI D-IX
    abstrakt Term emotional
    konkret Aussage energetisch
    kollektiv Argument logisch
  • Vernachlässigt man den "emotionalen" Interpretanten (das Element des ersten Gegenwerts in der Dimension IX), der normalerweise verwendet würde, und behandelt man die Dimension VI als den Relationsverbinder zwischen dem endgültigen Objekt in der Dimension III und dem endgültigen Interpretanten in der Dimension IX, so haben wir bereits 2×3×3 Kombinationen über den drei Dimensionen. Wir können dann verschiedene Regeln ausbilden, um weitere Abhängigkeiten zu schaffen, durch Be trachten von Einschlussbeziehungen und Verfassungsvermögen in der Dimension III zwischen kollektiven Größen, einerseits, und abstrakten und konkreten Größen andererseits. Eine Vorgehensweise, um dies durchzuführen, kann den Einsatz von Unterelementen eines oder mehrerer der Zeichenelemente in der Dimension VI umfassen.
  • Die Erfindung erleichtert das Erlangen von Erkenntnis und von Abhängigkeiten dadurch, dass sie Operationen des entsprechenden Typs in einer komplexen und heterogenen Datenbank ermöglicht. Wenn beispielsweise der endgültige Fortsetzungs-Interpretant in der Dimension IX "energetisch" ist (was zu einer Aktion führt), würde sich die Art der sich ergebenden Beziehung von einem "logischen" Interpretanten unterscheiden. Beispielsweise umfasst "Herstellung eines Omeletts" das "Aufschlagen eines Eis" auf solche Weise, die sich von jener unterscheidet, bei welcher das Lebensmittel "Ei" den Begriff "Omelett" als engeren Begriff umfasst, oder wobei "Ei" den Begriff "Huhn" umfasst, oder umgekehrt. Die Erfindung ermöglicht die Trennung und Vergleichmäßigung differenzierter Beziehungen, und ermöglicht eine ökonomische Manipulation dieser Beziehungen. Daher würden "Herstellung eines Omeletts" und "Aufschlagen von Eiern" geparst mit Indikatoren "ein" unter dem Dimensions-IX-Gegenwert 2 (energetisch), unter dem Dimensions-III-Gegenwert 2 (konkret), und unter dem Dimensions-VI-Gegenwert 3 (Argument). Im Gegensatz würde "Omelett" als ein "Eiergericht" sich in denselben Dimensionen unter dem Dimensions-IX-Gegenwert 3 (logisch) auffinden lassen, unter dem Dimensions-III-Gegenwert 2 (konkret) und unter dem Dimensions-VI-Gegenwert 1 (Term). Ohne eine derartige Fähigkeit, Ontologien zu differenzieren, würden Anomalien einer nicht-transistiven Eigenschaft hervorgerufen, welche Artifakte beeinträchtigen, die unterschiedliche Arten von Zeichen mi schen, und versuchen, bei ihnen logische Operationen durchzuführen. Die Erfindung unterteilt systematisch den globalen Informationsraum, der sowohl auf einzelne Zeichen und auf Beziehungen unter diesen anwendbar ist, wobei die Beziehungen ebenfalls einer Untersuchung als Zeichen-Interpretanten unterworfen werden können.
  • Es wird darauf hingewiesen, dass das zehndimensionale System, das hier beschrieben wird, nicht selbst eine Ontologie oder eine Zeichen-Hierarchie ist. Obwohl die Zeichenelemente Typen in der Bedeutung der Dimension X sind, und in ihrer Erscheinungsform als Bits auch Token darstellen, bedeutet ihre Verfassungsvermögenseigenschaft, dass keine erforderliche hierarchische Beziehung zwischen Zeichenelementen derselben Dimension vorhanden ist. Es können jedoch Theoreme vorhanden sein, um die Muster zu begrenzen, in denen sie gleichzeitig auftreten können, wie dies nachstehend genauer erläutert wird.
  • Die Erfindung kann dazu eingesetzt werden, Agentenprotokolle zu erleichtern. Ein Berechnungsagent stellt ein autonomes, zusammenarbeitendes, intelligentes, durch ein Protokoll definiertes Datensystem dar, das sowohl in Reaktion auf automatisch wahrgenommene Signale als auch direkte Signale von einem Benutzer arbeiten kann. Der Agent führt eine Wechselwirkung mit den relevanten Datenfeldern durch, mit anderen Agenten, und mit seinem Benutzer. Das Protokollsystem des Agenten kann Parsing- und Abbildungsmaschinen umfassen, Maschinenlern-Algorithmen, und Fähigkeiten in Bezug auf die Suche, das Zurückgewinnen, das Schließen, Mustererkennung und die Wissenserkennung. Die Anwendung, die spezifisch für Agenten ist, kann sich auf den vollen Bereich von Interpretanten-Dimensionen der Erfindung (Dimension IV bis Dimension IX) konzentrie ren. Es wird darauf hingewiesen, dass der "Interpretant" als die Auswirkung des Zeichens auf einen Verstand oder einen quasi-Verstand definiert ist. Da der Agent ein quasi-Verstand ist, sind die Interpretanten des Agenten die Signale, auf welche er reagiert, und an welche er sich anpasst. Beispielsweise können für die drei Dimensionen VII bis IX, welche eine Beziehung der Repräsentamen zu dem Fortsetzungs-Interpretanten (R-I'') in dessen unmittelbarer, dynamischer und endgültiger Form angeben, die folgende Matrix eingesetzt werden:
    VII VIII IX
    instinktiv suggestiv emotional
    experimentell imperativ energetisch
    formal anzeigend logisch
  • Elemente der Dimension VII, wenn sie in Agentenkommunikations-Protokollen verwirklicht sind, nehmen Moden des Lernens des Agentens in Reaktion auf ein Signal auf, und stellen diese zur Verfügung. Ein Signal von außen, dessen unmittelbarer Interpretant "instinktiv" ist, wird akzeptiert oder zurückgewiesen, entsprechend festen Agenten-Verhaltensformen. Ein Interpretant "experimentell" wird in ein fallbasierendes Lernen eingebaut. Ein Interpretant "formal" wird in ein regelbasierendes Lernen eingebaut. Das Ausmaß, in welchem diese Dimensionen geteilt, unterteilt und weiter unterteilt sind, ermöglicht es einem Lern-Continuum, die adaptiven Fähigkeiten des Agenten wiederzugeben, um seine Kenntnis und sein Verhalten zu modifizieren, in Reaktion auf seine Umgebung, andere Agenten und eine Benutzereingabe.
  • Elemente der Dimension VIII, wenn sie in einem Agenten-Kommunikationsprotokoll verwirklicht sind, nehmen Moden der Agenten-Akzeptant eines Signals auf und sorgen hierfür. Ein "sug gestives" Signal betrifft mögliche Verhaltensweisen ohne spezielle Eigenschaften. Ein "imperatives/abfragendes" Signal stellt einen Befehl an den Agenten zur Verfügung, der auch in Form eine Abfrage vorhanden sein kann. Ein "anzeigendes" Signal stellt Information zur Verfügung, die berücksichtigt werden muss. Weiterhin ermöglichen feinere Teilungen, Unterteilungen und weitere Unterteilungen es diesen Moden, dass sie zu einem Continuum übergehen.
  • Elemente der Dimension IX, wenn sie in Agenten-Kommunikationsprotokollen verwirklicht sind, nehmen Moden der Agentenorientierung auf und stellen diese zur Verfügung, was zu einem Gefühl im Falle des "emotionalen" Interpretanten führen kann (für einen Berechnungs-Agenten kann ein "Gefühl" verstanden werden als ein Wert außerhalb des normalen ökonomischen Wertebereichs), zu einer Aktion in Bezug auf den "energetischen" Interpretanten, und zum Verständnis des "logischen" Interpretanten.
  • Ein weiteres Beispiel dafür, wie die Erfindung implementiert werden kann, stellt eine Testvorrichtung für ein semiotisches Theorem dar. Da die Zeichenelementen-Theorie von Peirce allgemein in den 1950er Jahren verfügbar wurde, über unvollständige und teilweise nicht-konsistente Versionen, ergab sich eine zunehmende Arbeit, diese zu entwickeln und zu verfeinern, um formale Beweise der ihr zugrunde liegenden Mathematik zur Verfügung zu stellen, und sie in Berechnungen auf dem Gebiet der Computer umzusetzen. Was fehlte, war ein für diesen Zweck ausgelegter Prüfstand. Das zehndimensionale System gemäß der Erfindung stellt einen derartigen Prüfstand zur Verfügung. Es eröffnet ein neues Gebiet der Algebra, welches formal die Beziehungen und möglichen Berechnungsoperationen bei Zeichenelementen festlegt. Eine spezielle Konzen tration einer derartigen Algebra besteht darin, Theorien in Bezug auf die Zeichenvalenzen in Bezug auf das Anziehen oder Abstoßen bestimmter Kombinationen von Zeichenelementen zu untersuchen, sowohl theoretisch als auch empirisch.
  • Auf dem theoretischen Niveau gab es einige Arbeiten, die anzeigten, dass die tatsächliche Anzahl stabiler Dimensions-Zeichenkombinationen – im Prinzip 3 hoch 10 oder 59948 Kombinationen – auf unter 100 begrenzt werden kann, wobei 66 die am häufigsten zitierte Anzahl ist. Vergleiche Gary Sanders, "Peirce's Sixty-six Signs?", Transactions of the Charles S. Peirce Society, Band VI, Nr. 1, Seiten 3–16. Wie derartige Hypothesen dieser Art bewiesen werden können, stellt selbst eine Überlegung dar, da die Zeichenelemente un-mathematisch sind. Sobald die Beziehung zwischen einem Zeichenelement und seiner Berechnungsausführungsform eingerichtet ist, dient die entsprechende Algebra als Labor zur Untersuchung von Zeichen und semiotischen Kombinationen in weiterer Allgemeinheit. Vergleiche Robert Marty, L'Algebre des signes, Amsterdam, 1990, für Theoreme, bei welchen die Erfindung eingesetzt werden kann, um sie zu testen.
  • Auf empirischer Grundlage können Daten, die durch einige oder sämtliche der Dimensionen angereichert sind, als ein Prüfstand verwendet werden, um Algorithmen zur Verfügung zu stellen, welche die Exaktheit und das Zurückrufen zurückgerufener Information verbessern. Derartige Daten können auch für Regeln und Wahrscheinlichkeitsbeziehungen angefasst werden, die wiederum modular addiert werden können. Beispielsweise kann eine Algebra eine formal definierte und empirisch untersuchbare Ontologie-Rechenmethode zur Verfügung stellen, welche die verschiedenen Arten von Vererbung unterscheidet, welche unterschiedliche Bezugs-Ontologien charakterisiert, Regeln zu deren wirksamer Speicherung hervorrufen, Konfusion zwischen diesen vermeiden, und eine transitive Schlussfolgerung von Artefakten des oberen Niveaus zu Bereichs-Ontologien kompatibler Zeichenelemente ermöglichen kann. Auf dem globalen, theoretischen Niveau wird eine derartige Algebra zu einem Prüfstand für Theoreme in Bezug auf das zehndimensionale System selbst. Es wurde beispielsweise behauptet, dass bestimmte Dimensionen anderen untergeordnet sein können, um die Anzahl zu berücksichtigender, aktiver Elemente zu verringern, oder dass alternativ Kombinationen, welche sich ausschließende Gegenwerte enthalten, instabil oder unmöglich sind. Die Erfindung ermöglicht Experimente, um diese Hypothesen zu testen.
  • Die vorliegende Erfindung wurde in Bezug auf bestimmte Ausführungsformen beschrieben. Die vorliegende Erfindung ist nur durch die beigefügten Patentansprüche eingeschränkt.

Claims (15)

  1. Semiotisches Analysesystem, bei welchem vorgesehen sind: ein Computer (10), welcher Software aufweist, welche den Computer (10) zur Annahme einer Abfrage veranlassen kann, und zum Durchsuchen einer Datenbank (20) nach Einträgen in der Datenbank in Bezug auf die Abfrage, wobei die Abfrage zumindest einem Bedeutungselement zugeordnet ist, welches eine semiotische Eigenschaft der Abfrage identifiziert; und eine Datenbank (20) in Verbindung mit dem Computer (10), wobei die Datenbank (20) einen Eintrag aufweist, der einem Teil eines Mediums entspricht, bei welchem ein Abschnitt des Teils des Mediums zumindest einem Beschreibungselement zugeordnet ist, das eine semiotische Eigenschaft des Abschnitts identifiziert, wobei die semiotische Eigenschaft ein Teil einer Gruppe semiotischer Eigenschaften ist, die eine vorbestimmte Anzahl zwischen zwei und zehn unterschiedlichen Dimensionen semiotischer Beziehungen umfassen, bei welchen jede Dimension auf eine vorbestimmte Anzahl von zumindest drei Arten von Zeichenelementen unterteilt ist, von denen jede weiter unterteilt werden kann, und bei welchen jede semiotische Eigenschaft unabhängig von dem thematischen Inhalt ist, der durch Zeichen angegeben wird, und wobei die Software die semiotische Ähnlichkeit zwischen der Abfrage und dem Anteil bestimmen kann, auf Grundlage von zumindest einer semiotischen Eigenschaft, welche der Abfrage zugeordnet ist; und zumindest einer semiotischen Eigenschaft, die dem Anteil zugeordnet ist.
  2. System nach Anspruch 1, bei welchem die Dimension eine Beziehung zwischen einem Repräsentamen in dem Anteil und einem unmittelbaren Objekt in dem Anteil ist, wobei vorzugsweise die Dimension beschreibende, benennende und distributive Elemente aufweist.
  3. System nach Anspruch 1, bei welchem die Dimension eine Beziehung zwischen einem Repräsentamen in dem Anteil und einem dynamischen Objekt in dem Anteil ist, wobei vorzugsweise die Dimension ikonische, indexikalische und symbolische Elemente enthält.
  4. System nach Anspruch 1, bei welchem die Dimension eine Beziehung zwischen einem Repräsentamen in dem Anteil und einer endgültigen Mode ist, welche ein Ziel in dem Anteil darstellt, vorzugsweise dann, wenn die Dimension abstrahierende, konkretisierende und kollektive Elemente aufweist.
  5. System nach Anspruch 1, bei welchem die Dimension eine Beziehung zwischen einem Repräsentamen in dem Anteil und einer unmittelbaren Ereignisgröße ist, welche den Anteil interpretiert, vorzugsweise dann, wenn die Dimension hypothetische, kategorische und relative Elemente enthält.
  6. System nach Anspruch 1, bei welchem die Dimension eine Beziehung zwischen einem Repräsentamen in dem Anteil und einer dynam8ischen Ereignisgröße ist, welche interpretierend in dem Anteil vorhanden ist, vorzugsweise dann, wenn die Dimension sympathische, perkussorische und übliche Elemente aufweist.
  7. System nach Anspruch 1, bei welchem die Dimension eine Beziehung zwischen einem Repräsentamen in dem Anteil und einer endgültigen Ereignisgröße ist, welche interpretierend in dem Anteil vorhanden ist, vorzugsweise dann, wenn die Dimension Term-, Aussagen- und Argumentelemente enthält.
  8. System nach Anspruch 1, bei welchem die Dimension eine Beziehung zwischen einem Repräsentamen und einem unmittelbaren Fortsetzungselement ist, welches interpretiert, vorzugsweise wenn die Dimension instinktive, experimentelle und formale Elemente aufweist.
  9. System nach Anspruch 1, bei welchem die Dimension eine Beziehung zwischen einem Repräsentamen in dem Anteil und einem dynamischen Fortsetzungselement ist, welches interpretiert, vorzugsweise wenn die Dimension suggestive, imperative und indikative Elemente enthält.
  10. System nach Anspruch 1, bei welchem die Dimension eine Beziehung zwischen einem Repräsentamen in dem Anteil und einem endgültigen Fortsetzungselement ist, welches das Repräsentamen interpretiert, vorzugsweise dann, wenn die Dimension emotionale, energetische und logische Elemente aufweist.
  11. System nach Anspruch 1, bei welchem die Dimension eine Beziehung eines Repräsentamens, das von seinen Beziehungen zu Objekten getrennt ist, und Interpretanten ist, vorzugsweise dann, wenn die Dimension Ton-, Token- und Typelemente umfasst.
  12. System nach einem der Ansprüche 1 bis 11, bei welchem das Beschreibungselement einer Gewichtung zugeordnet ist, um ein gewichtetes Beschreibungselement zur Verfügung zu stel len, wobei die Gewichtung der Fähigkeit eines Beschreibungselements entspricht, den Inhalt des Teils von Medien anzuzeigen, vorzugsweise dann, wenn die Gewichtung dazu verwendet wird, eine Anzeige der Relevanz des Teils der Medien zur Verfügung zu stellen.
  13. System nach einem der Ansprüche 1 bis 12, bei welchem die Abfrage ein Bedeutungselement aufweist, und die Software den Computer dazu veranlassen kann, die Datenbank nach Beschreibungselementen entsprechend dem Bedeutungselement zu untersuchen, vorzugsweise wenn das Bedeutungselement einer Gewichtung zugeordnet ist, um ein gewichtetes Bedeutungselement zur Verfügung zu stellen, wobei die Gewichtung der Fähigkeit des Bedeutungselements entspricht, den Inhalt der Abfrage anzuzeigen, und besonders bevorzugt dann, wenn die Gewichtung dazu verwendet wird, eine Anzeige der Relevanz des Teils der Medien zur Verfügung zu stellen, die durch die Suche identifiziert werden.
  14. System nach einem der Ansprüche 1 bis 13, bei welchem die Dimension ausgewählt wird aus einer Gruppe, die aus unmittelbar, dynamisch und endgültig besteht.
  15. System nach einem der Ansprüche 1 bis 14, bei welchem zumindest eines der Elemente drei Unterelemente aufweist.
DE60223517T 2002-07-01 2002-07-01 Semiotisches Analysesystem, computerlesbares Speichermedium und Verfahren Expired - Lifetime DE60223517T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP02013159A EP1378839B1 (de) 2002-07-01 2002-07-01 Semiotisches Analysesystem, computerlesbares Speichermedium und Verfahren

Publications (2)

Publication Number Publication Date
DE60223517D1 DE60223517D1 (de) 2007-12-27
DE60223517T2 true DE60223517T2 (de) 2008-09-11

Family

ID=29719679

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60223517T Expired - Lifetime DE60223517T2 (de) 2002-07-01 2002-07-01 Semiotisches Analysesystem, computerlesbares Speichermedium und Verfahren

Country Status (3)

Country Link
EP (1) EP1378839B1 (de)
AT (1) ATE378640T1 (de)
DE (1) DE60223517T2 (de)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2404337A1 (en) * 2000-03-27 2001-10-04 Documentum, Inc. Method and apparatus for generating metadata for a document

Also Published As

Publication number Publication date
EP1378839B1 (de) 2007-11-14
ATE378640T1 (de) 2007-11-15
DE60223517D1 (de) 2007-12-27
EP1378839A1 (de) 2004-01-07

Similar Documents

Publication Publication Date Title
DE19960043B4 (de) Verfahren zum Navigieren in einer Baumstruktur
DE602004003361T2 (de) System und verfahren zur erzeugung von verfeinerungskategorien für eine gruppe von suchergebnissen
Griffin et al. Some observations on formal methods of qualitative analysis
Merceron et al. Tada-ed for educational data mining
DE69333854T2 (de) Automatisches Aufrufen von Rechnermitteln ohne Bedienereingriff
DE60215777T2 (de) Kontextbasierte informationsrecherche
DE69432575T2 (de) Dokumentenerkennungssystem mit verbesserter Wirksamkeit der Dokumentenerkennung
DE69834386T2 (de) Textverarbeitungsverfahren und rückholsystem und verfahren
EP1877932B1 (de) System und verfahren zur aggregation und überwachung von dezentralisiert gespeicherten multimediadaten
DE10333530A1 (de) Automatische Indexierung von digitalen Bildarchiven zur inhaltsbasierten, kontextsensitiven Suche
DE112013000987T5 (de) Erzeugen von Visualisierungen einer Anzeigegruppe von Tags, die Inhaltsinstanzen in Suchkriterien erfüllenden Objekten darstellen
DE112005003157T5 (de) Domainspezifisches Datenelement-Mappingverfahren- und System
Yager Fuzzy summaries in database mining
DE60319586T2 (de) Elektronisches wörterbuch mit beispielsätzen
DE202012013725U1 (de) Kontextsensible Suche
DE112017007530T5 (de) Entitätsmodell-erstellung
DE69632835T2 (de) Verfahren zur automatischen verarbeitung von information über benutzerdaten
Sutcliffe et al. 3D or not 3D: Is it nobler in the mind?
US20050086218A1 (en) Systems and methods for determining semiotic similarity between queries and database entries
Ryan et al. The evolution of US state government home pages from 1997 to 2002
DE60223517T2 (de) Semiotisches Analysesystem, computerlesbares Speichermedium und Verfahren
EP1030254B1 (de) Verfahren und System zum Verwalten von Dokumenten
EP1324218A1 (de) Kategorisierungsystem für Datenobjekte und Verfahren zum Prüfen der Konsistenz von Zuordnungen von Datenobjekten zu Kategorien
Ya’acob et al. An analytical reasoning framework for visual analytics representation
Bailey Abstracted versus concrete sociological theory

Legal Events

Date Code Title Description
8364 No opposition during term of opposition