DE60209947T2

DE60209947T2 - System, Verfahren und Software für die Bereitstellung einer gezielten Werbung durch Benutzerprofildatenstruktur basierend auf Benutzerpräferenzen

Info

Publication number: DE60209947T2
Application number: DE60209947T
Authority: DE
Inventors: Isaac San Francisco Bentolila; Yiming Union City Zhou; Labeeb San Francisco Ismail; Richard Freemont Humpleman
Original assignee: Metabyte Networks Inc Fremont; Metabyte Networks Inc
Current assignee: Metabyte Networks Inc Fremont; Metabyte Networks Inc
Priority date: 2001-01-09
Filing date: 2002-01-08
Publication date: 2007-02-22
Anticipated expiration: 2022-01-09
Also published as: DE60209947D1; US20030101449A1; US20030101451A1; ES2261527T3; JP2008236794A; EP1223757A3; JP2003018584A; JP5421469B2; US8495680B2; ATE321422T1; US20150143414A1; EP1223757B1; EP1223757A2; US20120011530A1; US9277264B2; US8046797B2; JP2013078150A; JP5283110B2; US8850465B2

Description

ALLGEMEINER STAND DER TECHNIK
GEBIET DER ERFINDUNG
Die Erfindung betrifft das Gebiet der interaktiven Fernsehprogrammgestaltung. Insbesondere betrifft die Erfindung ein Verfahren und System zum Vorhersagen und Modellieren von TV-Benutzerprofildaten, ein Verfahren und System zu Bestimmen einer Programm- und/oder Werbeprogrammpräferenz, ein Verfahren und System zum gezielten Werben für Fernsehen und interaktives Fernsehen, basierend auf der Profildaten-Vorhersage und -Modellierung und der Präferenzbestimmung, und ein Verfahren und System, mit dem eine vollständige Programmsequenz einem Zuschauer basierend auf der Präferenzbestimmung und gespeicherter Programmgestaltung präsentiert werden kann. Das letztere soll als Erzeugen einer automatischen Programmsequenz (virtueller Kanal) bezeichnet werden, und der virtuelle Kanal soll als ein separater Kanal in dem elektronischen Programmführer (EPG) präsentiert werden.
STAND DER TECHNIK
Systeme und Verfahren für zielgerichtetes Werben im interaktiven Fernsehen sind bekannt. Beispielsweise beschreibt WO 00/04 708 ein Fernsehsystem, das ein vorzuschlagendes Programm basierend auf der Sehaktivität des Zuschauers ermittelt. Die Systeme und Verfahren des Stands der Technik richten Werbung im Allgemeinen durch statistisch erfasste, programmbetriebene Verfahren aus. Die Preisgestaltung der Fernsehwerbung erfolgt entsprechend einer Bewertung eines bestimmten Programms und Zeitfensters. Werbung muss so angeordnet werden, dass sie das angestrebte Zielpublikum erreicht. Je mehr Zuschauer ein bestimmtes Programm erzielt, und je klarer die Zuschauer hinsichtlich der demographischen Information gebündelt sind, desto höher ist der Preis zum Schalten der Werbung. Das bei weitem populärste TV-Bewertungssystem, das gegenwärtig in den USA genutzt wird, ist Nielsen Media Research. Das Nielsen-Bewertungs- und Anteilssystem basiert auf einer nationalen Stichprobe von 5000 Teilnehmern und etwa 50 lokalen Marktproben. Die Information, die der nationalen Stichprobe entnommen wird, basiert auf einer Messung, welches Programm zu einem bestimmten Zeitpunkt in einem bestimmten Fernsehhaushalt von welchen Haushaltsmitgliedern gesehen wird. Die letztgenannte Information wird über so genannte People-Meters (Personenmesser) bestimmt, die in den Stichprobenhaushalten installiert sind, und über die die Zuschauer anzeigen, wann sie zu einer bestimmten Zeit fernsehen, indem sie einen ihnen einzeln zugeordneten Knopf drücken. Die nationale Stichprobe nutzt eher grobe demographische Information, um die Präferenzbewertungen für die Programmbestimmung zu definieren. Die Ergebnisse werden als Wertungen veröffentlicht, die im Verhältnis zu dem statistischen Universum (z.B. allen Fernsehhaushalten, männlich 20 bis 40 Jahre alt usw.) und nach Anteilen definiert werden. Letztere stellen einen Prozentanteil der Universumsmitglieder dar, die ein bestimmtes Programm zum Zeitpunkt seiner Ausstrahlung sehen.
Ein etwas genaueres System, das als der Portable People Meter (tragbare People Meter) bezeichnet wird, wird gegenwärtig auf einem begrenzten lokalen Fernsehmarkt von Arbitron getestet. Der Portable People Meter ist ein elektronisches Sende- und Empfangsgerät von der Größe eines Pagers, das die Fernsehnutzung einer Person über nicht hörbare Codes aufzeichnet, die die Fernsehprogramme überlagern. Am Ende des Tages wird das Sende- und Empfangsgerät auf einer Basisstation angeordnet, von der die aufgezeichnete Information dann an eine zentrale Datenverarbeitungseinrichtung gesendet wird.
Im Zusammenhang mit der Vorhersage und Modellierung von TV-Nutzer-Profildaten benutzen die Verfahren und Systeme des Stands der Technik keine Programmzugangs- und -weggangsfrequenz und Klick-Taktung als Präferenzindikatoren. Präferenzbewertungen im Zusammenhang mit Programmvorhersagen sind auf diese Weise eher rudimentär. Da Systeme des Stands der Technik Übergänge, sequenzielles Programmverhalten, und vorübergehende Programmnutzung nicht in einer allgemein prädiktiven Architektur modellieren, sind sie nicht dazu in der Lage, die Präferenz eines Nutzers anhand von ausgefeilten Inhalts- und Zeitverhältnissen vorherzusagen.
Da nicht festgestellt wird, wann angemessene Anzeichen für die Annahme einer Präferenz vorliegen, neigen bekannte Verfahren dazu, Nutzerpräferenzen falsch vorherzusagen oder zu lang zu warten, bis eine höhere Sicherheit erreicht wird. Bekannte Klassifizierungsverfahren verlangen, dass alle Merkmalsdimensionen einer Stichprobe mit der Beobachtung korreliert werden, und führen dann eine Gaußsche Verteilungsparametrisierung durch, um Gruppenbildungen zu beschreiben. Allerdings ist dies ungenau, da die Daten allgemein keiner normalen Verteilung unterliegen.
Im Zusammenhang mit der Bestimmung der Programm- oder Werbeprogrammpräferenz verfügen die Verfahren des Stands der Technik nicht über eine automatische Nutzereingabe, und also über kein Verfahren zum Feststellen, welche Messwerte die Präferenz eines bestimmten Nutzers am besten vorhersagen. Wenn Präferenzwertungen für eine bestimmte demographische Gruppe vorliegen, sind diese zudem nur stationär gewichtet, und es wird keine dynamische Gewichtungsanpassung durchgeführt.
Im Zusammenhang mit dem zielgerichteten Werben für Fernsehen und interaktives Fernsehen benutzen die Verfahren des Stands der Technik hauptsächlich demographische Information, und nicht kontextabhängige Verhaltensinformation als Teil des Nutzerzielrichtungsprofils. Dies reduziert die Zielrichtungsleistung für nicht demographisch klassifizierbare Nutzergruppen und die demographische Beurteilungsgenauigkeit.
KURZDARSTELLUNG DER ERFINDUNG
Deshalb ist es eine Aufgabe der Erfindung, ein System und Verfahren für eine Verhaltensmodellgruppierung bei der TV-Nutzung und für zielgerichtete Werbung und Präferenzprogrammgestaltung bereitzustellen, das die oben genannten Nachteile der bislang bekannten Vorrichtungen und Verfahren dieses allgemeinen Typs überwindet.
Unter Berücksichtigung dieser und anderer Aufgaben ist, gemäß der Erfindung, ein Fernsehbewertungssystem zur zielgerichteten Programm-Bereitstellung bereitgestellt, das Folgendes umfasst:
eine Gruppierungsmaschine, die Fernseh-Dateneingaben empfängt, die Sehdateneingaben verarbeitet, und Nutzerprofile zur Ausrichtung an Werbekategoriegruppen erzeugt;
ein klientenseitiges System, das dazu angepasst ist, einen Fernsehnutzer in wenigstens eine Werbekategoriegruppe einzuteilen;
ein Kontextverhaltensprofil-Erstellungssystem, das mit dem klientenseitigen System verbunden ist und das Sehverhalten eines Fernsehnutzers mit Inhalts- und nutzungsbezogenen Präferenzen bestimmt; und
eine Verhaltensmodell-Datenbank, die mit dem Profilerstellungssystem verbunden ist, und die darin Information zu dem Sehverhalten des Fernsehnutzers speichert.
Gemäß einem zusätzlichen Merkmal der Erfindung ist die Gruppierungsmaschine ein Softwareagent, der in einem zentralen Computersystem an einem Fernseh-Verteilungskopfende angeordnet ist, und der programmiert ist, um Verhaltensprofilvorlagen zu erzeugen, die zielgerichteten Werbekategorien von Fernsehzuschauern entsprechen.
Gemäß einem zusätzlichen Merkmal der Erfindung wird die Gruppierungsmaschine im Wesentlichen ausschließlich durch markierte Sehdaten von einer bestimmten Zielgruppe trainiert, um ein am weitesten verallgemeinertes Profil der jeweiligen Zielgruppe zu ermitteln.
Gemäß einem weiteren Merkmal der Erfindung ist die Gruppierungsmaschine dazu programmiert, Zuschauerprofile in jeder Gruppe in einer repräsentativen Zusammenstellung zu verallgemeinern, und Werbekategorieprofile zu bilden durch Summieren aller Dimensionen, die für die jeweilige Gruppe die stärkte Gemeinsamkeit und für alle Zielgruppen die höchste Besonderheit aufweisen.
Gemäß einem weiteren Merkmal der Erfindung ist ein Werbemanager bereitgestellt, der angeschlossen ist, um Anfragen an die Verhaltensmodell-Datenbank zu stellen. Der Werbemanager ist dazu programmiert, Verhaltensprofile der Verhaltensmodell-Datenbank zu parametrisieren und die parametrisierten Verhaltensmodelle in einen Werbekategorie-Zugehörigkeitsagenten herunterzuladen, der in dem klientenseitigen System angeordnet ist. Vorzugsweise ist der Werbekategorie-Zugehörigkeitsagent dazu konfiguriert, die heruntergeladenen parametrisierten Zielrichtungsmodelle zu rekonstruieren, und eine Gruppierungsmaschine auf die Geschichte des Fernsehzuschauers anzuwenden, um eine wahrscheinlichste Werbekategorie zu bestimmen, zu der der Nutzer gehört, und die Ergebnisse als Zielkategorie-Wahrscheinlichkeiten in einer Nutzerkategoriedatenbank zu speichern.
Außerdem können Zielrichtungsagenten und Präsentationsagenten vorgesehen sein, die in dem klientenseitigen System angeordnet sind, um die Zielkategorie-Wahrscheinlichkeiten und relevante Präferenzinformation zu kombinieren, um wahlweise Werbung zu erfassen, zu speichern und anzuzeigen, die gemäß der Optimierung heruntergeladen wurde.
Unter Berücksichtigung der genannten und anderer Aufgaben ist außerdem gemäß der Erfindung eine Präferenzmaschine zum Nutzen in einem interaktiven Anzeigesystem bereitgestellt, mit einer Kopfendseite, die den Programminhalt verteilt, und einer Klientenseite, die den Programminhalt empfängt und den Programminhalt selektiv gemäß der Auswahl des Nutzers anzeigt. Die Präferenzmaschine bestimmt den bevorzugten Programminhalt des Nutzers und umfasst:
eine Nutzerüberwachungsvorrichtung, die an der Klientenseite angeschlossen ist, um kontextabhängige Übergangsverhaltensweisen aufzuzeichnen, um ein Profil für einen oder mehrere Nutzer zu erstellen, und um kontinuierlich eine Informationsdatenbank mit Präferenzen und kontextabhängigen Übergangsverhaltensweisen aufzubauen, um ein Profil für den oder die Nutzer zu erstellen; und
eine Vorrichtung zum Bereitstellen des Programminhalts an den oder die Nutzer gemäß der demographischen Information des Nutzers und dem kontextabhängigen Übergangsverhaltensprofil.
Die Nutzerüberwachungsvorrichtung der Präferenzmaschine modelliert die Verhaltensinteraktion des Nutzers mit Werbeprogramminhalten und mit Unterhaltungsprogramminhalten.
Gemäß einem weiteren zusätzlichen Merkmal der Erfindung ist die Präferenzmaschine angeschlossen, um von dem Kopfende Metadaten zu empfangen, die den Werbeinhalt beschreiben, und Metadaten, die den Unterhaltungsprogramminhalt beschreiben, und dazu programmiert, um Inhaltspräferenzen aufzustellen, indem Metadateninformation mit dem kontextabhängigen Übergangsverhaltensprofil kombiniert wird, und um eine verhältnismäßige Informationsdatenbank mit Verknüpfungen zwischen dem Nutzerverhalten, demographischen Informationen, und Programminhaltspräferenzen aufzubauen. Die Präferenzmaschine ist programmiert, um Muster von Nutzungsverhalten mit einem Verhaltensmodell zu modellieren und Nutzungsschlüsselinformation aus dem Verhaltensmodell in eine Verhaltensdatenbank zu extrahieren, wobei jedem Eintrag in der Verhaltensdatenbank ein Sicherheitswert zugeordnet wird, der eine Schätzung einer Struktur- und Stichprobenqualität der Daten widerspiegelt, die benutzt werden, um den Datenbankeintrag zu berechnen.
Unter Berücksichtigung der genannten und anderer Aufgaben ist außerdem gemäß der Erfindung ein System für zielgerichtete Programmbereitstellung in einem Programminhalts-Bereitstellungssystem mit einer Kopfend-Seite und einer Klientenseite bereitgestellt. Das Zielrichtungssystem umfasst:
ein zentrales Datensystem an der Kopfend-Seite, das Betrachtungsdaten empfängt, die von der Gruppe ausgewählt sind, die aus Betrachtungsdaten, Betrachtungsstartzeit, Betrachtungsdauer, und Betrachtungskanal besteht, demographische Information, die einen Programmnutzer beschreibt, und einen elektronischen Programmführer mit Metadaten, die einen Programminhalt beschreiben;
einen Erfasser einer demographischen Gruppeninformationsdatenbank, der Verhaltensdaten des Nutzers empfängt und eine Informationsdatenbank in Form einer Übergangsmatrix mit Gewichtungsgruppen ausgibt, wobei die Übergangsmatrix eine demographische Gruppe des Nutzers vorhersagt; und
ein Programminhalts-Erzeugungsmodul, das Abläufe von Programminhalt einschließlich Werbung an die Klientenseite bereitstellt, basierend auf der vorhergesagten demographischen Gruppe des Nutzers.
Gemäß einem weiteren zusätzlichen Merkmal der Erfindung ist eine Realzeit-Rückkopplungsschleife zum Bereitstellen von Realzeitinformation zum Sehverhalten eines Nutzers an das zentrale Datensystem mit Klick-Ablaufdaten bereitgestellt.
Gemäß einem weiteren zusätzlichen Merkmal der Erfindung basiert der Erfasser der demographischen Gruppeninformationsdatenbank auf einem verborgenen Markow-Modell.
Gemäß einem weiteren Merkmal der Erfindung sind der Erfasser der demographischen Gruppeninformationsdatenbank und das Programminhalts-Erzeugungsmodul Softwaremodule, die jeweils dazu angepasst sind, auf einem maschinenlesbaren Medium in Form von mehreren von einem Prozessor ausführbaren Befehlen gespeichert zu sein.
In einer bevorzugten Ausführungsform erzeugt der Erfasser der demographischen Gruppeninformationsdatenbank demographische Gruppeninformation des Nutzers in Bezug auf statistische State-Machine-Übergangsmodelle. Die State-Machines sind in der Übergangsmatrix definiert, und die Übergangsmatrix enthält Information zu den Programmübergängen, die von dem Zuschauer eingeleitet wurden.
Vorzugsweise sind wenigstens zwei gleichzeitig laufende Übergangsmatrizen vorgesehen, darunter eine Kanalmatrix und eine Genrematrix. Andere Matrizen sind ebenfalls möglich, wie z.B. eine Titelmatrix, eine Schauspielermatrix usw.
Gemäß einem weiteren Merkmal der Erfindung ist der Erfasser der demographischen Gruppeninformationsdatenbank dazu konfiguriert, das Nutzerverhalten mit einem pseudo-verborgenen Doppelzufalls-Markow-Verfahren zu parametrisieren, und eine statistische Niedrigniveau-State-Machine zu definieren, die eine Verhaltensgruppe modelliert, und eine statistische Spitzenniveau-State-Machine mit aktiven Verhaltensgruppen und einer Interaktion zwischen den aktiven Verhaltensgruppen.
Gemäß einem begleitenden Merkmal der Erfindung ist der Erfasser der demographischen Gruppeninformationsdatenbank dazu konfiguriert, einen Doppelzufallsprozess mit mehreren Dimensionen zu definieren, und parallele statistische State-Machine-Übergangsvorgänge in wenigstens zwei oder drei Zustandskategorien einschließlich Kanal, Genre und Titel des Programminhalts zu bestimmen.
Das globale Profil stellt demographische Gruppeninformation des Nutzers in Bezug auf die statistischen State-Machine-Übergangsmodelle dar. Die Erfindung stellt das Vorhersagen und Modellieren von Fernsehnutzer-Profildaten bereit: Die resultierenden Verhaltensmesswerte tendieren dazu, Individuen und ihre Präferenzen individuell zu charakterisieren. Die Übergangsprozesse modellieren Nutzersequenzen und vorübergehende Übergangspräferenzen. Die Erfindung stellt ein Verfahren zum Bestimmen der Sicherheit bezüglich Datenquantität und -qualität bereit; einen Algorithmus zum Bestimmen einer Distanz zwischen nicht-Gaußschen hochdimensionalen Verteilungen; und ein Verfahren zum Bestimmen einer angemessenen Separation zwischen Gruppen zur Gruppenzugehörigkeits-Klassifizierung.
Die Anfrageschnittstelle gemäß der Erfindung stellt Verhaltenspräferenzinformation an andere Systemmodule bereit.
Die neuartige Präferenzbestimmung des Programms oder Werbeprogramms benutzt:

– gewichtete unscharfe Stimmpräferenzmesswerte basierend auf dem modellierten Nutzungskontext, der Inhaltszugriffszeit, und der Inhaltsparameter-Sequenzierung
– frequenzverstärkte, nichtlineare Präferenzmesswert-Stimmgewichts-Lernarchitektur
– einen Summierungsalgorithmus, der die n Spitzen-Inhaltsparameter (d.h. Kanäle, Genres, Schauspieler, Titel usw.) bestimmt, indem Stimme für Stimme Qualität und relative Präferenztrends angepasst werden.

In einer weiteren Konzeptgruppe stellt zielgerichtetes Werben für Fernsehen und interaktives Fernsehen Folgendes bereit:

– ein Trainingsverfahren zum Zusammenstellen von Nutzern in der Zielkategorie
– ein Feinabstimmungsverfahren zum Erzeugen der repräsentativsten Nutzerausrichtungs-Kategorievorlage, und zum effizienten Laden derselben in das Klientenfernsehsystem
– ein effizientes Verfahren zum Bestimmen der Nutzerausrichtungs-Kategoriezugehörigkeit
– automatische Erzeugung einer Programmsequenz des virtuellen Kanals unter Benutzung gespeicherter bevorzugter Programmgestaltung, präsentiert als ein Kanal in dem EPG.

Schließlich sind Algorithmen vorgesehen, die gemäß dem bevorzugten Kontext des Nutzers (d.h. Zeit, Sequenz usw.) gespeicherte Programme und Werbeprogramme automatisch in den EPG eines virtuellen Kanals stellen (zusammen mit normalen EPG-Einträgen).
Die Erfindung stellt so ein sehr genaues System zum Vorhersagen und Modellieren von Fernsehnutzer-Profildaten bereit. Verfahren des Stands der Technik benutzen keine Programmzugangs- und -weggangsfrequenz und -zeiten als Präferenzindikatoren, so dass sie weniger genaue Präferenzwertungen aufweisen. Hier werden Kategorien wie Gefallen, Nichtgefallen, und Surfbedingungen separat modelliert, um die verschiedenen Bedeutungen des Verhaltens einer Person für jeden Fall besser zuzuordnen. Systeme des Stands der Technik modellieren den sequenziellen und zeitlichen Übergang in einer allgemeinen vorhersagenden Architektur nicht. So sind sie nicht dazu in der Lage, die Präferenz eines Nutzers anhand verfeinerter Inhalts- und Zeitverhältnisse vorherzusagen. Indem nicht festgestellt wird, wann angemessene Anzeichen zur Herleitung einer Präferenz vorliegen, neigen bekannte Verfahren dazu, Nutzerpräferenzen falsch vorherzusagen, oder sie warten zu lang, bevor eine höhere Sicherheit aufgebaut wird.
Bekannte Klassifizierungsverfahren verlangen, dass alle Merkmaldimensionen einer Stichprobe mit der Beobachtung korreliert werden, und führen dann eine Gaußsche Verteilungsparametrisierung durch, um Gruppen zu beschreiben. Allerdings ist dies ungenau, da die Daten im Allgemeinen nicht normal verteilt sind. Die vorliegenden Verfahren sind dazu in der Lage, Gruppendistanzen von multimodalen (nicht glockenförmigen) Verteilungen zu bestimmen, und sparen Speicherplatz, indem sie nicht jeden Stichprobenpunkt im Merkmalsraum bewahren. Außerdem treffen Verfahren des Stands der Technik keine optimalen Entscheidungen zur Gruppenklassifizierung, wenn die Stichprobenverteilungen multimodal sind. Das System und das Verfahren der vorliegenden Erfindung führen angemessenere Gruppenklassifizierungen durch, da sie mit einer arbiträren Verteilungsform arbeiten.
Aufgrund der überlegenen und facettenreichen Verhaltensmodellierung ermöglicht die Erfindung eine genaue Bestimmung der Programm- oder Werbungspräferenz. Indem reiche zeitliche und sequenzielle Kontextinformation einbezogen wird, sagt das vorliegende System die kontextabhängigen Präferenzen eines Nutzers voraus. Die Erfindung nutzt automatische Lernverfahren, d.h., explizite Nutzereingaben, um die Präferenz eines jeweiligen Nutzers optimal vorherzusagen. Das vorliegende System passt Präferenzvorhersageparameter dynamisch an, um eine höhere Gewichtung für die am stärksten prädiktiven Merkmale beim Bewerten eines Inhaltsparameters zu benutzen.
Das vorliegende System beeinflusst Präferenzwertungen mit stichprobenweisen Wertungstrends, die die Systeme des Stands der Technik einfach summieren. Durch Erhöhen (Herabsetzen) einer Wertung mit Stichproben höherer (niedrigerer) Qualität wird eine genauere relative Präferenzmetrik erreicht. Durch besseres Modellieren des Präferenzverhaltens ermöglicht die Erfindung also weit überlegene Werbe- und Fernsehprogrammzielrichtung.
Im Zusammenhang mit zielgerichteter Werbung für Fernsehen und interaktives Fernsehen benutzen die Verfahren des Stands der Technik hauptsächlich demographische Information, und nicht kontextabhängige Verhaltensinformation als Teil des Nutzerprofils zur zielgerichteten Werbung. Entsprechend liegen die Zielrichtungsleistung für nicht demographisch klassifizierbare Kundengruppen und die demographische Annahmegenauigkeit niedriger.
Das vorliegende System reduziert die Profilgröße, indem es weniger konservative statistische Signifikanzmetrik benutzt, was die Größe der Zielrichtungsvorlage weiter reduziert, während die Klassifizierungsleistung aufrechterhalten wird, indem keine statistisch falsche Profilinformation geladen wird. Indem die Zugehörigkeit eines Fernsehzuschauers zu einer Zielkategorie als sicherheitsherabgesetzte Distanzen von einfachen lokalen Vorlagen hergeleitet wird, erreicht das vorliegende Verfahren sehr genaue proportionale Zugehörigkeitswahrscheinlichkeiten, da, im Gegensatz zu dem Stand der Technik, Vorlagenproflle in statistischer Hinsicht nicht falsch parametrisiert werden.
Zusätzlich zum genauen Klassifizieren der Zuschauerpräferenzen für zielgerichtete Werbung ermöglicht die Erfindung außerdem die automatische Erzeugung vorgeschlagener Programmsequenzen. Hier beziehen wir uns auf die Erzeugung einer Programmsequenz für einen virtuellen Kanal mit Hilfe einer gespeicherten bevorzugten Programmgestaltung. Die vorgeschlagene Programmsequenz kann als ein separater Kanal in dem elektronischen Programmführer (EPG) präsentiert werden. Der virtuelle Kanal ist gegenüber Systemen des Stands der Technik insofern überlegen, als der Nutzer den EPG des virtuellen Kanals mit derselben Gestaltung und demselben Eindruck erlebt wie jeden anderen Kanal, nur dass die Programme und Ausstrahlungszeiten so angeordnet sind, wie der Nutzer es bevorzugt. Der virtuelle Kanal stellt ein höheres Niveau bevorzugter Programmgestaltung bereit als die einfache Auflistung von Inhalten, die im lokalen Speicher verfügbar sind. Das neuartige System gibt dem Fernsehnutzer das Gefühl eines Kanals „auf Abruf".
Hinsichtlich System und Geschäftsmodell zielt die vorliegende Erfindung auf ein zielgerichtetes Werbesystem ab, das Folgendes bereitstellt:

– Ein innovatives Gruppierungsverfahren zum Erzeugen und Bestimmen der repräsentativsten Fernseh-(TV, bezeichnet digitales Fernsehen oder eine Kombination aus analogem Fernsehen und einem Digitalempfänger, beide mit Programmspeicherung)-Nutzerprofile, die am besten auf individuelle Nutzer-Werbekategoriegruppen ausgerichtet sind.
– Ein klientenseitiges System zum Klassifizieren eines TV-Nutzers in eine oder mehrere Werbegruppenkategorien.
– Ein kontextabhängiges Profilerstellungssystem, das die TV-Nutzung und inhaltsbezogene Präferenzen eines Nutzers bestimmt.
– Eine Verhaltensmodelldatenbank, die von anderen Systemmodulen nach Nutzerpräferenzen abgefragt wird, und die verhaltensgemäß zielgerichtete Werbung, den Aufbau eines präferentiellen elektronischen Programmführers (EPG) für den virtuellen Kanal, eine Speicherung bevorzugter Programm, und automatische Programmvorschläge unterstützt.

Das neuartige zielgerichtete Werbungssystem leitet die Werbekategorie eines TV-Nutzers her, ohne dass der Zuschauer die Information explizit eingeben muss. Eine Werbekategorie bezeichnet hier eine Gruppe von beschreibenden Merkmalen, die eine Untergruppe von Nutzern in Kategorien einteilt, die mit einem Zielinteresse von Werbern korreliert werden können. Traditionell basierten diese Kategorien auf demographischen Merkmalen; allerdings erweitert die vorliegende Erfindung die Nutzermodellierung und -zielrichtung, um Verhaltensmesswerte einzubeziehen. So wird ein wesentlich robusteres und stärker verfeinertes System für zielgerichtete Werbung möglich. Anders als beim Stand der Technik ist das vorliegende zielgerichtete System nicht von programmierten Daten, sondern von Verhaltensdaten angetrieben. Die Grundvoraussetzung dieser Erfindung ist, dass Personen der gleichen Kategorie bestimmte Verhaltensweisen aufweisen, die mit einem beträchtlichen Grad von Konsistenz modelliert und gruppiert werden können. Der primäre zugrunde liegende Aspekt der Erfindung ist es, ein genaues Modell des dynamischen Prozesses zu entwickeln, so dass eine Gruppierungsmaschine mit einer praktischen Gruppe von charakteristischen Dimensionen effizient die große Mehrheit der Zuschauer separieren oder klassifizieren kann. Zusätzlich zur automatischen Zielrichtung auf Werbekategoriezugehörige ist es das Ziel, die Verhaltensmodellierungs-Maschine und -Datenbank anzuwenden, um die kontextabhängige Präferenz eines TV-Nutzers für Programmgestaltung und Werbung zu bestimmen.
Die vorliegende Erfindung modelliert das Betrachten eines TV-Programms als einen pseudoverborgenen Doppelzufalls-Markow-Prozess, wobei eine verborgene statistische State-Machine (SSM) niedrigen Niveaus vorhanden ist, die eine Verhaltensgruppe modelliert, und eine beobachtbare Spitzenniveau-SSM, die die aktiven Verhaltensgruppen und deren Interaktion untereinander herleitet. Das System wird mit markierten Lerndaten (z.B. Realzeit-TV-Klick-Ablaufdaten, die mit der demographischen Identität von Zuschauern markiert sind) einer statistisch repräsentativen, fernsehenden Bevölkerungsstichprobe trainiert. Das Klassifizierungsmodell ist eine hybride Kombination eines parametrisierten Zufallsprozesses, Heuristik, und mehrerer eindimensionaler Verhaltensmesswerte. Mehrere Datenqualitätsmesswerte bestimmen die statistische Signifikanz und Sicherheit von Trainings- und Testdaten.
Die vorliegende Erfindung umfasst einen innovativen Sicherheitsmesswert von Stichprobengröße. Diese Metrik schätzt die Abweichung in dem Zufallsprozess, der die SSM antreibt, indem unter der Annahme, dass Zustandsübergänge gleichmäßig zufällig ausgewählt wurden, das Verhältnis der erwarteten Zustandsübergangsabdeckung zu der tatsächlichen Zahl beobachteter verschiedener Zustandsübergänge berechnet wird. Das Verhältnis stellt den Zustandsübergangsfokus im Vergleich zum -zufall dar und zeigt an, inwieweit genügend Stichproben vorhanden sind, um einen nicht-uniformen Zufallsprozess, insbesondere die Persönlichkeit eines Zuschauers, als die SSM-Struktur in bedeutungsvoller Weise bestimmend herzuleiten.
Das Doppelzufalls-Prozessmodell weist mehrere Dimensionen auf, um eine breite Spanne von typischen, aber oft individuellen TV-Nutzungsverhaltensweisen zu erfassen. In der bevorzugten Ausführungsform erzeugen jede Handlung des Nutzers oder gewählte Nicht-Handlungen des Nutzers parallele SSM-Übergänge in jeder der drei Zustandskategorien: Kanal, Genre und Titel.
Diese Zustandskategorien sind weiter in den Zustand der Merkmale gefallend/nicht_gefallend und kurzes_sehen/nicht-kurzes_sehen unterteilt. In jeder kategorischen State-Machine, die hier beschrieben ist, sind chronologische Dimensionen vorhanden, die zeitabhängige Zustandsübergänge modellieren. Die zeitlichen Dimensionen der bevorzugten Ausführungsform modellieren die Übergangschronologie mit Hilfe einer neuen Strategie, die Wochentag, Tageszeit, abgelaufene_Zeit_nach_Einschalten_des_Fernsehers, und seit_der_letzten_Änderung_verstrichene_Zeit enthält. Der Programmauswahlprozess des TV-Nutzers ermittelt, wenn er durch dieses zeit- und übergangsabhängige Modell betrachtet wird, komplexe Nutzungsmuster, die dazu neigen, für Individuen und im weiteren Sinne für interessante Klassen von Individuen einzigartig zu sein. Verhaltenssequenzen, die größer als ein Übergang sind, wie z.B. Kanalsurfen, und mehrere heuristische Verteilungen, wie z.B. Sitzungssehzeiten, und psychometrische Parameter, wie z.B. Genreneugier, liegen als Dimensionen in einem pseudo-euklidischen Klassifizierungsraum außerhalb der SSM.
Ein neuartiges Gruppierungsverfahren kombiniert die SSM-Übergangsmodelle (mit Hilfe von Parametrisierungsverfahren für die Übergangsmatrix) und nicht-Gaußsche Parameterverteilungen (durch Definieren individueller Histogramm-Verteilungsdistanzmesswerte), um durch eine Dimensionswahlarchitektur eine Nutzerseparabilität zu bestimmen. Jede Dimension bestimmt zwei Gruppierungen als separat, wenn die mittlere Separationsdistanz zwischen den meisten Punkten größer ist als ihre Separationsvarianz. Das Überschreiten einer bestimmten Schwellenanzahl von dimensionalen Separationsstimmen bestimmt, ob die Gruppierungen separat sind. Der Anteil der Dimensionen, die als nicht zwischen zwei Gruppierungen separabel bestimmt werden, nähert ihre Überlappungsgröße an.
Gemäß einem zusätzlichen Merkmal der Erfindung ist der Gruppierungsmaschinen-(GM)-Softwareagent in einem singulären Computersystem angeordnet, das an dem TV-Verteilungskopfende (bezeichnet als Werbemanager) angeordnet ist, und erzeugt Verhaltensprofilvorlagen, die Zielwerbekategorien von Fernsehzuschauern entsprechen. Um das am stärksten verallgemeinerte Profil einer bestimmten Zielgruppe festzustellen, wird die GM allein mit markierten Sehdaten dieser Gruppe trainiert. Die GM verallgemeinert die Zuschauerprofile jeder Gruppe in eine repräsentative Zusammenstellung für die jeweilige Zielwerbekategorie.
Werbekategorieprofile entwickeln sich, indem alle Dimensionen summiert werden, welche bei der Gruppe die stärkste Gemeinsamkeit zeigen und für die Zielgruppen am individuellsten sind.
Gemäß einem weiteren Merkmal der Erfindung, der prototypischen Werbegruppenkategorie, werden Verhaltensprofile innovativ durch den Organisationsteil für die Verteilung von Werbungs- und Werbeprogramminformations-Metadaten des Werbemanagers (bezeichnet als Werbeserver) parametrisiert, um die Zielmodelle für das bandbreiteneffiziente Herunterladen auf Werbekategorie-Zugehörigkeitsagenten (MitgliedAgent) zu komprimieren, die in den Feldfernsehern angeordnet sind.
Gemäß einem weiteren Merkmal der Erfindung rekonstruieren die Feldfernseher-MitgliedAgenten die heruntergeladenen parametrisierten Zielmodelle und benutzen eine ähnliche GM, die auf die TV-Nutzerhistorie angewandt wird, welche von dem TV-Profilerstellungsagenten (ProfAgent) erzeugt wird, um die wahrscheinlichsten Werbekategorien zu bestimmen, zu denen der Nutzer gehört, und die Resultate in die Nutzerkategoriedatenbank einzugeben. ZielundSpeicher-Agenten und Präsentationsagenten (PräsAgent) im Fernseher kombinieren diese Zielkategoriewahrscheinlichkeiten und andere relevanten Informationen (PräfInfo), um selektiv die optimalen heruntergeladenen Werbefilme zu erfassen, zu speichern und an den Nutzer auszustrahlen, einschließlich Videos und Bannern.
Die ProfAgenten im Klienten oder in den Feldfernsehern bauen fortlaufend eine Informationsdatenbank zu Präferenzen und kontextabhängigen Übergangsverhaltensweisen auf, welche ein Profil für den/die TV-Nutzer des Haushalts bilden. Der ProfAgent modelliert die Verhaltensinteraktion mit Werbung und regulären, oder unterhaltenden, Programmen in derselben Weise, allerdings mit möglicherweise unterschiedlichen Zustandskategoriebezeichnungen. Präferenzen für Unterhaltungsprogramme umfassen Affinitäten für ein Metadatenfeld oder Einträge in einem elektronischen Programmführer (EPG), wie Titel, Genres, Kanäle und Schauspieler. Ein Übergang tritt zwischen entsprechenden Programm-EPG-Einträgen auf (z.B. erzeugt ein Übergang zwischen Programmen mit unterschiedlichen Kanälen und Genres einen entsprechenden Kanal- und Genreübergang). Werbung weist eine eigene Version von EPG-Information auf, die ähnlich wie die regulärer Programme ist. Das System lernt die Werbeübergangspräferenzen eines Nutzers in derselben Art und Weise wie bei regulären Programmen, mit der Ausnahme, dass das Werbegenre der Standard-Industriecode (SIC) ist, der Titel der Werbung der universelle Produktcode (UPC) oder SKU-Code ist, und dass das System den Schauspieler der Werbung als den Unternehmenssponsor betrachtet. So modellieren identische Datenstrukturen und Algorithmen die Programm- und Werbeübergangsverhaltensweisen des Nutzers.
Diese Information wird von einem Kopfende in den Metadaten der Werbung in derselben Weise bereitgestellt, wie Inhaltsinformationsdaten und EPG der Ausstrahlung vorgeschaltet sind. Daher lernt der ProfAgent die Produkt- und Sponsorgruppenpräferenz für Werbung in derselben Weise, wie Genre- und Schauspielerpräferenzen gelernt werden, wie hier genau beschrieben werden soll. Dies ermöglicht die gezielte Zielrichtung von Werbung nicht nur auf die hergeleitete Demographie eines Nutzers, sondern auf dessen spezifische Interessen hinsichtlich Produkt- oder Unternehmensmarken oder allgemeiner Produktkategorien. Beispielsweise kann der ProfAgent durch den SIC herausfinden, ob ein Nutzer Finanzdienstleistungs- oder Autowerbung mag. Ähnlich kann eine Pepsi-Cola-Markenkampagne auf Nutzer abzielen, die den Erfrischungslimonaden-SIC mögen, oder speziell Werbung mit dem Namen Coca Cola. In einem anderen Aspekt könnte das Unternehmen Gillette mit Hilfe des UPC auf Nutzer abzielen, denen speziell Werbung eines elektrischen Rasierers des Modells Remington 3000 gefällt. In einem weiteren Aspekt des Zielrichtungssystems könnte eine Werbeagentur auf Nutzer abzielen, die beispielsweise Werbung der Apple Computer Company, aber keine andere Computerwerbung mögen. Es kann sein, dass diese Nutzer durch ihre Werbung unterhalten werden, aber kein Interesse an ihrem Produkt haben. Dies könnte eine Gelegenheit für die Werbeagentur bieten, eine Infomercial-Werbung auf den Nutzer auszurichten, um für den Nutzer eine Brücke vom Markenbewusstsein hin zum Produktkauf zu errichten.
Im Laufe der Zeit erkennt eine groß angelegte Verhältnisinformations-Datenbank sehr wertvolle Beziehungen zwischen dem TV-Nutzungsverhalten des Nutzers, Demographie, Programmen und Werbepräferenzen. Diese Informationsdatenbank erhöht nicht nur die Zielgerichtetheit im Fernsehen, sondern weist auch ein Einnahmenerzeugungspotential durch Vermarktung der gesammelten persönlichen Information an Dritte auf.
In einem Beispiel der vorliegenden Erfindung modelliert ein TV-ProfAgent Muster des TV-Nutzungsverhaltens mit einem Verhaltensmodell (VM), das ähnlich aufgebaut ist wie die Gruppierungsmaschine, die am TV-Kopfende benutzt wird, und extrahiert Nutzungsschlüsselinformation von dem VM in einer Verhaltensdatenbank. Jeder Eintrag der Verhaltensdatenbank weist einen Sicherheitswert auf, der von einer Vielzahl neuartiger Verfahren erzeugt wird, die hier detailliert vorgestellt werden sollen. Die in der Datenbank eingetragene Sicherheit, die von dem ProfAgent registriert wird, spiegelt eine Schätzung der Struktur- und Stichprobenqualität der Daten wider, die benutzt wurden, um den Datenbankeintrag zu berechnen.
Das Fernsehgerät empfängt Werbezielrichtungs-Metadaten mit beschränkenden Anfragebedingungen, um die betreffende Werbung nur ausgewählten Nutzern zu zeigen, deren Datenbankeinträge die Anfragebeschränkungen erfüllen. Jede Werbemetadaten-Anfragebedingung weist eine minimale Sicherheitsschwellen-Bedingung auf, die das niedrigste Sicherheitsniveau der Erfüllung der Anfragebedingung oder Anfragebedingungen angibt, die akzeptabel sind, um eine Werbung zu zeigen.
Beispielsweise führt eine Werbezielrichtungsbeschränkung wie „Geschlecht: Männlich@80% UND Alter:25-35@50%" dazu, dass die Werbung nur Nutzern gezeigt wird, für die der vorbestimmte ZUSAgent zuvor mit einer Sicherheit von 80% annimmt, dass sie männlich sind, und mit einer Sicherheit von 50% annimmt, dass sie zwischen 25 und 35 Jahre alt sind.
In einem anderen Aspekt der Festlegung des Sicherheitsniveaus liegt folgende Sicherheitsschwelle auf Ausdrucksniveau vor: „(Geschlecht: Männlich UND Alter:25-35)@80%". Dieser Zielrichtungsmodus wählt nur solche Nutzer zur Werbungsausstrahlung, für die das System mit wenigstens 80%iger Sicherheit annimmt, dass sie männlich und zwischen 25 und 35 Jahre alt sind. Diese Verfahren stellen Flexibilität bereit und erlauben es Werbung, die wichtigsten Zielrichtungsauswahlbedingungen festzulegen, oder einen Gruppe von Personen festzulegen, die dem gewünschten Zielprofil nahe genug kommen, um ihnen die Werbung zu zeigen. Der Zielrichtungs-und-Speicher-Agent (ZUSAgent) wählt nur solche Profile aus der Datenbank aus, deren gesamte Sicherheitsbewertung pro Dimension die Anfragebedingungen erfüllt, die von den Werbezielrichtungsmetadaten aufgestellt sind.
In einem weiteren Aspekt des Sicherheitsschwellenwert-Systems ist das Anfrageauswahlfilter als ein unscharf logischer und nicht-booleanscher Ausdruck dargestellt. Der Zielrichtungsanfrageausdruck ist ähnlich wie die Sicherheitsbedingungen mit Wahrscheinlichkeitsprozentsatz, mit zwei wichtigen Ausnahmen: Unscharfe Zugehörigkeitsliterale ersetzen die Prozentualbedingungen, und eine unscharfe Literaltabelle synchronisiert Klient und Server.
Beispielsweise erscheint der Anfrageausdrucksmodus wie folgt:
„Geschlecht: Männlich@SEHR_SICHER UND Alter:25-35@ZIEMLICH_SICHER"
Diese Anfrage würde Nutzer auswählen, bei denen der ZUSAgent sehr sicher ist, dass sie männlich sind, und ziemlich sicher, dass ihr Alter zwischen 25 und 35 Jahren liegt. Eine unscharfe Literaltabelle (ULT) listet die zulässige Spanne unscharfer Zugehörigkeit auf, die für jede Werbekategorie vorliegen darf. Ein Beispiel einer unscharfen Literaltabelle (ULT) ist:
Männlich: [UNSICHER, ZIEMLICH_SICHER, SEHR_SICHER]
Alter: [UNSICHER, ZIEMLICH_SICHER, SEHR_SICHER, SICHER]
Der Vorteil des letztgenannten Ausdrucksverfahrens ist, dass die neue Werbeagentur das erforderliche Ausmaß an Sicherheit nur in intuitiver, nicht-mathematischer Hinsicht festlegt, und die genaue Spanne des Sicherheitsprozentsatzes der Entscheidung und ständigen Optimierung durch den ZUSAgenten überlässt. Zusätzlich behandelt das unscharfe Verfahren die nichtdeterministische Bedeutung der prozentualen Sicherheitsbedingungen in der Datenbank. Der ZUSAgent erlernt die prozentualen Sicherheitsbewertungsspannen, die historisch jedem unscharfen Leistungsniveau zugeordnet sind.
Andere Merkmale, die als kennzeichnend für die Erfindung betrachtet werden, sind in den beiliegenden Ansprüchen dargelegt.
Obwohl die Erfindung hier als in einem System und Verfahren zur Verhaltensmodellgruppierung bei der TV-Nutzung und zielgerichteter Werbung und Präferenzprogrammgestaltung dargestellt und beschrieben ist, ist trotzdem keine Beschränkung auf die dargestellten Details vorgesehen, da verschiedene Modifikationen und strukturelle Änderungen daran vorgenommen werden können, ohne den Geist der Erfindung und den Umfang und Bereich von Äquivalenten der Ansprüche zu verlassen.
Der Aufbau der Erfindung, zusammen mit weiteren Aufgaben und Vorteilen derselben, wird allerdings am besten anhand der folgenden Beschreibung der spezifischen Ausführungsform unter Bezugnahme auf die begleitenden Figuren deutlich.
Kurze Beschreibung der Figuren:
1 ist ein Blockdiagramm, das die wichtigsten Module des Systembetreiberteils des Systems zur Programm- oder Werbezielrichtung gemäß der Erfindung zeigt;
2 ist ein Blockdiagramm einer Verhaltensgruppenmaschine, die einen Teil des erfindungsgemäßen Systems bildet;
3 ist eine diagrammhafte Übersicht über ein verborgenes Markow-Modell mit Doppelzufallsverarbeitung;
4 ist ein Diagramm, das eine statistische State-Machine mit drei Zustandsräumen zeigt, die als Wahrscheinlichkeitsdichte-Funktionen dargestellt sind;
5 ist ein Diagramm einer beispielhaften Kanalübergangsmatrix, die eine State-Machine darstellt;
6 ist ein Blockdiagramm eines Zielrichtungsservers, der ein Werbekategorie-Verhaltensprototyp-Lernsystem darstellt;
7 ist ein Blockdiagramm, das die Feineinstellung innerhalb des Profils in dem Gruppensummierungsabschnitt des Zielrichtungsservers aus 6 näher darstellt;
8 ist ein Blockdiagramm eines klientenseitigen Werbekategorie-Klassifizierungssystems;
9 ist ein Blockdiagramm eines Werbezielrichtungssystems, das die Serverseite und die Klientenseite zeigt;
10 ist ein blockdiagrammhafter Überblick über eine Architektur einer Maschine zur Präferenzbestimmung;
11 zeigt drei Graphen, die verschiedene Nicht-Surf-Programmbetrachtungsverhältnisse aufzeichnen (mit 1657 Nutzereingaben);
12 sind vier Graphen, die Statistiken zum Sprungverhalten von 1657 Nutzern zeigen;
13 ist ein Zustandssequenzmodell;
14 sind vier Graphen mit typischen statistischen Verteilungen des Nutzerverhaltens mit der wöchentlichen Aufzeichnung von 1657 Nutzern; und
15 sind vier Graphen, die verschiedene zusätzliche Parameterverteilungen für die beispielhaften 1657 Nutzer darstellen.
Genaue Beschreibung der bevorzugten Ausführungsformen
Detailliert Bezug nehmend auf die Figuren, dabei insbesondere auf 1, ist ein diagrammhafter Überblick über ein erfindungsgemäßes System dargestellt. Der Kern der Erfindung ist die Anwendung einer verborgenen Markow-Kette und von statistischen Daten zum Nutzerverhalten, um die demographische Gruppe eines TV-Zuschauers und/oder das beliebteste Verhalten für eine einzelne demographische Gruppe zu modellieren und vorherzusagen. Das Hauptziel ist es, die demographische Gruppe eines jeweiligen Zuschauers vorauszusagen, und/oder welche Programme der Zuschauer gerne sehen würde, und die Vorhersage- und Modellierungsgenauigkeit zu verbessern, während mehr Realzeit-Sehdaten verfügbar werden.
Das System stellt zwei Verfahren zum Vorhersagen der demographischen Gruppe eines Zuschauers bereit, nämlich über eine Informationsdatenbank mit dynamischen demographischen Gruppen (DDG), und basierend auf Ähnlichkeiten zwischen dem, was ein Zuschauer sieht, und den virtuellen Kanälen, die von dem PBMO für die demographische Gruppe vorhergesagt werden.
Wie oben erwähnt, befassen sich die wichtigsten Aufgaben der Erfindung mit der gezielten Ausrichtung von Werbeinhalten und Programminhalten auf einen Zuschauer oder eine Gruppe von Zuschauern, die bestimmte demographische Bedingungen erfüllen, wenn eine solche Anforderung vorliegt.
Das in 1 gezeigte System ist in ein Kopfende und einen Klienten unterteilt. Programmgestaltung, Werbeinhalt und Sequenzierung des TV-Inhalts wird an dem Kopfende bestimmt. Die Programmablaufinformation wird in einem Multiprogrammstrom an die Klientenseite übertragen. Wie durch die gestrichelte Linie angezeigt, stellt, zurückkehrend von dem Empfänger an das Kopfende, eine Programmauswahl-Rückkopplung Realzeit-Information zum Sehverhalten des Klienten bereit. Obwohl die Rückkopplungsverbindung im Allgemeinen in digitalen Kabelsystemen oder anderen direkten Verbindungssystemen verfügbar ist, kann die Erfindung auch ohne direkte Rückkopplung implementiert werden. Details der Realzeit-Rückkopplung und der Ausführungsformen mit Stichproben-Rückkopplung werden aus der folgenden Beschreibung hervorgehen.
Die Daten, die von außen angeordneten Quellen bereitgestellt werden, enthalten Information zu der Fernsehüberwachungsinformation aller demographischen Gruppen, an denen Anbieter von Werbung oder Inhalten interessiert sein könnten. Diese Variablen umfassen (a) Sehdatum, (b) Sehbeginn (c) Sehdauer, (d) Sehkanal, und (e) demographische Information des Nutzers, wie z.B. Alter, Geschlecht usw. Die Eingabedaten enthalten außerdem Information zum empfangenen elektronischen Programmführer (EPG).
Die historischen Daten erfüllen die Rolle der Vorinformation zu den demographischen Gruppen. Diese Daten definieren die Verhaltensinformation des Zuschauers. Die Systeminformation beschränkt sich zunächst auf diese demographischen Gruppen.
Der Kern der Erfindung – hinsichtlich der Erfassung von Daten für das nötige Verhaltensmodell – ist der Erfasser der Informationsdatenbank für demographische Gruppen, der auf dem verborgenen Markow-Modell basiert. Die Eingabe des Moduls sind die Verhaltensdaten und, wenn verfügbar, die Klickablauf-Rückkopplung. Die Ausgabe des Moduls ist die Informationsdatenbank in Form einer Übergangsmatrix mit Gewichtungsgruppen, die im folgenden Text erläutert werden.
Die Erfindung stellt außerdem Verbesserungen bei dem Modellieren und Vorhersagen basierend auf Rückkopplungsinformation bereit, welche Realzeit-Verhaltensdaten in der Form von Klick-Abläufen (z.B. Fernbedienungs- oder TV-Gerät-Klicksequenzen) enthält.
Unter Hinwendung zu verschiedenen Details des neuartigen Systems zeigt 2 eine pseudoeuklidische Verhaltensgruppenmaschine (VGM) gemäß einer Ausführungsform der vorliegenden Erfindung. Ein pseudo-verborgenes Markow-Modell 1 (pVMM) erfasst Verhaltenszustandsübergänge. Ein Heuristische-Verhaltensmetrik-(HVM)-Unterblock 2 ermittelt algorithmisch mehrere vorhersagende TV-Nutzermerkmale und stellt diese statistisch dar. Der TV-Steuerablauf 3 des TV-Nutzers, z.B. der Klick-Ablauf der Fernbedienung, wird an das pVMM und die HVM geleitet. Diese Blöcke sind zu einem hochdimensionalen Klassifikationsraum 5 parametrisiert, der eine räumliche Gruppierung der Trainingsdaten an Folgemodule 6 weiterleitet.
3 ist ein Diagramm, das sich auf den pVMM-Block aus 2 konzentriert. Mehrere statistische State-Machines arbeiten im Tandem, um den Nutzer-Klickablauf zu modellieren. Die bevorzugte Ausführungsform weist mehrere verborgene Verhaltensprozesse niedrigen Niveaus auf, und einen Nutzerübergangsprozess des Spitzenniveaus. Die verborgenen Zufallsprozesse umfassen die Titelzustandsräume Kanal, Genre, und Gefallen, die parallel operieren. Der Spitzenniveau-Zufallsprozess, oder die statistische Spitzenniveau-State-Machine (SSM), modelliert die Wahrscheinlichkeit, dass bestimmte Verhaltensprozess-Aktivierungen, und andere heuristische Verhaltensfaktoren, einen bestimmten Nutzer nahe legen. Jeder Zustandsraum weist einen vorübergehend sensiblen Übergangsunterraum auf, der verschiedene zeitlich abhängige Nutzerverhaltensweisen verfolgt.
Die Architektur der pseudo-euklidischen Verhaltensgruppenmaschine (VGM) aus 2 stellt eine Ausführungsform der vorliegenden Erfindung dar. Sie umfasst ein pseudo-verborgenes Markow-Modell (pVMM) zum Erfassen eines Verhaltenszustandsübergangs. Im Allgemeinen zeigt der Kennzeichner „Pseudo", dass dieses System von der traditionellen Definition abweicht, aber wesentliche Ähnlichkeiten beibehält, wie sie nach einer kurzen Beschreibung des VMM beschrieben werden sollen.
Ein VMM ist ein Doppelzufallsprozess, der einen zugrunde liegenden Zufallsprozess aufweist, der nicht beobachtbar und deshalb verborgen ist. Allerdings sind einige Aspekte dieses verborgenen Prozesses durch einen anderen Zufallsprozess oder eine Gruppe von Zufallsprozessen beobachtbar. Der beobachtete Zufallsprozess erzeugt eine Sequenz von Symbolen, im vorliegenden Fall wahrscheinliche Nutzerkategorien, die wir mit bestimmten statistischen Eigenschaften messen können. Das Modell versucht, sowohl die kurzfristigen Variationen in dem Zufallsprozess, als auch die stationären Merkmale zu beschreiben. Besonders interessant sind hier die Übergänge von einem Intervall zu einem anderen. Wir nehmen allgemein an, dass statistische Gesetze die beobachteten zeitlichen Variationen im Fernsehprozess steuern.
Das Ziel des VGM ist es, die TV-Nutzungs- und -Inhaltsauswahl, Zeitserien-Datenmuster, die von einer TV-Fernbedienung oder durch gedrückte Fernsehgerätknöpfe erzeugt werden, und die hier als Klick-Abfolge bezeichnet werden, zu modellieren und zu gruppieren. Es gibt zwei Formen von Klick-Ablaufdaten; und zwar realzeitliche und statistisch erfasste.

– Realzeitdaten sind solche Daten, die das konkrete TV-System von den TV-Steuerbefehlen des Nutzers registriert. Diese Daten werden sehr schnell gesammelt, wobei es sich um jeden Fernsehgerät-Steuerknopf handeln kann, und sie können vorübergehend zur späteren Benutzung in einer Datei akkumuliert werden.
– Statistisch gesammelte Daten werden von einem dritten Teil aufgezeichnet, wie z.B. Nielsen oder Arbitron, und weisen im Allgemeinen genauere Nutzerinformation und eine begrenzte zeitliche Auflösung auf, und erfassen nur Kanalwechsel einer statistisch repräsentativen Untergruppe der fernsehenden Bevölkerung.

Zwei primäre Aspekte des Werbezielrichtungssystems hängen direkt von den Klick-Ablaufdaten ab. Erstens modelliert der Profile erstellende Agent (ProfAgent) am Fernsehgerät TV-Nutzer durch einen Realzeit-Klick-Ablauf und durch Programminhaltsinformationsdaten oder Daten des elektronischen Programmführers (EPG). Zweitens nutzt die VGM statistisch erfasste Klick-Ablaufdaten und entsprechende vergangene EPG-Daten, um Werbekategorie-Verhaltensgruppen zu erstellen. Alle statistisch erfassten TV-Nutzerdaten im vorliegenden Dokument benutzen durch die BARB TV Research Corp. (London, England) über einen Zeitraum von sechs Monaten im Jahr 1998 digital aufgezeichnete Marktforschungsdaten von 1657 britischen Satelliten-TV-Nutzern.
Mehrere heuristische Messwerte schätzen die Nutzerpräferenz für TV-Programme, Kategorien der Programmgestaltung, und bestimmte Nutzerverhaltensweisen. Mit diesen Präferenzmesswerten benutzt eine Präferenz-Bestimmungsmaschine (PBMA) ein wahlbasiertes, bestärktendes Lernsystem, um allen EPG-Einträgen Präferenzwertungen zuzuteilen.
Die Präferenz-Bestimmungsmaschine (PBMA), deren Architektur in 10 darstellt ist, stellt gefallend-Prädiktoren für alle demographischen Gruppen bereit, d.h. für eine Gruppe anstelle einer einzelnen Person. Der Unterschied zwischen einer Person und einer Gruppe ist der, dass die Bestimmungsmaschine Programme ermitteln muss, die einer Mehrheit der Personen einer demographischen Gruppe für eine bestimmte Zeit zusagen. Zusätzliche Details der Implementierung der PBMA können der gemeinschaftlich erteilten Parallelanmeldung [Attorney Docket No. P02408US] entnommen werden, die hier durch Querverweis zitiert wird.
Die Gruppenwahrscheinlichkeit kann wie folgt bestimmt werden:
wobei
die Wahrscheinlichkeit ist, dass eine Person j einer demographischen Gruppe i das Programm auf Kanal C zum Zeitpunkt t mag; N ist die Anzahl der Personen in der demographischen Gruppe i, für die die höchste Wahrscheinlichkeit besteht, dass sie Kanal C zum Zeitpunkt t sehen.
Dann ist der ermittelte Kanal der mit dem höchsten
Die Architektur der Präferenz-Bestimmungsmaschine, die in 10 dargestellt ist, weist mehrere Präferenzmessfilter 10 (PMF) auf, eine Verhaltensmodell-Datenbank 11 (VMdbank), eine Stimmerzeugungsschicht, Ausgabe-Wahlgewichtungen, und einen bestärkenden Lehrmechanismus. Jeder Präferenzmesser filtert Nutzerverhaltensmuster in einen Analogwert, der zu dem Ausmaß proportional ist, in dem das Zielverhalten auftritt. PMF und pVMM empfangen Nutzer-Klick-Ablaufdaten von einem Klick-Ablaufmesser 12, und verwalten die VMdbank 11 dynamisch. Die vorliegende VM-Ausführungsform umfasst das folgende neuartige PMF, wie es in den folgenden Punkten definiert ist:

1. Sehze/Verfügbare_Zeit, für Programme ohne Surfen und Sprünge
2. Verpasste_Zeit/Verfügbare Zeit für alle Programme ohne Surfen
3. Verbleibende_Zeit/Verfügbare Zeit, für alle Programme ohne Surfen
4. Sehzeit/Verfügbare_Zeit, für Programme mit Sprüngen
5. Zeit zwischen Sprüngen für Programme mit Sprüngen
6. Zahl der Sprünge pro Programm
7. Zeitunabhängige Besuchsneigung aller EPG-Einträge
8. Zeit-im-Programm (ZIP) Besuchsneigung für alle EPG-Einträge
9. Zeit-in-Sitzung (ZIS) Besuchsneigung für alle EPG-Einträge
10. Tageszeit (TZ) Besuchsneigung für alle EPG-Einträge
11. Wochentag (WT) Besuchsneigung für alle EPG-Einträge.

Obgleich diese Begriffe selbsterklärend sind, wird nachfolgend eine Erläuterung für diese Begriffe angegeben.
In Punkt 1 ist der Ausdruck Sehzeit (T_w) die gesamte Sehdauer, möglicherweise nicht zusammenhängend, für ein bestimmtes Programm. Verfügbare_Zeit (T_a) bezeichnet die Programmdauer. Das Verhältnis Sehzeit/Verfügbare_Zeit (T_w/T_a) zeigt an, wie viel von einem Programm der Nutzer gesehen hat, und spiegelt sein Interesse am Inhalt statistisch wider.
In Punkt 2 ist der Term Verpasste_Zeit (T_m) die Zeitmenge, mit der ein Nutzer verspätet zu einem Programm stößt (negativ, falls verfrüht). Das Verhältnis Verpasste_Zeit/Verfügbare_Zeit (T_m/T_a) stellt die Willigkeit und mögliche Planung des Nutzers dar, den Beginn des Programms zu sehen, also eine größere Programmpräferenz, als wenn der Nutzer oft verspätet zuschaltet. Wenn negativ, ist dies ein besonders starker Indikator dafür, dass der Nutzer einen größeren Planungsaufwand getrieben und also eine größere Präferenz dafür hat, den Beginn des Programms zu sehen.
In Punkt 3 ist der Ausdruck Verbleibende_Zeit (T_l) die Zeit des Programmendes minus die Zeit, zu der der Nutzer das Programm verlassen hat (negativ, wenn er nach dem Ende bleibt). Verbleibende_Zeit/Verfügbare_Zeit (T_l/T_a) ist ein Verhältnis, um das Interesse eines Nutzers daran zu bestimmen, das Programmende nicht zu verpassen, also eine größere Präferenz für das Programm als für den Fall, dass der Nutzer es häufig früh verlässt.
Zusammengenommen bestimmen diese Messwerte die Quantität und Qualität möglicher Zeit, die darauf verwendet wird, ein Programm zu sehen. Wie in 10 gezeigt, neigen die meisten Menschen dazu, sich eng in jeder solchen Metrik zu gruppieren. Das Resultat ist eine gute Korrelation zu der Programmpräferenz. Genaue gleiche Schlüsse und Messwerte wie T_w/T_a, T_m/T_a, und T_l/T_a gelten ebenso für Werbesendungen wie für Programme.
Präferenzmesswerte in Bezug auf Programmsprünge, Punkte 4 bis 6, schätzen die Programmpräferenz im Verhältnis zum Sprungverhalten. Ein Programm-Sprung ist die Handlung des Verlassens und Zurückkehrens zu demselben Programm. Ein Programm-Surfen ist die Handlung des Besuchens und Verlassens eines Programms innerhalb einer kurzen Zeitperiode, z.B. 5 Minuten. Wenn ein Nutzer zu einem Programm zurückkehrt, ist dies ein starker Indikator dafür, dass dieses Programm etwas hat, wofür sich eine Rückkehr lohnt, oder das gefällt. 11a stellt T_w/T_a Programme mit Sprüngen dar. Es versteht sich, dass Programme mit Sprüngen länger betrachtet werden als die im Nicht-Sprung-Fall. Eine Sprunganzeige ist also eine Anzeige einer größeren Präferenz.
In Punkt 5 bezeichnet der Ausdruck Zeit zwischen Sprüngen die Zeit (in Minuten), die der Nutzer vor seiner Rückkehr nicht bei dem ursprünglichen Programm verbracht hat. Wie dargestellt, weisen die meisten Nutzer Sprünge auf, die weniger als 2 % des Programms betragen. Jenseits des intuitiven Appells dieser Messwerte demonstrieren diese Daten in Kombination mit der oben genannten Präferenzneigung für Programme mit Sprüngen eine Tendenz, dass die Präferenz des Nutzers für das ursprüngliche Programm um so höher ist, je kürzer die Zeit der Abwesenheit ist.
Mit einem ähnlich intuitiven und beobachtbaren Appell ist die Anzahl der Sprünge pro Programm von Punkt 6 eine umgekehrt proportionale Annäherung an die Nutzerprogrammpräferenz. Das heißt, je öfter ein Nutzer in einem Programm hin und zurück springt, desto weniger gefällt das Programm. 11c zeigt an, dass die meisten Menschen nur einmal oder zweimal in einem Programm springen, das überhaupt Sprünge aufweist. Es ist wichtig, zu beachten, dass eine höhere Sprunghäufigkeit zunehmend selten wird und also nicht bevorzugt wird, da die meisten Programme mit Sprüngen ein relativ hohes T_w/T_a-Verhältnis aufweisen.
Eine weitere neuartige Klasse von Programmpräferenz-Messwerten basiert auf einem einzigartigen Verfahren zum Bestimmen der Verhaltenstendenz eines Nutzers, Punkte 7 bis 11. Nutzertendenz, wie hier benutzt, ist der voreingenommene Fokus von Verhaltensweisen, eine signifikant eingeschränkte Untergruppe von möglichen Alternativen zu wählen. Mit diesem Konzept als Motivation nimmt Tendenz die theoretische Form eines Verhältnisses der erwarteten gleichmäßig zufälligen Auswahlverteilung im Gegensatz zu der beobachteten Verhaltensauswahlverteilung an. Die Nutzerverhaltenstendenz ist ein psychometrisches Werkzeug, das die psychologische Tendenz eines Nutzers misst, ein Zielverhalten gegenüber anderen Optionen in seinem Verhaltensbereich vorzuziehen. Eine mathematische Behandlung der Tendenzmetrik folgt später einer Zusammenfassung ihrer Anwendung auf Nutzer-Programmpräferenzen.
Die Verhaltenstendenzmetrik kann bestimmen, ob eine jeweilige Auswahl genug Indizien liefert, dass die Nutzerwahl eine bevorzugte Handlung ist. Genauer ausgedrückt, zeigt sie die Wahrscheinlichkeit eines nicht-gleichmäßigen zufälligen Auswahlprozesses an. Wenn beispielsweise die Auswahl eines bestimmten Kanals mit derselben Wahrscheinlichkeit wie beim Zufall auftritt, gibt es keine Indizien für eine Nutzer-Verhaltenstendenz, und es wird angenommen, dass der Kanal nicht bevorzugt wird. In der umgekehrten Situation, wobei die Auswahl um ein Mehrfaches wahrscheinlicher ist als Zufall, wird angenommen, dass der Kanal bevorzugt wird.
In gleicher Weise liefert die Präferenzwahl von Punkt 7 die Gesamttendenz, einen bestimmten EPG-Eintrag zu besuchen. Punkte 8 bis 11 sind zeitlich eingeschränkte Tendenzanfragen.
Punkt 9 liefert eine Wahl der Tendenz, eine bestimmte Auswahl zu einem bestimmten Zeitpunkt nach dem Beginn einer Fernsehsitzung zu treffen. Eine Sitzung ist die TV-Nutzungsdauer, die mit dem Einschalten beginnt und mit dem Ausschalten des Fernsehgeräts endet. Eine Besuchstendenz ist die Inhalts- oder Kategoriebesuchsfrequenz über Zufall.
In gleicher Weise beschränkt Punkt 10 die Tendenzanfrage auf die Tageszeit, und Punkt 11 ist eine Präferenzanfragewahl zur Wochentagsauswahl. Die vorgeschriebenen Tendenzmesswerte sind denjenigen des Stands der Technik überlegen, indem sie absolute Häufigkeiten eines Geschehens berechnen, und nicht die relative Wahrscheinlichkeit einer bestimmten beobachteten auftretenden Ereignishäufigkeit. In jeder kurzen Zeitperiode kann ein gleichmäßig zufälliger Prozess den Eindruck erwecken, dass einige Möglichkeiten anderen vorgezogen werden, und kann ein häufigkeitsbasiertes Präferenzbestimmungssystem dazu verleiten, eine Nutzerpräferenz anzunehmen. Allerdings würde unter solchen Umständen das vorliegende Neigungsermittlungsverfahren anzeigen, dass nicht ausreichend Stichproben vorliegen, oder dass diese nicht konzentriert genug sind, um eine Nutzerpräferenz anzunehmen. Dies führt dazu, dass das Vertrauen in besuchsfrequenzbasierte Messwerte von geringer Qualität sinkt, und senkt ihren Beitrag zur abschließenden Wertung der Programmpräferenz; auf diese Weise wird die Genauigkeit durch das Zurückweisen von statistisch fehlerhaften Stichprobendaten erhöht.
Zusätzlich zu der Präferenz bezüglich des EPG-Eintrags sind mehrere verhaltensbezogene Präferenzen vorgesehen, wie z.B. die hier beschriebenen. Verhaltenspräferenzen stellen einen Mechanismus bereit, Vorhersagen zur Programmpräferenz im Kontext eines vergangenen Handlungsmusters eines Nutzers zu erstellen. Es ist oft der Fall, dass die Stimmung eines Zuschauers, oder kontextabhängige Bedingungen einschließlich zeitlicher Warteschlangen, die Präferenzen so beeinflussen können, dass ein Programm in einem Kontext gefällt, und in einem anderen nicht bevorzugt wird. Insoweit, als die VGM den Verhaltenskontext des Interesses modelliert, ist eine genauere Vorhersage der Programmpräferenz möglich.
Die Verhaltensmodell-Datenbank VMdbank 11 aus 10 wird durch eine standardisierte Verhaltensmodell-Anfragemaschine bedient. Die entsprechende Zielanfrage der Verhaltensmodell-(VM)-Daten soll im Folgenden beschrieben werden:
Alle modellierten Verhaltensweisen und zeitlichen Beziehungen in der VGM, wie sie hier beschrieben sind, dienen als die VMdbank für Systemmodule, um Anfragen mit dem Realzeit-Nutzungsmuster des Zuschauers während einer TV-Sitzung zu stellen, und die Schätzung nicht einfach mit Hilfe der gemittelten Präferenz des Nutzers für ein Programm zu erstellen. Die VMdbank ist ein Verhaltenspräferenz-Anfrageserver für jedes Systemmodul, das bestimmte Verhaltenswahrscheinlichkeiten benötigt, um eine optimale Entscheidung zu treffen. Module, die die VMdbank abfragen, umfassen den Präferenzbestimmungsagenten (PBMA) 13, den ZUSAgenten und den PräsAgenten. Die Verhaltensmodell-Anfragemaschine (VMA-Maschine) bedient alle Suchanfragen an die VMdbank.
Eine Umgebungszustandsvariable (wie z.B. Fernsehgerät-Lautstärke), oder ein EPG-Eintrag (z.B. Kanäle), oder ihre Ableitungen, ist potenziell eine Hyperebene in Dimension 1 unten des Verhaltensmodells. Das bevorzugte Verhaltensübergangsmodell weist die folgenden fünf Dimensionen (Dim) auf:

– Dim 1 [gefallenderTitel, gefallenderKanal, nichtgefallenderKanal, surfKanal, gefallendesGenre, nichtgefallendesGenre, surfGenre]
– Dim 2 [vom Zustandscode, d.h. Kanal, oder Genre, oder Titel-ID-Nummer]
– Dim 3 [zum Zustandscode, d.h. Kanal, oder Genre, oder Titel-ID-Nummer]
– Dim 4 – [nichtzeitlich, WT, TZ, ZIS, ZIP]
– Dim 5 – [zeitlich unscharfer Bin]

Dim 1 wählt die Art der Zustandsvariable.
Dim 2 stellt eine Einschränkung für den „von"-Zustand des Interesses mit der Referenz-ID auf. Ein „von"-Zustand ist der Zustand, den der Zuschauer verlässt, wenn ein Zustandsübergang erfolgt.
Dim 3 stellt die „zu"-Zustands-ID für die Anfrage auf. Der „zu"-Zustand ist genau wie der „von"-Zustand definiert, außer, dass es der Zustand ist, in den ein Zuschauer bei einem Zustandsübergang eintritt. Die Referenz-IDs können Kanalaufrufbuchstaben, wie z.B. „ABC", Genrenamen wie „Film", oder Hash-Codes von Titeln sein.
Dim 4, die Art der zeitlichen Beziehung; und,
Dim 5 den entsprechenden Zeitintervall; z.B. sind eine gültige Auswahl für WT: Mo., Di., Mi., Do., Fr., Sa. und So.
Es gibt etwa 14 bis 16 unscharfe Zugehörigkeitskategorien, die ein zuverlässiges unscharfes Modell bereitstellen. Die Anzahl der Mitglieder in den Kategorien kann eingestellt sein, von etwa sieben für relativ unwichtige Zugehörigkeitskategorien (Verhältnis verbleibende_Zeit/Sehzeit) bis etwa 17 für die wichtigsten Kategorien (z.B. Sehzeit) zu variieren.
Zusätzlich zu den VM-Suchbeschränkungen gibt es Funktionsspezifikationen. Funktionsspezifikationen umfassen, sind aber nicht beschränkt, auf Folgende:
Anfragefunktion – [höchstwahrscheinlich, unwahrscheinlichst, Obere_n, Untere_n, Zeit_Summe]
Die (un)wahrscheinlichste Suchfunktion kehrt zu den höchsten (niedrigsten) Wahrscheinlichkeitszuständen und Tendenzwerten zurück, die den Rest der Anfragebeschränkungen erfüllen. „Obere_n" (Untere_n) liefert die Anzahl „n" der Zustände der höchsten (niedrigsten) Wahrscheinlichkeit und der Tendenzwerte, die den Rest der Anfragebeschränkungen erfüllen. Die Funktion „Zeit Summe" summiert alle Tendenzausdrücke (durch Mittelwertbildung oder Zählen usw.) in jeweils spezifizierten ZeitWert-Intervallen des ZeitTyps. So ist ein allgemeines Anfrageformat:
,[AnfrageFunktion] [ZustandTyp] [vonZustandID] [zuZustandID] [ZeitTyp] [ZeitWert]'
Beispielsweise sucht die folgende Anfrage nach den oberen 5 gefallenen Genres am Sonntag:
,AnfrageFunktion=Obere_n=5, ZustandTyp=GefailendeGenres, vonZustandID=Null, zuZustandID=Null, ZeitTyp=WT, ZeitWert=Sonntag'
Ein typisches Anfrageergebnis, wobei 100 die maximale Präferenz ist, lautet
[Action=60, Nachrichten=40, Komödie=30, Null, Null]
wenn nur drei Genres an Sonntagen gefallen haben.
Eine typische Benutzung von ,Zeit_Summe' ist es, nach der wahrscheinlichsten Aktivitätszeit für einen bestimmten ZustandTyp zu suchen. Beispielsweise: Finde die 3 wahrscheinlichsten Tageszeiten, zu denen ein Nutzer fernsieht. Die Anfrage lautet
,AnfrageFunktion=Zeit_Summe, ZustandsTyp=GefallendeKanäle, vonZustandID=Null, zuZustandID=Null, ZeitTyp=TZ, ZeitWert=Null'.
In diesem Fall summiert die Funktion ,Zeit_Summe' alle Übergangstendenzen pro TOD-Intervall, und liefert eine Liste der Ergebnisse. Wenn die Person morgens, abends und spät abends am aktivsten ist, könnte eine typische Anfrageantwort lauten („;" impliziert eine neue Zeile, und „," eine neue Spalte):
[(spät_abends, sehr_oft); (nachts, nie); (früh_morgens_nie); (morgens, meistens); (vormittags; selten); (nachmittags; selten); (spätnachmittags; manchmal); (abend; fast_immer); (nachts, üblicherweise)]
Ein Modul mit einer Schärfungstabelle sucht die gelieferte Matrix für die oberen drei Wahrscheinlichkeiten, nämlich,
[(morgens, immer); (spät_abends, sehr_oft); (abends; fast_immer)].
Eine Vielzahl standardisierter Anfrageschnittstellen ist leicht einsetzbar, um an die VMA-Maschine zu koppeln. Beispielsweise würde eine SQL-Schnittstelle die dimensionalen Attribute als „AUSWÄHLEN...VON...WOBEI"-Klauseln spezifizieren; wenn z.B. die wahrscheinlichste, oder beliebteste, ZEIT zum Sehen von FILM.ACTION der Abend ist, lautet die SQL-Anfrage:
Ein einfacher SQL-Übersetzer wandelt SQL-Suchparameter in dimensionale Attributbeschränkungen für die VMA-Maschine um. In diesem Beispiel,
AnfrageFunktion = höchstwahrscheinlich, ZustandTyp = GefallendesGenre, vonZustandID = Null, zuZustandID = Film:Action, ZeitTyp = TZ, ZeitWert = abends.
Obwohl eine breite Spanne modellierter Verhaltensweisen und Anfragearchitekturen vorgesehen ist, gibt es trotzdem noch viele andere. Es folgt eine allgemeine Aufzählung einiger Verhaltenspräferenzkategorien. Hier hängt die Ausgabe von dem Realzeit-Sehkontext ab:

1. Zeitabhängige Übergangspräferenzen für alle EPG-Einträge
2. Zustandssequenzierung
3. Übergangsumkehrtendenz
4. Sehzeit pro Sitzung, und für alle EPG-Einträge
5. Fernsehgerätsteuerungs-Verhaltensmuster
6. T_w/T_a, T_m/T_a, und T_l/T_a für alle EPG-Einträge
7. EPG-Eintrag und Verhaltensdiversitätsfokus (Breiten- und Tiefensuchsteuerung)
8. Wahrscheinlichster Start- oder Endzustand

In Punkt 1 erzeugt das BM zeitempfindliche und zeitunabhängige Übergangswahrscheinlichkeiten für jeden EPG-Eintrag. Jede EPG-Eintragsklasse wird weiter in mehrere Verhaltenskategorien unterteilt, einschließlich der Zustände Surfen/Nicht Surfen, Springen, und gefallend/nicht gefallend, wie zuvor definiert. Jede Nutzerhandlung erzeugt Übergangsstatistiken in jedem dieser Bereiche gemäß dem SSM-Algorithmus.
Ein Beispiel ist eine Anfrage an die VMA-Maschine nach der Wahrscheinlichkeit, dass ein bestimmter Schauspieler (oder irgendein EPG-Feldeintrag) gesehen wird, nachdem die Nachrichten (oder irgendein anderer EPG-Feldeintrag) gesehen wurden, ohne zeitliche Beschränkung. Eine typische zeitsensible Präferenzanfrage würde wie folgt aussehen:
,Was ist die Wahrscheinlichkeit, dass am Montag (oder irgendeinem Tag) Sport gesehen wird
UND
am Abend (oder zu irgendeiner Zeit),
UND
nach einer Stunde (oder einer anderen Zeitmenge) Fernsehen,
UND
während das aktuelle Programm (oder irgendeine gesehene Programmzeitmenge) halb abgelaufen ist.
Es ist wichtig, dass die Anfrage mit weniger konjunktiven Verbindungen gelockert oder mit mehr Beschränkungen verschärft wird. Mit Hilfe dieses Mechanismus kann ein Systemmodul die Realzeit-Kontextinformation an die VMA-Maschine weiterleiten und feststellen, dass, obwohl, der Nutzer Sport im Allgemeinen mag, er/sie Sport nicht gerne montagabends innerhalb einer Fernsehstunde nach Ablauf eines halben Programms sieht. Dieser hoch spezielle Fall ist eine Demonstration der großen Detailliertheit der Lern- und Kontextpräferenz, die in dem vorliegenden System möglich ist. Das Systemmodul sendet die gesamte Spanne von Anfrage abstraktionsniveaus, d.h. von sehr allgemein (z.B. finde gefallende Genres) bis hin zu einer voll konjunktiven EPG-, zeitlichen und zustandssequenzierten Wahrscheinlichkeitssuche. Das Systemmodul findet das wahrscheinlichste Niveau der Anfrageabstraktion und bewertet die Programmgestaltung nach dessen Distanz von den Anfrageparametern.
Wenn beispielsweise ein Sportprogramm gewertet werden soll, könnte die erste und abstrakteste Anfrage sein „gefällt Sport", woraufhin nachfolgende Anfragen zunehmend einschränkende Bedingungen hinzufügen, abhängig von dem Realzeit-Kontext, wie „gefällt Sport an Montagabenden nach dem Sehen der Nachrichten", und eine noch spezifischere Anfrage könnte der letztgenannten Anfrage „auf Kanal 2" hinzufügen, usw. Wenn die letzte und spezifischste Anfrage am wahrscheinlichsten war, würde ein Sportprogramm am Montagabend nach dem Schauen der Nachrichten auf Kanal 2 höher bewertet werden als dasselbe Sportprogramm, wenn diese Verhaltensbeschränkungen nicht erfüllt würden. Im Fall der PBMA-Anfrage ist der Verhaltenswahlbeitrag bei der PBMA-Bewertung umso höher (niedriger), je näher (weiter) ein Programm am bzw. von der wahrscheinlichsten Verhaltensbeschränkung ist.
In einem weiteren Aspekt von Punkt 1 unterstützt die VMA-Maschine eine Anfrage nach dem wahrscheinlichsten Übergang mit Parametern eines modellierten Kontexts (d.h. EPG-Einträge, Zeiten, Verhaltensweisen). Die VMA-Maschine antwortet mit allen Wahrscheinlichkeiten, welche die Anfragebedingungen erfüllen, unter der Annahme, dass unbeschränkte Modelldimensionen ein Joker sind. So wendet die VMA-Maschine rekursiv die beschränkten Dimensionen auf alle nicht beschränkten Verhaltensdimensionen an. Aus Demonstrationsgründen nehmen wir an, dass das VM für gefallene Titel, Kanäle und Genres Wochentag (WT) und Tageszeit (TZ) modelliert. Eine typische Anfrage und Antwort erscheint wie folgt.
Anfrage: „Was ist der wahrscheinlichste Genreübergang von Genre = Wetter, WT = Montag, und TZ = Abend".
Beispielantwort: „Genre = Komödie, Tendenz = mittel".
Wenn eine Bedingung nicht spezifiziert ist, sucht die VMA-Maschine alle Einträge der nicht eingeschränkten Dimensionen nach Anfrageübereinstimmungen ab. Wenn beispielsweise WT aus der letzten Anfrage ausgelassen wurde, würde jeder Abend nach dem wahrscheinlichsten Übergangsgenre von „Wetter" durchsucht. Eine mögliche Anfrageantwort ist „[Genre = Drama, WT = Dienstag, Tendenz = hoch]", wenn der wahrscheinlichste Übergang von Genre = Wetter zu einem Drama dienstags ist. Wenn die Kontrollbedingung der letzten Anfrage „höchstwahrscheinlich" zu „alle" geändert wird, würde jedes Zielgenre jedes Abends mit einem Übergang vom Wetter ausgegeben.
Derselbe Mechanismus stellt das Ermitteln der typischen Zeitdauer bereit, für die ein Nutzer dazu neigt, von einem gefallenden Programm weg zu springen. Dieses Verhalten könnte durch ein Überspringen von Werbesendungen oder durch das Teilen von Zeit mit in ständiger Konkurrenz stehenden Inhalten entstehen. Ein Beispiel einer Anfrage, die oberen 2 wahrscheinlichsten Sprungzeiten für das Programm namens „Seinfeld" zu finden, erscheint wie folgt:
Anfrage: ,[AnfrageFunktion = Obere_n=2, ZustandTyp = Titel, vonZustandID=Null, zuZustandID='Seinfeld', ZeitTyp = ZIP, ZeitWert = NULL). Wenn die Person normalerweise nur Werbesendungen 2 Minuten und 15 Minuten nach Beginn von Seinfeld in 30 bzw. 50 % aller Übergänge zu der Sendung überspringt, wäre die unscharfe Zeitbin-Anfrageantwort
[(SCHNELL_SURFEN,30);(SEHR_KURZ,50)).
Die Benutzung von Übergangskontextinformation ermöglicht es der PBMA, bessere Programm-Präferenzwertungen zuzuordnen, und erlaubt es dem PräsAgenten, Programme auf einem virtuellen Kanal in einer vom Nutzer bevorzugten Programmreihenfolge und -zeit zu bestellen.
Eine Anfrage zur Zustandssequenzierung, Punkt 2, befasst sich mit der Wahrscheinlichkeit, dass ausgewählte EPG-Einträge Teil einer bevorzugten Zustandssequenz sind, und liefert die beobachteten Wahrscheinlichkeiten und Zustände. Eine Zustandssequenz ist definiert als jede zusammenhängende Gruppe von Zustandsübergängen von mehr als eins. Jede modellierte Zustandsübergangsmatrix weist eine begleitende Zustandssequenztabelle auf. Anstatt die tatsächliche Durchdringung der beobachteten Zustandssequenzen zu speichern, erfasst die Zustandssequenztabelle die besuchten Zustände und ihre Häufigkeit. Da menschliches Verhalten sich selten mit präziser Genauigkeit wiederholt, ist es wichtiger, Übergangssequenzen zu parametrisieren, um Verhaltenstendenzen zuzuordnen. So gibt es zwei geordnete Tabellen. Eine zweidimensionale Tabelle weist Zeilen als die individuelle Kombination von besuchten Zuständen in einer beobachteten Sequenz auf, und die Spalten sind die IDs der besuchten Zustände. Die Zeilen werden nach Spaltenvektorlänge geordnet, und die Spalten sind alphanumerisch geordnet. Diese Ordnung beschleunigt das Durchsuchen der Tabelle nach einem bestimmten Anfragemuster. Eine entsprechende Tabelle, effektiv eine dritte Dimension, akkumuliert die Häufigkeit, mit der ein Zustand in der Sequenz besucht wurde. Jedes Mal, wenn dieselbe Kombination von Zuständen in einer Übergangssequenz besucht wurde, wird die Häufigkeit pro Zustand diesem Zähler hinzugerechnet. Eine effektive vierte Dimension akkumuliert die Sequenzlängen der Sequenzen zugeordneter besuchter Zustände. Eine fünfte und letzte Sequenzmodellierungsdimension zählt die Häufigkeit, mit der eine Zeile mit einer bestimmten Zustandssequenzkombination auftritt. Diese Dimension wird benutzt, um die mittlere Sequenzlänge und die mittlere Häufigkeit des erneuten Besuchs eines Zustands in einer Sequenz zu berechnen. Eine Zustandsbesuchssequenz-Zuordnung erfolgt, wenn die in einer neuen Sequenz besuchten Zustände genau einem Zeileneintrag mit besuchten Zuständen zugeordnet werden können. Wenn eine Zuordnung erfolgt, werden die Zustandsbesuchshäufigkeit und die Sequenzlänge ihrem jeweiligen dimensionalen Akkumulator hinzugerechnet. Anderenfalls wird in geeigneter Weise ein neuer Eintrag erzeugt.
13 zeigt ein typisches Beispiel. Das Beispiel betrifft Kanalzustände, doch der Algorithmus gilt für jede Zustandssequenzmodellierung. 13A zeigt eine ursprünglich leere Datenbank nach der Verarbeitung von zwei Stichproben-Zustandssequenzen. Die zwei Sequenzen weisen wenigstens einen unterschiedlichen besuchten Zustand auf, was zu zwei neuen Zeileneinträgen führt. In 13B werden zwei zusätzliche Sequenzbeispiele verarbeitet. Sequenz drei, obwohl nicht identisch mit Sequenz eins, wird in demselben Zeileneintrag summiert wie Sequenz eins, da genau dieselben Zustände besucht wurden. Sequenz vier unterscheidet sich in einem Zustand, so dass ein neuer Datenbankeintrag erzeugt wird. Das ständige oder regelmäßige Ordnen der Spalten macht die Anfragesuche effizienter.
Ein typisches Sequenz-(Sequ)-Wahrscheinlichkeitsanfrage-Format erscheint wie folgt:
[AnfrageFunktion] [ZustandTyp] [sequZustandIDs] [LängenWert]
Die Bedingung „AnfrageFunktion" weist dieselben Parameter auf wie im Fall der Übergangsanfrage. Zusätzliche „ZustandTyp"-Attribute identifizieren den Typ des auszuwählenden Zustands, z.B.: KanalSequ, GenreSequ, TitelSequ, SurfGenreSequ, SurfKanalSequ, oder jeder EPG-Eintrag, wie z.B. SchauspielerSequ usw. Die Anfrage-Einschränkungsbedingungen „vonZustandIDs" und „zuZustandIDs" sind ähnlich wie im Fall der vorangegangenen Übergangsanfrage, nur, dass sie jeweils eine Liste von entweder bereits besuchten bzw. noch zu besuchenden Zuständen sind. Die Anfragebedingung „LängenWert" beschränkt die mittlere Sequenzlänge, nach der zu suchen ist. Es folgen einige typische Beispiele für eine sequenzbezogene VMA-Maschinenanfrage.
Beispiel 1:
Finde die oberen 5 wahrscheinlichsten Kanäle, die eine vollständige Sehsequenz ohne Surfen aufweisen, wobei, mit den zuvor besuchten Kanälen 30 und 40, die Anfragebeschränkungen lauten
AnfrageFunktion = Obere_n=5, ZustandTyp = KanalSequ, sequZustandIDs = [30,40], LängenWert = Null.
Wenn die Kanäle 43, 58, und 60 die höchste Wahrscheinlichkeit einer vollständigen Sequenz aufweisen, und ihre Wahrscheinlichkeiten 80, 10 bzw. 20 Prozent sind, wäre das Anfrageresultat:
[(43,80), (58,10), (60,20), null, null].
Beispiel 2:
Finde die oberen 5 wahrscheinlichsten Kanäle, die eine vollständige Surfsequenz von drei Kanälen aufweisen, wobei, mit den zuvor besuchten Kanälen 30 und 40, die Anfragebeschränkungen lauten
AnfrageFunktion = Obere_n=5, ZustandTyp = SurfKanalSequ, sequZustandIDs = [30,40], LängenWert = 3.
Wenn nur Kanal 43 die höchste Wahrscheinlichkeit einer vollständigen Surfsequenz von drei Kanälen aufweist und seine Wahrscheinlichkeit bei 80 liegt, wäre das Anfrageresultat:
[(43,80), null, null, null, null].
Beispiel 3:
Finde aus allen Sequenzen von wenigstens 4 Programmen die Wahrscheinlichkeit, dass die folgenden drei Programme sequenziell gesehen werden: Friends, Frasier, und Seinfeld (unter der Annahme, dass sie chronologisch parallel oder aufeinander folgend waren).
AnfrageFunktion = höchstwahrscheinlich, ZustandTyp = TitelSequ, vonZustandIDs = [„Friends", „Seinfeld", „Frasier"], LängenWert = 4.
Wenn diese Anfragebeschränkungen bei 20 % aller Sequenzen mit einem LängenWert von wenigstens 4 beobachtet wurden, wäre ein typisches Anfrageresultat [20].
In jedem dieser Beispiele werden die Kanal- oder Sequenzwahrscheinlichkeiten berechnet, indem von der Gesamtzahl ähnlich eingeschränkter Aufzeichnungen einfach die Häufigkeit gezählt wird, mit der ein die Anfrage erfüllender Zustand besucht wurde. Ein vollständigeres Modell von Verhaltenssequenzen enthält zusätzlich eine einzelne Übergangsinformation, um statistisch die wahrscheinlichste Veränderung herzuleiten. Das neuartige beschriebene Sequenzmodellierungsverfahren wendet die oben genannte „besuchte Zustände"-Modellinformation an, um beobachtete Kombinationen herzuleiten, sowie VM-Zustandsinformation, um die wahrscheinlichsten Veränderungen einzuschätzen, d.h. Sequenzreihenfolge. Der Vorteil dieses Sequenzmodellierungsverfahrens ist, dass es Verhaltenssequenzierungs-Stördaten im Wesentlichen herausfiltert und Speicherplatz spart, während die charakteristische Zustandssequenzierungsinformation beibehalten wird. Es ist gut bekannt, dass die Speicheranforderungen zum Speichern aller möglichen Permutationen der numerischen Sequenz mit dem Faktor der Sequenzlänge ansteigen. In der TV-Umgebung ist dies häufig eine beschränkende und verschwenderische Nutzung begrenzter Ressourcen. Eine pessimistisch geschätzte Wahrscheinlichkeit für das Auftreten einer bestimmten Sequenzreihenfolge entspricht in etwa dem Produkt der Wahrscheinlichkeit passender Sequenzparameter (d.h. Länge, Zustände, und Zustandsbesuchshäufigkeit), und der Wahrscheinlichkeit für jeden auftretenden Übergang. Da kein Sequenzübergang unabhängig von dem vorangehenden ist, stellt diese Schätzung offensichtlich die untere Grenze dar. Es sind verschiedene heuristische Verfahren zum Vergleichen der relativen Wahrscheinlichkeit einer Permutation gegenüber einer anderen vorgesehen, unter Berücksichtigung der direktionalen Tendenz jedes Übergangs. Kurz gesagt, ist eine Permutation wahrscheinlicher, wenn ihre Übergangsrichtungen eine signifikante Tendenz gegenüber der umgekehrten Richtung aufweisen. Ein simples heuristisches Verfahren zum Berechnen einer Ordnungswahrscheinlichkeitsmetrik ist es, die Differenz Vorwärtsrichtung unter Abzug der Übergangstendenz in umgekehrter Richtung für jeden Sequenzschritt zu summieren.
Mit dieser Information kann ein Systemmodul die erwartete Wahrscheinlichkeit einschätzen, dass ein Zustand sich in einer bestimmten Sequenz befindet. Wenn beispielsweise ein TV-Nutzer beginnt, CNN zu schauen, und dann zu FOX umschaltet, könnte eine Anfrage an die VMA-Maschine die wahrscheinlichsten Folgekanäle und ihre Wahrscheinlichkeiten liefern. Wie hier im Detail gezeigt, kann diese Information von der PBMA benutzt werden, um die Präferenz eines Programms oder eine sequentielle Anordnung eines Programms in einem virtuellen Kanal durch den PräsAgenten zu verschieben.
Die Übergangsumkehrtendenz, Punkt 3, versucht jede direktionale Neigung im Zustandsübergangsverhalten eines Nutzers zu ermitteln. Ein Beispiel ist, wenn ein Zuschauer dazu neigt, von CNN auf PBS umzuschalten, aber selten von PBS auf CNN. Ähnlich kann bei Genres ein Nutzer bevorzugen, öfter vor einem langen dramatischen Film die Nachrichten zu sehen. Viele solche Präferenzen können in Titel oder jedem EPG-Eintrag auftreten. Systemmodule, die auf die Programmsequenzierung reagieren, können die Umkehrtendenz benutzen, um die bevorzugte Programmreihenfolge des Zuschauers vorherzusagen. Die PBMA benutzt die direktionale Tendenz, um eine Präferenzbewertung eines Programms hinsichtlich des Übergangskontextes der jüngeren Geschichte eines Zuschauers zu beeinflussen. Nimmt man an, dass ein Nutzer z.B. gerade die Nachrichten gesehen hat, so muss die PBMA die am meisten bevorzugten Programme im EPG berechnen, um diese zum Sehen vorzuschlagen. In dem Fall, dass die PBMA in jeder anderen Hinsicht Programme auf CNN und PBS gleich bewertet, würde sie das PBS-Programm höher bewerten, wenn eine signifikante Übergangsneigung von CNN zu PBS gegenüber dem umgekehrten Fall vorliegen würde. Der MitgliedAgent benutzt dies als einen Verhaltensparameter, um Zuschauerklassen zu ermitteln. Die direktionale Zustandsneigung hilft dem PräsAgenten dabei, den Programmführer für virtuelle Kanäle besser zu sequenzieren.
Informationen wie die typische Sehzeit, Punkt 4, pro EPG-Eintrag und Fernsehsitzung, helfen den Systemmodulen dabei, die Aufmerksamkeitsspanne eines Zuschauers besser spezifischen Arten von Inhalt zuzuordnen. Wenn ein Zuschauer zu kurzen Fernsehsitzungen neigt, werden kürzere Programme höher bewertet als längere. Wenn ein Nutzer Actionfilme über einen kürzeren Zeitraum hinweg sieht als Komödien, dann werden die Programme in den jeweiligen Kategorien nach und nach entsprechend bevorzugt. Im Prinzip gilt die Aufmerksamkeitsspanne für alle EPG-Einträge, und dabei hauptsächlich für Kanal, Genre, Titel, und Schauspieler. Die Aufmerksamkeitsspanne unterteilt möglicherweise die Zuschauer (für den MitgliedAgenten), und wirkt sich auf ihre bevorzugte Mischung von Inhaltssehzeiten aus (für die PBMA und den PräsAgenten).
Das Überwachen von Fernsehgerät-Steuermustern, aufgeführt in Punkt 5, ist ein wesentliches Werkzeug zum verhaltensabhängigen Identifizieren von Nutzern, und bildet oft eine Grundlage für Schlüsse über die Programmpräferenz. Ein typisches Beispiel ist das Modellieren des Nutzerverhaltens für das Steuern des Ton-aus- und Lautstärkeknopfes. Die PBMA benutzt den Ton-aus-Knopf als einen Indikator für weniger bevorzugte Programme. Im Kontext des Werbesehverhaltens benutzt der MitgliedAgent den Ton-aus-Knopf, um Werbung zu ermitteln, die ein Nutzer nicht mag. Andere Fernsehgerät-Steuerknöpfe, wie z.B. die Lautstärkeregelung, bieten ein ähnliches prädiktives Potential. Wenn ein Nutzer die Lautstärke eines bestimmten Programms anhebt, ist es wahrscheinlicher, dass ihm das Programm gefällt. Hinsichtlich der Nutzeridentifizierung ist es wahrscheinlicher, dass Teenager die Lautstärke von Musikvideos erhöhen, als Erwachsene mittleren Alters. In ähnlicher Weise gelten Modellierungs- und Anfragemechanismen wie bei der zeitlichen Modellierung, nur dass Zeitintervallebenen durch die geeigneten Steuerparameter-Intervalle ersetzt werden.
Dasselbe T_w/T_a, T_m/T_a, und T_l/T_a der Programm-Präferenzwertung gilt ebenso für die Verhaltens-Präferenzwertungen, wie in Punkt 6. Im Verlauf der Sehgeschichte eines Nutzers wird jeder EPG-Eintrag eine angenommene Präferenz aufweisen, die dem Programmsehverhalten des Nutzers zugeordnet ist. Wenn ein Nutzer beispielsweise oft Programme mit einem bestimmten Schauspieler verspätet einschaltet, würde der Zustand, der diesem Schauspieler entspricht, ein hohes T_m/T_a-Verhältnis aufweisen. Das gleiche gilt für jede Kombination von PMF und EPG-Eintrags-SSM.
Als eine weitere Metrik beleuchtet Punkt 7 die Bedeutung der psychometrischen Verhaltensparameter Neugier und Diversität. Diversitätsmesswerte versuchen, die räumliche Abdeckung jedes Interessengebiets durch einen Nutzer zu charakterisieren. Jeder modellierte Zustandsbereich erhält eine Fokusbewertung, die berechnet wird, indem während eines bestimmten Zeitraums die besuchte Auswahl durch die insgesamt zur Verfügung stehende Auswahl geteilt wird; z.B. Kanal Diversität = Zahl besuchter KanälelKanalgesamtzahl. Unterschiedliche Verhaltenszustandsklassen, oder EPG-Einträge, weisen ihre eigenen Diversitätsmesswerte auf; z.B. Genrediversität usw. Unterschiedliche Menschen neigen dazu, eine weite Spanne von Bereichsdiversitäts-Messwerten aufzuweisen, die sie charakterisieren. Ältere Menschen können weniger gesehene Kanäle aufweisen, als beispielsweise Teenager. Ähnlich wie Diversifäfs-Messwerte gelten Fokus-Messwerte für dimensionsübergreifende und oft hybride Bereiche. Diese Hybride sind oft Verhaltensderivative von EPG-Einträgen, und keine direkten Messungen der EPG-Auswahlverteilungen. Beispielsweise messen Kanal-Sequenz und Surf-Fokus, wie wenige individuelle Zustände alle beobachteten Sequenzen oder Surfvorgänge bilden. Eine andere psychometrische Klasse sind die Neugier-Messwerte. Neugier-Messwerte schätzen die psychologische Tendenz eines Nutzers, eine bestimmte Inhaltskategorie zu erforschen. Beispielsweise ist Kanal_Neugier der Anteil der Anzahl gefallender Kanäle, gegenüber allen Kanälen ohne Surfen. Je niedriger dieses Verhältnis, desto mehr erforscht der Nutzer Kanäle, die ihm zuvor nicht gefallen haben. Eine Person, die nicht sehr neugierig ist, würde dazu tendieren, sich nur an Dinge zu halten, die ihr in der Vergangenheit gefallen haben, und hätte eine sehr niedrige Neugier-Bewertung.
Die Präferenz-Bestimmungsmaschine PBMA benutzt Diversitäts-, Fokus- und Neugier-Messwerte, um die richtige Mischung hoch bewerteter Programme zu bestimmen, um eine Sehempfehlung für diese zu machen. Zusammen genommen steuern diese Messwerte die Breite und Tiefe der Programmvorhersagen, die dem Zuschauer präsentiert werden. Wenn beispielsweise ein Zuschauer eine niedrige Genre-Diversitätsbewertung aufweist, würde die PBMA Spitzenprogrammempfehlungen innerhalb der geringsten Anzahl von Genrekategorien konzentrieren, und umgekehrt, wenn die Bewertung hoch wäre. Menschen neigen dazu, eine vorhersagbare Spanne von Diversitäts- und Neugier-Verhältnissen aufzuweisen. In der Benutzung durch den MitgliedAgenten tendiert die Kombination dieser Messwerte dazu, Individuen und die Klassen, denen sie angehören, zu unterteilen. Hinsichtlich der PBMA ist es so, dass, wenn ihre Kanalneugierbewertung hoch ist, die PBMA solchen Kanälen eine Empfehlungspräferenz zuteilt, die zuvor nicht oft gesehen wurden. Der PräsAgent, der eine ähnliche Aufgabe hat wie die PBMA, erzeugt einen virtuellen Programmführer, der dazu tendiert, die tägliche Abwechslung und Neuartigkeit, die ein Nutzer bevorzugt, anzupassen.
Der wahrscheinlichste Start- oder Endzustand von Punkt 8 ist ein wichtiger Parameter für alle Module. Die PBMA benutzt Start- oder Endzustandswahrscheinlichkeiten, um Programmbewertungen nach Nutzergeschichte zu verschieben, wenn diese das Fernsehgerät ein- und ausschalten. Diese Parameter tragen auch dazu bei, Nutzer für den ZUSAgenten zu identifizieren. Die PBMA koppelt Endzustandsinformation mit Vorhersagen zur Sitzungsdauer, um Programme zu Endzustandspräferenzen hin zu verschieben, während die tatsächliche Sitzungszeit näher rückt und die erwartete Fernsehsitzungs-Endzeit überschreitet. Der PräsAgent wendet ein ähnliches Prinzip an, wenn er einen zeitlich passenden virtuellen Programmführer erzeugt. Wenn beispielsweise zu einem bestimmten Zeitpunkt und Programmgestaltungszustand ein Nutzer oft die Sitzung auf einem bestimmten Kanal beendet, erhält jede Programmgestaltung auf dem Kanal eine Präferenzwertungstendenz. Im Allgemeinen sind solche Wertungstendenzen relativ gering und sollen Programme bevorzugen, die ansonsten ähnlich gewertet sind, aber eine kontextabhängige Tendenz aufweisen, wie z.B. Sequenzierung.
Es versteht sich, dass die obigen Erläuterungen nur beispielhafte Ausführungsformen und Implementierungen der Erfindung sind. Eine breite Spanne von Permutationen und Variationen der Präferenzmesswerte liegen im Umfang dieser Erfindung.
Die folgende Beschreibung stellt Details zu der erfindungsgemäßen Verhaltensmodellverarbeitung bereit.
Unter Bezugnahme auf 2 und 3 erzeugt jede Handlung oder ausgewählte Nicht-Handlung parallele SSM-Übergangsvorgänge in jedem der drei SSM-Zustandsräume: Kanal, Genre, und Titel. Diese Zustandsraumkategorien weisen jeweils zeitlich abhängige und unabhängige Dimensionen auf. Die erste Dimension, von oben nach unten, ist zeitlich unabhängig, und notiert jeden Zustandsübergang, wenn ein solcher auftritt. Die zweite SSM-Dimension verfolgt die Zeit im Programm, nämlich, wie viel Zeit seit dem letzten Übergang vergangen ist, wenn der Zustandsübergang erfolgt. Dimension drei modelliert Übergänge im Verhältnis zu der Zeit seit dem Beginn einer Fernsehsitzung. Die vierte SSM-Dimension erfasst Tageszeit-Verhaltensmuster, und die fünfte die von Wochentagen. Das Ziel ist es, periodische sequenzielle Vorgänge zu ermitteln, die eine relative zeitliche oder sequenzielle Tendenz gewissen Ausmaßes aufweisen. Jede Zustandsraumdimension weist eine Übergangsmatrix auf, die als unscharfe Bins agiert, um die zeitliche Zugehörigkeit zu quantifizieren, zu der eine Zustandsübergangssequenz gehört.
Beispielsweise besteht die Dimension Tageszeit für die SSMs Kanal, Genre und Titel aus sich gegenseitig ausschließenden Übergangsmatrizen, die in jeden Zustandsübergang in einer der folgenden Zeitmatrizen eintreten:
Spät_Nachts, Nachts, Früh_Morgens, Morgens, Vormittags, Nachmittags, Spätnachmittags, Abends, Nachts
4 zeigt einen Fall des bevorzugten Zustandraums, und die legalen Übergangsflüsse innerhalb jeder statistischen State-Machine (SSM). in jeder der Wahrscheinlichkeitsdichte-Funktionen existiert nur ein Zustand zugleich. Die SSMs der bevorzugten Ausführungsform sind gefallende Titel, Kanäle, und Genres; und nicht gefallende Kanäle, und Genres; und Kanäle mit Surfen, und Genres. Jede SSM enthält feste und variable Zustände. Feste Zustände beschreiben Übergänge zwischen SSMs.
Der erste feste Zustand für alle SSMs ist der AUS-Zustand. Der AUS-Zustand tritt ein, wenn das Fernsehgerät ausgeschaltet ist.
Die SSMs, die gefallende Zustandsübergänge modellieren, weisen als zweiten festen Zustand den Zustand NICHT_GEFALLEND auf.
Umgekehrt weisen die SSMs, die nicht gefallende Zustandsübergänge modellieren, als zweiten festen Zustand den Zustand GEFALLEND auf. Kanäle und Genres, die für weniger als eine bestimmte Schwellenzeitdauer von z.B. 5 Minuten geschaut werden, zählen als Surfübergänge.
Die SSMs ohne Surfen weisen einen dritten festen Zustand namens SURFEN auf. Der Zustand SURFEN ist aktiv, wenn der Nutzer ein Programm für eine kürzere Zeit als den Surfschwellenwert sieht. Die Kanal- und Genre-Surf-SSMs weisen nur die festen Zustände AUS und NICHT_SURFEN auf. Variable Zustände für Zustandsräume sind Idealerweise alle Zustände, die besucht werden können. Allerdings begrenzen praktische Ressourcenbeschränkungen oft die Anzahl der Zustände wesentlich, die vollständig modelliert werden können. Ein Verfahren, um das VM ohne wesentliche Fehler zu komprimieren, ist es, nur die repräsentativsten oder am stärksten bevorzugten Zustände aller Zustandsräume als variable Zustände in die SSMs aufzunehmen und darin aufzulisten.
Eine Präferenz-Bestimmungsmaschine (PBMA) – siehe 10 – weist Titeln, Kanälen, und Genres Präferenzwertungen zu. Die maximale Anzahl von Zustandsressourcen-Genehmigungen wird den oberen Wertungen in jeder Kategorie entnommen. Zustände von Surf-SSM-Modellen sind eine Vereinigung von gefallenden und nicht gefallenden SSM-Zuständen. Wie bei jeder State-Machine kann die SSM nur einen Zustand zugleich einnehmen. Wenn beispielsweise ein gefallender Kanal gesehen wird und ein Übergang zu einem nicht gefallenden stattfindet, wäre der „zu"-Zustand der feste Zustand „NICHT_GEFALLEND" der SSM Gefallender Kanal, und der „von"-Zustand der SSM Nicht Gefallender Kanal ist der feste Zustand GEFALLEND.
Übergänge zwischen variablen Zuständen definieren den Block namens Wahrscheinlichkeitsdichte-Funktion, oder „wdf", da diese die Wahrscheinlichkeit für das Auftreten eines jeweiligen Verhaltenszustandsübergangs modelliert. Variable Zustände werden der wdf je nach ihrer statistischen Signifikanz im Laufe der Zeit hinzugefügt oder aus dieser entfernt. In der Praxis kann es sein, dass die meisten Zuschauer individuell im Laufe von sechs Monaten weniger als 30 von 100 Kanälen und 50 von 100 Genres besuchen. Unter Benutzung dieser Beobachtung kann ein Systemdesigner, der unter Bedingungen mit beschränktem Systemspeicherplatz arbeitet, die Ressourcenanforderungen an das System wesentlich reduzieren, und trotzdem weiterhin den größten Teil des Nutzerverhaltens erfassen. Bis zu einer bestimmten Grenze ist die Leistung der vorliegenden Erfindung proportional zu, und damit skalierbar mit, der Anzahl der am meisten bevorzugten Zustände in der SSM. Die untere Grenze der Anzahl erforderlicher Zustände ergibt sich oft aus der minimal benötigten Leistung für Individuen, die sehr ähnlich, aber auf subtile Weise verschieden sind. Die obere Grenze ist durch den abnehmenden Leistungsvorteil des Hinzufügens von Zuständen gegenüber den Nachteilen von Systemressourcenbeschränkungen gesetzt. Um eine optimale Grenze zu ermitteln, legt eine Simulation Modell-Ressourcenparameter über eine statistisch repräsentative Bevölkerungsstichprobe für Fernsehverhaltensweisen. Eine solche Optimierung der Speicherausnutzung ist am wichtigsten für den TV-ProfAgenten. In einem Realzeit-Modellerstellungsmodus ist ständig eine bestimmte Anzahl von vorübergehenden Zuständen nötig, während der ProfAgent ausreichend Indizien ansammelt, um zu bestimmen, welche in die SSM mit einbezogen, oder aber als nicht ausreichend aktiv verworfen werden sollen. Nachdem das verfügbare Speicherlimit erreicht ist, ermittelt der Agent die am wenigsten bevorzugten Zustände, wie sie von einem einzigartigen Algorithmus in der PBMA bestimmt werden.
Wenn ein Nutzer einen Inhaltsübergang einleitet, wird ein Übergangsvorgang registriert, wie er in jeder jeweiligen SSM beschrieben ist. Ein handlungsbasierter Übergang ist jeder explizit gedrückte Fernsehgerät-Steuerknopf; z.B. ein Kanalwechsel, oder eine Steigerung der Lautstärke. Ein Nicht-Handlungsvorfall tritt ein, wenn Inhalte sich ohne explizite Nutzerhandlung ändern; z.B. ein neues Programm auf demselben Kanal. Im letzteren Fall erzeugt ein neuer Programmvorgang einen Selbstübergang für jeden anderen Zustand, der gleich geblieben ist, d.h. ein stabiler Kanal ist ein Kanalzustands-Selbstübergang. Ein anderer möglicher Fall ist kein Kanalwechsel, sondern eine Wiederholung desselben gefallenden Programmtitels. In diesem Fall weisen alle SSMs einen Selbstübergang in ihren letzten Zustand auf. Es ist wichtig, dass ein Selbstübergang zu Programmen, die so kurz sind, dass er anderenfalls als Surfen gezählt würde, als Übergang ohne Surfen gezählt wird. Diese Entscheidung folgt der Philosophie des heuristischen Modellierens der Verhaltensabsicht des Nutzers.
5 zeigt detailliert eine repräsentative Zustandsraum-SSM-Matrix aus 4 und ihre Operation. Die Zeilen stellen den „von"-Zustand und die Spalten den „zu"-Zustand eines Zustandsübergangs dar. Der Prozess kann als eine dynamische demographische Gruppen- Informationsdatenbank hinsichtlich der Übergangsmatrix- und Gewichtungseinstellung (ÜMGE) bezeichnet werden.
Die Übergangsmatrix beschreibt im Prinzip das Zuschauerverhalten in einer Art zeitlicher Form. Die Übergangsmatrix, die in 5 dargestellt ist, ist eine Kanalübergangsmatrix. Die Dimension der Matrix ist A × A. A ist die Anzahl der verfügbaren Kanäle plus 2.
Die Anzahl verschiedener Arten von Matrizen ist 2, eine steht für Kanal- wie in 5 gezeigt – und eine steht für Genre.
Es gibt zwei Gruppen von Matrizen für jeden Wochentag für jede demographische Gruppe, d.h., es gibt 14 Matrizen für Kanalgruppe i (i=1,2,3,...N; N die Anzahl der Gruppen). Eine Gruppe für Sehaktivitäten, eine andere für das Surfen.
Die Matrix aus 5 zeigt die folgenden Übergänge: Ein→K.5→K.2→K.6→K.100→Aus. Ein Punkt in der Matrix (A,B,C,D,E) ist der Mittelwert aller
der demographischen Gruppe für die Handlung, z.B. Übergang von Kanal 5 zu Kanal 2. Punkte in der Ein-Spalte und der Aus-Spalte und die Matrizen für das Surfen sind Zähler für die Handlung.
Basierend auf der Übergangsmatrix ist es möglich, eine demographische Gruppe vorherzusagen. Nach Konstruktion der Übergangsmatrix müssen Gewichtungsgruppen für alle demographischen Gruppen optimiert werden. Die Optimierung basiert auf der Maximum-Entropie-Theorie und bestärkendem Lernen.
Auf der Klientenseite wird die Vorhersage in derselben Weise erreicht, es sei denn, eine Speicherbeschränkung liegt vor. Wenn dies der Fall ist, wird Entropiebewertung benutzt, um diejenigen Spalten zu eliminieren, die weniger wichtig sind. Die Gewichtungspunkte, die später erläutert werden sollen, werden zur Benutzung durch den Klienten optimiert und festgesetzt. Wenn der Klient allerdings mehr Rechenleistung besitzt, als er verbrauchen kann, kann er diese Gewichtungsgruppen optimieren und lokal bewahren.
Nehmen wir beispielsweise eine Übergangsmatrix für einen gesehenen Kanal
, wobei i ein Kanal; j eine Gruppe, und C die Entropie eines „zu"-Kanals ist, d.h. eine Spalte in einer Kanalübergangsmatrix. Es ist zu beachten, dass die Spalte einen umso höheren Wert des Informationsinhalts aufweist, je niedriger die Entropie ist. Ein niedrigerer
|bedeutet, dass ein nützlicher zu-Übergangswert für diesen Kanal existiert. Idealerweise sind
|, i=1,2,3...N, j=1,2...M, N, die Anzahl der Kanäle und M, die Anzahl der Gruppen, unterschiedlich für Gruppen, was bedeutet, dass die Übergangsmatrix dazu beitragen wird, die demographische Gruppe des Zuschauers zu bestimmen.
Das finale Ziel ist es, eine Wahrscheinlichkeit P_j für einen Zuschauer zu erhalten und dann
|als j, die vorhergesagte Gruppe des Zuschauers zu nehmen.
Die Wahrscheinlichkeit pj kann aus zwei Gruppen von Übergangsmatrizen hergeleitet werden, mit der folgenden Übergangsmatrix des Zuschauers:
Berechne zunächst
,wobei X Kanal und Genre sind, außerdem sowohl für das Sehen als auch das Surfen, d.h., X nimmt 4 Werte an.
Berechne
|, das die Entropie von von ist, d.h. von den Zeilen.
Berechne dann die Wahrscheinlichkeitsverteilung sowohl für Spalten als auch Zeilen
und
Erzeuge als nächstes wird eine Gewichtungsmatrix
| von jeder Übergangsmatrix für alle Gruppen. Die Punkte w_x,y in der Matrix sind
wobei w_x,y die Gewichtung für eine Übergangshandlung ist.
Nun berechne eine gewichtete Punktdistanz zwischen der Informationsdatenbank und der Übergangsmatrix des Zuschauers
wobei L eine der Übergangsmatrizen ist. Die Ausdrücke L^K und L^P sind L-Matrizen für Informationsdatenbank bzw. Zuschauer.
Zuletzt sollte bestärkendes Lernen, z.B. des Typs Monte Carlo, benutzt werden, um
| für das beste Ergebnis zu optimieren. Ein gutes Ergebnis besteht darin, dass die Zuschauergruppe korrekt vorhergesagt wurde.
Es gibt zwei Arten von Empfänger, mit dem das System arbeiten kann, einen mit Rückkopplungskanal, und einen ohne. Der optionale Rückkopplungskanal ist als eine gestrichelte Linie in 1 angezeigt. Wenn ein Empfänger mit Rückkopplungskanal demographische Information bereitstellt, ist die Aufgabe der Werbung aufgrund der demographischen Gruppe recht klar, wie im Folgenden beschrieben werden soll. Auch ist die Leistung der Werbung leicht messbar. Wenn der Empfänger keine demographische Information der Zuschauer bereitstellt, wird er wie ein Empfänger ohne Rückkopplungskanal behandelt, abgesehen von der Art und Weise, wie die Leistung festgestellt wird, die direkt über den Rückkopplungskanal ermittelt werden kann.
Für Empfänger ohne Rückkopplungskanal sind zwei Verfahren zum Bestimmen der demographischen Gruppe des Zuschauers vorgesehen. Welches Verfahren benutzt wird, hängt vom besseren Entsprechungsprinzip der beiden ab, das durch den Maximum-Entropie-Messwert für P_j der vorangegangenen Ausführungen gemessen wird. Es sollte das Verfahren benutzt werden, das den kleineren Entropiewert erzeugt. Die Leistung der Empfänger ohne Rückkopplungskanal sollte durch Marktforschung gemessen und dann in den Lernkreis eingebracht werden, wie bei solchen mit Rückkopplungskanal.
Die Realzeit-Rückkopplung der Zuschauerhandlung mit demographischer und mit Leistungsinformation existiert natürlich nur, wenn ein Rückkanal für den Empfänger eines Zuschauers vorhanden ist. Er enthält Information des Verhaltensinformationsstroms des Zuschauers sowie die Leistung der demographischen Vorhersage. Der Verhaltensstrom sollte wenigstens die oben genannten Punkte enthalten, nämlich Sehdatum, Sehbeginnzeit, Sehdauer, Sehkanal, und demographische Information. Die Leistung ist eine Zeitliste, um anzuzeigen, ob die Vorhersage des Empfängers richtig ist oder nicht.
Da die demographische Information der Empfänger bekannt ist, kann der Informationsdatenbank-Erfasser (siehe mittlerer Kasten in 1) Änderungen anhand der rückgekoppelten Information vornehmen.
Zusammengefasst zeigt 5 deshalb eine repräsentative nicht-zeitliche Zustandsraum-SSM-Matrix und ihre Operation. Der beispielhafte Kanalzustandsraum benutzt den Übergang von AUS zu den Kanälen 5, 2, 6 und 100, und zurück zum AUS-Zustand, ausgehend von einer leeren Matrix. Der ProfAgent erhöht den betreffenden Übergangsmatrixeintrag für jedes Zustandspaar. Bei dem vorliegenden Beispiel würden die folgenden (von, zu)-Matrixeinträge erhöht (5, EIN), (5,2), (2,6), (6,100), und (100,AUS). Die Besuchshäufigkeit von Kanal 5 ist die Summe aller Einträge in Spalte 5, die globale Wahrscheinlichkeit ist diese Zahl geteilt durch den Matrixgesamtwert. Sobald Kanal 5 eingeschaltet ist, ist die Wahrscheinlichkeit, auf Kanal 2 umzuschalten, der Inhalt von (5,3), geteilt durch die Summe von Zeile 5 (von-Zustände Kanal 5).
Ein ähnlicher Prozess steuert die Akkumulation und Analyse von höherdimensionalen Übergangsmatrizen wie z.B. zeitlichen. Der Mechanismus ist identisch, nur dass der Eintrag in der passenden Zeitintervallebene des Übergangs erhöht wird. Ein wichtiger Unterschied zwischen der Pseudo-VMM-Implementierung und dem theoretischen VMM ist, dass die Zustandsübergänge in der Markow-Kette nicht notwendigerweise von dem letzten Zustand unabhängig sind. So entspricht die Wahrscheinlichkeit, eine Zustandssequenz zu durchlaufen, nicht unbedingt dem Produkt der einzelnen Zustandsübergangswahrscheinlichkeiten. Es handelt sich allerdings um eine untere Schranke. Solange das Zustandsauswahlverhalten des Nutzers gleichmäßig zufällig ist, tendiert das pVMM zum theoretischen VMM. Der Mangel an Übergangsunabhängigkeit löscht nicht die Nützlichkeit eines teilweise zufälligen State-Machine-Modells aus, da das Auswahlverhalten des Nutzers dazu tendiert, ein Gaußsches Auswahlverhalten zu sein, doch es erfordert zusätzliche statistische Information zur Kompensation. Sequenzmodellierung, wie sie hier beschrieben ist, ist ein solcher Versuch.
Die Präferenzbestimmung und die Profilmodellierung, die zuvor beschrieben wurden, können in verschiedenen Zusammenhängen implementiert werden. Hier konzentrieren wir uns auf das zielgerichtete Ausrichten von Werbeinhalt, basierend auf den Präferenzbewertungen und der Profilmodellierung.
6 zeigt die Werbekategorie-Gruppenlernarchitektur, die im Zielrichtungsserver angewandt wird. Die VGM erzeugt m-Gruppen von m Nutzern von einer bestimmten Werbekategorie-Trainingsgruppe. Der Gruppenaggregatorblock extrahiert die repräsentativsten Aspekte der gelernten Gruppen und erzeugt ein typisches Profil der Gruppe. Nach einem Training über n Werbekategorien werden n typische Werbekategorie-Verhaltensprofile erzeugt. Das heißt, 6 zeigt ein Werbekategorie-Verhaltensprototyp-Lernsystem, d.h. die obere Werbekategorie-Gruppenlernarchitektur. Das Modul ist in dem Kopfend-Werbemanager innerhalb des Zielrichtungsservers angeordnet. Gruppenlernen ist ein fortlaufender Prozess des Definierens und Optimierens von Werbekategoriegruppen und ihren korrelierten Verhaltensprofilen, basierend auf qualitativ hochwertigen, markierten und gesammelten TV-Nutzer-Erfassungsdaten. Die demographischen Verhaltensdaten werden entweder von einer dritten Partei und/oder von Feldeinheiten eingegeben. Ein Auswahlfilter extrahiert die Zielwerbekategorie der Trainingsgruppe für die VGM. Die VGM verarbeitet jeden Nutzereintrag in der Trainingsgruppe, als ob er von demselben Nutzer stammen würde, und erzeugt so ein sehr großes Gesamt-VM. Das resultierende VM wird parametrisiert und zu einer Untergruppe von ausschließlich hoch tendenziellen Dimensionen verfeinert, die als die repräsentative Verhaltenssignatur für die Werbekategorie dienen. Dieser Schritt wird als Inter-Prototyp-Verfeinerung bezeichnet, da er nur schlechte, unzureichend tendenzielle Dimensionen aus einem jeweiligen VM entfernt. Die VGM wiederholt diese Prozedur für jede Trainingsgruppe, bis jede Werbekategoriegruppe ein entsprechendes Verhaltenssignaturprofil aufweist, sofern eines existiert. Ein typisches Werbekategorieprofil existiert, wenn, und nur wenn, wenigstens eine Verhaltensdimension eine signifikante Tendenz gegenüber Zufall zeigt. Jede SSM weist eine entsprechende Gruppe von neuartigen Parametrisierungen allgemeiner, charakteristischer Zustandsübergangs-Verhaltensweisen auf, die dazu tendieren, Nutzer zu separieren.
7 zeigt die Verfeinerungsphase des Aufstellens einer Werbekategorievorlage. Diese Phase distanziert die Prototypen, indem die Dimensionen entfernt werden, die zwischen den Kategorien die größte Gemeinsamkeit aufweisen. Die zweite Stufe des Aufstellens von Werbekategorie-Verhaltensprototypen, die hier als Intra-Prototyp-Verfeinerung oder Intra-Profil-Verfeinerung bezeichnet wird, entfernt die Dimensionen jedes VM, die allen anderen entsprechenden VM-Dimensionen ähnlich sind. Dieser Schritt wählt die unterscheidungskräftigsten Dimensionen für alle Zielreferenzprofile auf und erzeugt so eine minimale Beschreibungslänge für jeden Werbekategorieprototyp. Wenn das Resultat dieses Verfeinerungsprozesses das Entfernen aller, oder im Wesentlichen aller, Klassifizierungsdimensionen eines Prototyps ist, werden die ähnlichsten Werbekategorien zu einer einzigen prädiktiven Klasse verschmolzen, so dass die beste Zielrichtungsauflösung des Systems auf die verschmolzenen Werbekategorien reduziert wird. Wenn beispielsweise eine unzureichende Distanz drei männliche Altersgruppen von 20, 30 und 40 Jahren separiert, werden diese Werbeklassen zu einer einzigen Klasse von Männern zwischen 20 und 40 Jahren verschmolzen. Der Zielrichtungsserver sendet die abschließenden Zielrichtungswerbeprofil-Prototypen, ihre Kategoriemarkierungen, und die erwartete Vorhersageleistung an den Werbeserver.
Es folgen die genauen Aspekte des neuartigen Trainings-, Verfeinerungs- und Verschmelzungsverfahrens. Die VGM beginnt den Trainingsprozess durch Erstellen des VM mit markierten Nutzerdaten von den ausgewählten Zielgruppenmitgliedern. Die VGM berechnet Übergangs- und bestimmte Verhaltensmuster von jeder Nutzerhandlung. Übergangszählvorgänge, die von dem VM unterstützt werden, umfassen Änderungen in einem EPG-Programmeintrag, die mit verschiedenen relativen Zeitmaßen auftreten. Eine minimale Vorgangs-Trainingserfassung erscheint als:
<NutzerlD><Datum><Zeit><Kanal><Genre><Titel><Programmlänge>
Da die Trainingsgruppe eine bereits bestehende Datenbank ist, erfolgt das Lernen im Batch-Modus und nicht in Realzeit. Im Batch-Modus werden alle gesehenen Programme innerhalb eines bestimmten Lernfensters zugleich gewertet und geordnet. Die VM-Simulation legt das Lernfenster über die Nutzerdaten oder die Lernperiode. Mit Realzeitdaten ist ein vorübergehender Haltebereich nötig, während ausreichend Indizien gesammelt werden, um den Übergang in eine statistische State-Machine SSM aufzunehmen. Das Lernfenster bestimmt die zeitliche Leistung des Systems. Auf der Serverseite besteht im Allgemeinen keine Speicherbeschränkung, weshalb es nicht nötig ist, möglicherweise weniger bevorzugte Zustände zu löschen, um neue Beobachtungen aufzunehmen. Der Haupteffekt des Lernfensters ist es, die Leistung des VM der Klientenseite über eine Spanne von speicherbegrenzten Nutzer-Geschichtsperioden hinweg einzuschätzen. Ein Ziel der vorliegenden Erfindung ist es, stationäre Verhaltensparameter und ihre typische Varianz zu identifizieren. Wenn die Wahrscheinlichkeitsdichte-Funktion für die Zufallsvariable eine Funktion der Zeit ist, wird der Zufallsprozess als nicht-stationär bezeichnet. Um die statistische Stabilitätsperiode für das nichtstationäre Zufallsprozessverhalten der Gruppe zu bestimmen, wird das Lernfenster ständig angepasst, von einigen Tagen bis zu einigen Monaten. Die annähernde stationäre Periode ist die Größe des Lernfensters, die die beste Korrelation zwischen den Fensterschritten aufweist. Jede Werbekategorie weist potenziell eine unterschiedliche mittlere stationäre Periode auf. Beispielsweise können ältere Menschen für einen breiteren Zeitintervall ein repetitiveres Verhalten als Teenager aufweisen. Der Zielrichtungsserver versorgt den Werbeserver mit erwarteten Lernzeiten, die benötigt werden, um Vorhersagestabilität und Konvergenz für jede Werbekategorie zu erreichen.
8 zeigt das Realzeit-Werbekategorieeinschätzungs-System. Der MitgliedAgent vergleicht das Realzeit-Nutzverhalten des TV-Nutzers mit Werbekategorievorlagen und berechnet eine Wahrscheinlichkeitsverteilung der Werbekategorie des Nutzers.
9 umreißt das TV-Werbezielrichtungssystem gemäß der bevorzugten Ausführungsform. Der ZUSAgent empfängt Werbungen vom TV-Kopfende und interpretiert die Metadaten zur gezielten Ausrichtung der Werbungen. Der ZUSAgent vergleicht das Zielpublikum, das durch den Zielanfrageausdruck der Werbung vorgegeben ist, mit Punkten, die von Vorhersagedaten zur Werbekategorie von Haushaltsnutzern ausgewählt wurden, und erzeugt eine Zielrichtungsbewertung, die der ZUSAgent und der PräsAgent benutzen, um zu bestimmen, welche Werbung jeweils gespeichert und gezeigt werden soll.
Bezug nehmend auf 10, ist die Architektur der Präferenz-Bestimmungsmaschine gemäß der Erfindung dargestellt. Der Profilerstellungsagent (ProfAgent) bringt das Verhaltensmodell VM mit jedem Inhaltsänderungsvorgang schrittweise auf den neuesten Stand. Zunächst wird der Vorgang in Zustände und, wenn vorhanden, zeitliche Beziehungen aufgeteilt. Gefallende Zustände sind alle modellierten Aspekte, Merkmale oder Nutzungen, die einem gefallenden Programm zugeordnet sind. Der ProfAgent empfängt Programmpräferenzbewertungen von der Präferenz-Bestimmungsmaschine (PBMA). Die PBMA bestimmt ein gefallendes Programm durch Werten des Wahlnetzwerks aus 10. Es gibt drei Hauptkomponenten der PBMA, das Realzeitinhalts- und Kontextpräferenz-Lernen (ProfAgent), die Präferenzvorhersage (VorhersAgent), und einen VMA-Agenten. Eine Beschreibung des VorhersAgenten folgt dem Überblick über den ProfAgent. Die Ausgabe ist eine wahrnehmungsartige gewichtete lineare unscharfe Wahl-Kombination der zuvor aufgezählten Präferenzmessfilter (PMF):
Der Lernalgorithmus des ProfAgenten

– Einleitung 1. Alle n Gewichtungen auf 1/n einstellen 2. ρ, δ und η auf konservative Schätzungen einstellen (z.B. ρ_p = ρ_n = 0, η_p = ,1, η_n = δ = ,05), wobei ρ ein versuchsabhängiger Lernmomentausdruck ist. η ist eine versuchsunabhängige Lernrate. Die tief gestellten Indizes n und p entsprechen jeweils einem negativen bzw. einem positiven Vorgang.
– Berechnung der Ausgabeaktivierung O 3. 0 = Σw_i·V_i für alle i = 1 zu n Wobei V_i die unscharfe Ausgabewahl der PMF ist.
– Gewichtungstraining 4. Für jeden positiven Vorgang: w_i(t + 1) = w_i(t) + η_pw_i(t), für alle V_i ≥ θ w_i(t + 1) = w_i(t) – η_pw_i(t), für alle V_i < θ 5. Für jeden negativen Vorgang: w_i(t + 1) = w_i(t) – η_nw_i(t), für alle V_i ≥ θ w_i(t + 1) = w_i(t) + η_nw_i(t), für alle V_i < θ θ ist der minimale unscharfe Gefallenswahlschwellenwert.
– Aktualisierte Lernrate 6. Im Fall eines positiven Vorgangs: ρ_p(t + 1) = ρ_p(t) + ρ_p(t)·(0(t) – O(t – 1)MAX_STIMME) η_p(t + 1) = η_p(t) + η_p(t)·ρ_p(t + 1) + δ η_nt + 1) = η_n(t) – η_n(t)·ρ_p(t + 1) – δ 7. Im Fall eines negativen Vorgangs: ρ_n(t + 1) = ρ_n(t) + ρ_n(t)·(O(t – 1) – O(t)MAX_STIMME) η_n(t + 1) = η_n(t) + η_n(t)·ρ_n(t + 1) + δ η_pt + 1) = η_p(t) – η_p(t)·ρ_n(t + 1) – δ δ ist ein frequenzverstärkender Ausdruck.

Der ProfAgent passt die Gewichtungen des einzelschichtigen n-Knotennetzes gemäß einem bestärkenden Lernschema an. Die n Gewichtungen, vorzugsweise nutzerspezifisch, werden ebenfalls auf 1/n initialisiert; d.h., alle PMF haben eine gleiche Stimme. Jedes Mal, wenn der Benutzer dasselbe Programm besucht, verstärkt das Trainingsregime Knoten, die das Programm als gefallend bestimmen, und vernachlässigt die übrigen. Diese Philosophie bestätigt Präferenzvorhersagen durch Beobachtungsfrequenz. Um Stabilität und Konvergenz zu fördern, wendet eine Lernrate η ein inkrementales Bestärkungssignal an, um Gewichtungen anzupassen.
Zwei Lernraten steuern den Trainingsprozess, eine negative (η_n) und eine positive (η_n) Vorgangsrate. Ein positiver Vorgang liegt vor, wenn der Nutzer das Programm wählt, und ein negativer Vorgang liegt vor, wenn ein Programm in einem zuvor gefallenden Kontext verfügbar war, aber ein anderes Programm gewählt wurde. In der Praxis ist mehr Kausalinformation in positiven Beispielen als in negativen vorhanden. Daher ist η_p normalerweise viel höher als η_n. Der Momentausdruck ρ_p(ρ_n) erhöht (senkt) Trainingsbelohnungen, wenn die Präferenzstimmausgabe einen zunehmenden (sinkenden) Präferenztrend zwischen positiven (negativen) Vorgängen anzeigt, und senkt η_p(η_n), um eine positive (negative) Lerntendenz widerzuspiegeln. Der Lernratenausdruck δ bestärkt die Programmbesuchsfrequenz. Diese Bestärkung ist für jeden positiven Vorgang positiv, und ansonsten negativ. Im Laufe der Zeit erlernt das vorliegende Präferenzlernsystem automatisch die PMFs, die die Programmpräferenz am besten vorhersagen, und gibt den übrigen weniger Vorrang. Die Lernraten werden angepasst, um sich an die Zeitkonstante von periodischen Präferenzverschiebungen der Nutzer anzunähern. Alle PMFs geben einen unscharfen Präferenzbewerfungsbereich in Schritten von einem minimalen Bewertungswert (z.B. HASST_PROGRAMM=1) bis zu einem maximalen Wert (z.B. OBERES_PROGRAMM=MAX_STIMME=6) aus.
θ ist der Wert der minimalen unscharfen Zugehörigkeit, der wenigstens ein gefallendes Programm anzeigt (z.B. V_i=MAG_PROGRAMM/MAX_STIMME=4/6=0,66). Die PMF-Bestärkung wird durch den Vergleich der Stimme einer PMF mit θ bestimmt. Eine Stimme ist positiv, wenn V_i ≥ θ, und ist ansonsten negativ. Der Effekt ist, dass eine PMF-Stimmgewichtung belohnt wird, wenn sie während eines positiven (negativen) Programmsehvorgangs positiv (negativ) stimmt, und anderenfalls vernachlässigt wird.
Die PBMA berechnet die Präferenzbewertung R des Programms oder jedes anderen Zustandstypen wie folgt:

– Wenn das Programm bereits ein Zustand in einer SSM ist:
O_k ist die chronologisch geordnete Reihe von Präferenzstimmen für das Programm. t ist die Anzahl neuerer Bewertungen des Programms, t Punkte zur aktuellen Wahl O. q ist die Anzahl vergangener Bewertungen, um den gleitenden Mittelwert mit einzubeziehen. c ist eine zeitliche Gewichtungskoeffizientenreihe, wobei c_k<=1. λ(t) ist ein versuchsunabhängiger, aber häufigkeitsabhängiger Tendenzausdruck, wobei λ(t)<=1.
– Wenn das Programm noch kein Zustand in einer SSM ist R = O

Die Präferenzbewertung R eines Programms ist ein gewichteter gleitender Mittelwert der aktuellen und vergangenen Programmpräferenzstimmen. Ein Fachmann im Systemdesign stellt die Verteilung c_k auf die gewünschte zeitliche Tendenz vergangener Wertungen ein. Üblicherweise sinkt im Laufe der Zeit der Wert alter Information, weshalb die Wertungen im Laufe der Zeit an Wert verlieren. λ(t) erhöht proportional die Gesamtwertung, je nach dem, wie oft das Programm gewertet wurde. λ(t) ist vorzugsweise eine kleine und langsam zunehmende Funktion der Sehhäufigkeit; z.B. λ(t)=c·log(t)=[0, 0,03, 0,05, 0,1, 0,12, 0,15...]. Der Effekt von λ(t) ist es, eine umso größere Präferenz für ein Programm anzuzeigen, je öfter es gesehen wird, unabhängig von der PMF-Stimme.
Wenn beispielsweise ein Zuschauer immer nur die ersten 20 Minuten der Tonight Show sieht, wäre die Wertung des Programms niedrig, während der Häufigkeitsausdruck λ(t) stetig, beispielsweise logarithmisch, die Wertung erhöhen würde, um die Dauerhaftigkeit der Sehpräferenz widerzuspiegeln; z.B. eine 3 % höhere Wertung nach 3 Malen, und 12 % nach 5 Malen usw. Alle Zustandstypen, die einem Programm zugeordnet sind, erben die effektive Präferenzstimme O des Programms.
Wenn beispielsweise das Programm eine GEFALLEND-Wertung aufweist, erhalten sein Genre, Kanal, Schauspieler usw. ebenfalls eine GEFALLEND-Wertung. Die PBMA berechnet eine Präferenzwertung R eines Zustandskandidaten, wie für das Beispiel Titel oben beschrieben, dargestellt in Gleichung (1). Wenn beispielsweise ein Nutzer zwei Komödienserien gesehen hat, „Seinfeld" dabei mit einer GEFALLEND-Wertung, und dann eine ganze Zeit später „Friends" mit einer INTERESSIERT-Wertung sieht, dann ist O₁=GEFALLEND=4, UND O₂=INTERESSIERT=3, und dann ist die Präferenzwertung des Zustands Komödie_Serie (mit c₁=0,9, c₂=1, λ(2)=0,03):
In diesem Fall wurde die ältere Stimme um 10 % gesenkt, da eine lange Zeit zwischen den Programmsehvorgängen verstrichen ist. Da allerdings dasselbe Genre zweimal gesehen wurde, erhielt die Wertung eine Erhöhung um 3 %. Derselbe Präferenzwertungs-Algorithmus gilt für jeden Zustandstyp.
Für jedes gesehene Programm leitet die PBMA eine Kandidaten-Zustandspräferenzbewertung an den ProfAgenten weiter, um das VM entsprechend den vorgegebenen Algorithmen anzupassen. Die PBMA weist die VGM an, alle Nutzer-Trainingsdaten zu verarbeiten, als würden sie von einem Nutzer stammen, so dass ein einziges VM erzeugt wird, das Verhaltensinformationen für alle Klassenmitglieder enthält.
Die Stimmausgabe des ProfAgenten wird in einer Stimmgeschichtsdatenbank (STIMMdbank) gespeichert, die der ProfAgent wie hier beschrieben benutzt, um die am stärksten bevorzugten Zustände zu bestimmen, die in der VMdbank behalten werden sollen. Der VorhersAgent benutzt die STIMMdbank ebenfalls, wenn er Anfragen durch den Präferenz-Bestimmungsagenten PräfAgent zum Bewerten von Inhaltsparameterpräferenzen beantwortet. Der PräfAgent und seine Funktion sind in der gemeinschaftlich erteilten, parallelen Patentanmeldung [Docket Nr. 155785-0006/P01862, basierend auf den vorläufigen Anmeldungen 60/215,450 und 60/226,437] näher beschrieben. Die Offenbarung der parallelen Anmeldung wird hiermit durch Querverweis zitiert.
Ein Aufzeichnungsmanager veranlasst die Aufzeichnung von Programmen, indem periodisch eine Aufzeichnungssequenz eingeleitet wird. Zu diesem Zweck sendet der Aufzeichnungsmanager eine Anfrage an den Präferenzagenten PräfAgent zu Wertungen aller Programme zu einem bestimmten Zeitpunkt (X), oder alternativ zu Wertungen aller Programme innerhalb einer bestimmten Zeitperiode (X). In einigen Ausführungsformen kann die Häufigkeit, mit der die Schritte durchgeführt werden, durch den Nutzer veränderbar sein. Der Präferenzagent antwortet durch Bereitstellen von Bewertungen aus einer Präferenzdatenbank, für jedes Programm, das von dem Aufzeichnungsmanager empfangen wird. Der Aufzeichnungsmanager veranlasst dann das Aufzeichnen der Programme zum Zeitpunkt X, oder innerhalb der Zeitperiode X, gemäß den Wertungen, die von dem Präferenzagenten empfangen wurden.
Der Präferenzagent überwacht die Sehauswahl der verschiedenen Zuschauer mit Hilfe des Steuersystems und erzeugt Sehprofile jedes Zuschauers, die in der Präferenzdatenbank gespeichert werden. Basierend auf diesen Profilen geht der Präferenzagent durch den eingehenden Programminhalt, wie er in der EPG-Information beschrieben ist, um Listen wie die „Top 10"-Liste der Sehmöglichkeiten zu erstellen, die dem Nutzer zu einem jeweiligen Zeitpunkt zur Verfügung stehen, und weist den Aufzeichnungsmanager an, die am höchsten positionierten Programme, die zu einem bestimmten Zeitpunkt ausgestrahlt werden (einschließlich aller vom Zuschauer zum Aufnehmen ausgewählten Programme), aufzunehmen, und in einer Speichervorrichtung für gespeicherte Programme zu speichern. Der Präferenzagent enthält ferner Software, die es ermöglicht, ein demographisches Profil für jeden Nutzer zu erstellen, basierend auf dem Sehprofil des Zuschauers und auf bestimmten Algorithmen oder zuordnenden Regeln. Diese Algorithmen können im Laufe der Zeit angepasst werden, während das Modell, das von dem System angewandt wird, verstärkt wird, und sich seine Genauigkeit verbessert. Zu diesem Zweck kann der Systemaktualisierungs-Informationskanal, der in dem Ausstrahlungssignal enthalten ist, periodische Softwareaktualisierungen beinhalten, einschließlich neuer Präferenzdatenbank-Parameter, die auf Wunsch der Werbeschalter miteinbezogen werden müssen. So kann das Steuersystem in einer Ausführungsform entfernt aktualisiert werden, um neue Anforderungen zu erfüllen, die entstehen können, wenn die Anbieter von Werbeinhalten sich mit dem System und dem Prozess der Maßanfertigung eng fokussierter, zielgerecht ausgerichteter Werbung vertraut gemacht haben. Das demographische Profil, das für jeden Zuschauer erzeugt wird, wird in einer demographischen Datenbank gespeichert, die in dem Steuersystem angeordnet ist und so die Privatsphäre des Nutzers sicherstellt.
Der Präferenzagent geht außerdem durch den Werbeinhalt, der durch mehrere Werbekanäle einströmt, die in dem Sendesignal enthalten sind, und, basierend auf den demographischen Profilen der Zuschauer und den Metadaten, die in jeder Werbung zum Beschreiben des Zielpublikums für eine bestimmte Werbung enthalten sind, speichert und/oder veranlasst die Anzeige von bestimmter Werbung. Das Steuersystem kann jedes der verschiedenen Verfahren zum Manipulieren des Werbeinhalts benutzen, die unten beschrieben sind.
Der VorhersAgent kombiniert Information zur Präferenzstimmgeschichte mit kontextabhängigen VM-Präferenzen, um eine Bewertung zu erzeugen, die der ZUSAgent oder andere Systemmodule benutzen, um präferenzbezogene Entscheidungen zu treffen.
Der VorhersAgent summiert historische Stimmen, um eine Gesamtwertung für den modellierten Zustand zu erzeugen. Der VorhersAgent weist dieselbe Lernarchitektur auf wie der ProfAgent. Anders als der ProfAgent allerdings, der lernt, beitragende Messwerte aufzuweisen, lernt der VorhersAgent die optimalen statistischen Moment-für-Moment-Parameter. Anstelle von PMF-Eingaben gibt es drei statistische Eingaben zur Stimmgeschichte: Stichprobenzahl, Stichprobenmaximum, und Stichprobenminimum, und ihre folgenden jeweiligen Stimmgewichtungen:

– CntPctKoef, Gewichtung der Häufigkeit, mit der der Zustand besucht wurde
– MaxPctKoef, Gewichtung der beobachteten Maximalstimme
- MinPctKoef, Gewichtung der beobachteten Minimalstimme

Folgendes ist der Pseudocode für die Berechnung der Präferenzwertung im beispielhaften Titelzustandsfall:
gültigeZustände=finde(cntLTitelStimme);
TeffMinStimme=mittlLTitleVote-sdvLTitelStimme;
maxTcnt=max(cntLTitelStimme(gültigeZustände));
maxTmax=max(maxLTitelStimme(gültigeZustände));
TcntAdj=log(cntLTitelStimme(gültigeZustände))/log(maxTcnt) – log(mittl(cntLTitelStimme(gültigeZustände)))/log(maxTcnt);
TmaxAdj=log(maxLTitelStimme(gültigeZustände))/log(maxTmax) – log(mittl(maxLTitelStimme(gültigeZustände)))/log(maxTmax);
TminAdj=(minLTitelStimme(gültigeZustände) – mean(minLTitelStimme(gültigeZustände)))/MAxTITEISTIMME;
TeffStimm=TeffMinStimme + TeffMinStimme.·(TcntAdj·cntPctKoef + TmaxAdj·maxPctKoef + TminAd j·minPctKoef);
Für die Stimmen wird eine Gaußsche Verteilung angenommen, und eine konservative Bewertung ist wünschenswert. Dies ist eine Stimmgruppenklassifikationsgrenze. MaxTcnt, und maxTmax sind normierende Maxima für alle Zustandsbesuchszähler, und die höchste maximale Stimme. Gelernte Anpassungsfaktoren stellen TeffMinStimme gemäß den erlernten Anpassungen TcntAdj, TmaxAdj, und TminAdj ein. Diese Stimmanpassungsparameter reichen von null bis eins, und wachsen logarithmisch durch Stimulation an, und werden weiter durch ihren jeweiligen Mittelwert normiert. Eine solche Wertungsrichtlinie zieht fortlaufend hohe beobachtete Wertungen instabilen Präferenzwertungen vor, auch wenn diese ein mittleres Hoch aufweisen. Der Zustandszähler-Anpassungsfaktor stellt eine positive (negative) Tendenz zu mehr (weniger) häufig gesehenen Zuständen her. So könnte eine hohe Präferenzstimme für einen Actionfilm eines einmaligen Vorgangs eine niedrigere Bewertung erhalten als ein täglicher Stimmmittelwert für eine Komödienserie. Dieser Gleichungsausdruck trägt dazu bei, Fälle zu überwinden, in denen die Präferenzwertung aus irgendeinem Grund ungenau niedrig ist, obwohl das wiederholte Nutzerverhalten eine höhere Stimme rechtfertigt. Der Ausdruck TmaxAdj trägt dazu bei, der Präferenzwertung im Verhältnis zu Präferenzspanne der Nutzer Bedeutung zu verleihen. Das heißt, wenn ein Nutzer niemals eine sehr hohe Wertung gezeigt hat, und zwar möglicherweise aufgrund schlechter Systemleistung, sollten Wertungen, die sich dem persönlichen Maximum des Nutzers annähern, nach oben verschoben werden, um eine relativ hohe Wertung für diesen Benutzer anzuzeigen. Dies ist insbesondere dann nützlich, wenn z.B. Wertungen zwischen Nutzern im Fall einer Multi-Nutzer-ID verglichen werden. Der Verschiebungsausdruck TminAdj für das Stimmaktivierungsniveau bevorzugt Zustandsstimmen, die im Verhältnis zu allen verwandten Zuständen signifikant von der mittleren Minimalstimme abweichen. Dies ist eine weiche gierige Stimmversatzstrategie, die die niedrigsten Antworten des Nutzers als Referenzpunkt benutzt, um eine hohe Sicherheit für verhältnismäßig höhere Wertungen abzuleiten.
Die PBMA benutzt die global angepassten Präferenzwertungen des VorhersAgent, um die Zustände zu ermitteln, die gegen stärker bevorzugte Zustände auszutauschen sind, wenn aufgrund von Speicherbeschränkungen ein maximaler Zustandszählwert erreicht ist. Dabei wird das VM ständig aktualisiert, um die relevantesten Zustände zu enthalten (potenziell alle besuchten Zustände, wenn der Speicher dies zulässt).
Der nächste Schritt des Prozesses zum Aufbau des Werbekategorieprototyps ist es, das VM in einen pseudo-euklidischen Raum zu parametrisieren. Da die Modellierungsdatenstrukturen im VM nicht eindimensionale Gaußsche Verteilungen sind, ist das Bestimmen der Distanz zwischen zwei VMs ein schwieriger und ungenauer Prozess, wenn Verfahren des Stands der Technik benutzt werden. Verfahren des Stands der Technik nehmen an, dass Stichprobendaten eine glockenförmige Verteilung aufweisen, und modellieren die Daten auf Gaußsche Art und Weise, definiert durch ein Mittel μ und Varianz σ. Wie jedoch in 11, 13 und 14 gezeigt, sind Stichproben in verschiedenen modellierten Kategorien nicht normal verteilt, sondern exponentiell, beta, gleichmäßig, delta, oder multimodal. Es ist wichtig, dass Übergangsmatrizen sich nicht für die Standarddistanzmetrik eignen, die zum Bestimmen einer Gruppenzugehörigkeit benötigt wird. Bekannte Klassifizierungsverfahren definieren einen euklidischen Merkmalsraum, der aus Gruppennachbarschaften besteht, die um das Gruppenmittel μ herum angeordnet sind, und dessen Gruppengrenzen sich von σ nach μ erstrecken. Üblicherweise wird die Mahaloanobis-Distanz benutzt, um Gruppenzugehörigkeit zu unterscheiden. Die Mahaloanobis-Distanz ist schlicht die euklidische Distanz, geteilt durch das dimensionale σ jeder Gruppe, oder, (μ₁ – μ₂)^TΣ – 1(μ₁ – μ₂), wobei Σ die gegenseitige Kovarianzmatrix ist
Dieses Verfahren ist sehr ungenau, und bei TV-Systemen unpraktisch. Es ist aus zwei Hauptgründen ungenau: Es geht fälschlicherweise von Gaußschen Stichprobendaten aus, und die Umkehrung der Kovarianzmatrix führt zu signifikanten Abrundungsfehlern des Gleitkommas, welche die Matrix oft singulär machen. In hochdimensionalem Raum, z.B. über 100, kann das Berechnen und Umkehren einer Kovarianzmatrix aufgrund von CPU-Zeit- und Speicherverbrauch ausgeschlossen werden. Bei einer üblichen sparsamen Stichprobenmatrix müssen viele unnötige Kreuzkorrelationsausdrücke manipuliert werden. Standardverfahren sind in ähnlicher Weise nicht anwendbar, um die Distanz zwischen entsprechenden SSMs zu bestimmen. Es besteht also Bedarf nach einer neuartigen Strategie zum Darstellen multimodaler Gruppen und der Distanzen zwischen ihnen.
Das VM ist in drei allgemeine Klassen von Verhaltensdimensions-Datenarten parametrisiert: Histogramm, skalar, diskret. Um SSMs in einem Klassifizierungsraum darzustellen, werden allgemeine, momentunabhängige Verhaltensmuster identifiziert, und als dimensionale Klassifizierungsparameter extrahiert. Jeder Matrixparameter ist ein pseudo-euklidischer Klassifizierungsraum.
Einige typische SSM-Parameterkategorien sind:

1. Übergangstendenz-Histogramm
2. Selbstübergangstendenz-Histogramm
3. Einschalt(Ausschalt)-Zustandstyptendenz-Histogramm
4. Übergangsumkehrfendenz-Histogramm
5. Einzelübergangsverhältnis
6. SSM-Matrix-Stichprobensicherheit
7. Tendenz zu oberen n Zuständen
8. Obere n Zustände

Punkte 1 bis 4 sind Verteilungen der beobachteten Tendenz für die entsprechenden Verhaltensmuster. Punkt 1 stellt die Stärke der Tendenz für zufällig auftretende Übergänge dar.
Eine andere wichtige Verhaltenskategorie, Punkt 2, ist, wie wahrscheinlich Übergänge zurück zum ursprünglichen Zustand sind, d.h. von einer Komödie zu einer Komödie. Punkt 3 erfasst den erwarteten Sitzungsstart oder das erwartete Sitzungsende eines Nutzers, für alle Zustandstypen. Punkt 4 stellt eine Verteilung von Tendenzstärken zum Übergang eher in die eine Richtung als in die andere dar. Einige skalare Parameter umfassen das Verhältnis einzelner zu allen Übergängen, Punkt 5, nicht-zufällige Matrixtendenzen, Punkt 6, und die Tendenz, in die oberen SSM-Zustände überzugehen.
Das Zustandssequenzmodell für alle Zustandstypen weist allgemeine Parametrisierungen auf, darunter: Sequenzlängen-Histogramm. Verhältnis der individuellen Sequenzzustände zu allen besuchten Zuständen. Anteil gefallender Zustände an allen besuchten Zuständen. Sequenzzustandsfokus. Maximale Sequenzlänge. Verhältnis der Sequenzübergänge zu allen Einzelübergängen.
Klassifizierungsdimensionen bezüglich des Sprung-Verhaltens sind vorzugsweise wie folgt parametrisiert: T_w/T_a-Histogramm, Δt/T_a, Histogramm für Programmteilzeiten zwischen den Sprüngen. Δt, Histogramm von Zeiten zwischen Sprüngen, und ein Histogramm der Anzahl von Sprüngen pro Programm.
Schließlich benutzt das System verschiedene programmbezogene Merkmaldimensionen. Diese Dimensionen umfassen: T_w/trans, Sehzeit pro Übergangshistogramm. T_w/prog, Sehzeit pro Programmhistogramm. Werbe-T_w/T_a, Histogramm zur gesehenen Werbezeit pro verfügbare Zeit. T_w/sitzung, Histogramm zur Sehzeit pro Fernsehsitzung. Starttageszeit des gesehenen Programms. Histogramme T_m/T_a, T_w/T_a, T_l/T_a. Und Anzahl individueller Zustände, die pro Periode besucht wurden.
Eine genaue Auflistung parametrisierter Dimensionen, die in der VGM benutzt werden, brauchen nicht im Rahmen dieser Beschreibung bereitgestellt zu werden. Fachleute auf dem entsprechenden Gebiet sind leicht dazu in der Lage, die nötigen Parameterdimensionen aufzustellen, einschließlich Variationen, Parametrisierungen, und Extrapolationen.
Der neuartige Algorithmus zum Berechnen der Tendenz bestimmt die qualitative Beweislage für einen nicht-gleichmäßig zufälligen Auswahlprozess; und daher die Wahrscheinlichkeit bedeutsamer Verhaltensinformation. Die erwartete Bin-Abdeckung einer gleichmäßig zufälligen Matrix wird mit Hilfe der Binomialverteilung berechnet. Jede Nutzerhandlung wird als ein Bestehen/Nichtbestehen-Vorgang betrachtet, um einen bestimmten Bin zu füllen. Die Anzahl der Versuche in den binomialen Experimenten, oder Zustandsübergängen, ist die Anzahl der Übergänge in der Matrix. Die Wahrscheinlichkeit eines Vorgangserfolgs, oder das Füllen eines bestimmten Matrix-Bins, ist die gleichmäßig zufällige Wahrscheinlichkeit, dass ein Bin ausgewählt wird. Die binomiale Wahrscheinlichkeit, dass ein bestimmter Bin nach einer bestimmten Anzahl von Versuchen gefüllt wird, ergibt die Anzahl von Bins in der Matrix, von denen erwartet wird, dass sie durch einen Zufallsprozess gefüllt werden. So zeigt das Verhältnis der Anzahl von Bins, die durch einen gleichmäßig zufälligen Prozess gefüllt würden, zu der tatsächlichen Anzahl gefüllter Bins, einen tendenziellen, oder nicht-gleichmäßig zufälligen Prozess hinter der Zustandsübergangsauswahl. Der Tendenzmesswert ist zusätzlich ein quantitativer Indikator einer statistisch signifikanten Stichprobengröße. Wenn nicht genug Stichproben in der Matrix vorliegen, um einen nicht-zufälligen SSM-Übergangsprozess herzuleiten, ist der Tendenzmesswert weniger als oder gleich eins. Verfahren des Stands der Technik verlangen im Allgemeinen n² Stichproben in einer n mal n Matrix, um zu bestimmen, ob erwartet wird, dass die Kovarianzmatrix statistisch signifikant ist. Diese Anforderung ist nicht erfüllbar, wenn n größer wird. Für eine 30 × 30 Matrix verlangen übliche Verfahren 30 × 30, oder 900 Stichproben, was in einem kurzen Zeitraum der Nutzer-TV-Nutzung unmöglich zu erzielen ist. Der Grund, warum der Stand der Technik diese Beschränkung aufweist, ist, dass ausreichend Information benötigt wird, um Sicherheit für alle Kreuzkorrelationsausdrücke in der Kovarianzmatrix zu erlangen, da es kein a-priori-Verfahren gibt, um vorherzusagen, welcher signifikant ist, auch wenn die große Mehrheit dieser Ausdrücke null ist. Das vorliegende Verfahren zum Ermitteln einer Matrixtendenz bestimmt die statistische Signifikanz fortlaufend, und läuft oft in Stichproben des Umfangs n zusammen.
Es folgt eine genaue Berechnungsbeschreibung des Verfahrens zur Tendenzschätzung, in seiner Anwendung auf die Übergangsmatrix Gefallende_Kanäle.
Die Pseudocode-Funktionsdefinitionen umfassen:
sum(X) – summiert die Spalten von Matrix X, wenn X eine Arraysumme ist, Elemente zu einem skalaren Ergebnis
länge(X) – liefert die größte Matrixdimensionslänge von X
finde(X) – ergibt alle Nicht-Null-Elemente von X
X(1:5,1:5) – ergibt eine Submatrix X', die aus Zeilen 1 bis 5 und Spalten 1 bis 5 von X aufgebaut ist
Y=binocdf(X,N,P) ergibt die binomiale kumulative Verteilungsfunktion mit den Parametern N und
P an den Werfen in X.
union(A,B) – wenn A und B Vektoren sind, ergibt dies die kombinierten Werfe von A und B, aber ohne Wiederholungen.
sqrt(X) – Quadratwurzel der Elemente von X
sort(X) – ordnet die Elemente von X in absteigender Reihenfolge.
Die folgenden Regeln gelten für gleichmäßig zufällige Matrixberechnungen:

1. gleichmäßige Wahrscheinlichkeit des Übergangs in einen bestimmten Zustand aus einem bestimmten Zustand: Ptrans_zuf= 1/NUM_GEFALLENDE_KANAL_ZUSTÄNDE-1);
2. gleichmäßige Wahrscheinlichkeit, einen möglichen Übergang zu wählen (ohne den Zustand Fernsehgerät AUS zu zählen): zustand Prob= 1/sum(sum(GefallendKanalTransMtx(1:NUM_GEFALLENDE_KANAL_ZUSTÄNDE,2:NUM_GEF ALLENDE_KANAL_ZUSTÄNDE)));
3. gleichmäßige Wahrscheinlichkeit, eine Nutzersitzung in einem bestimmten Zustand zu beginnen oder zu beenden: PonAUSRand=1/(NUM_GEFALLENDE_KANAL_ZUSTÄNDE-1);
4. Tendenzvektor zum Beginnen in einem bestimmten Zustand (zustandAUStendenz ähnlich): zustandEINtendenz= (GefallendKanalTransMtx(SEHBEGINN,1:NUM_GEFALLENDE_KANAL_ZUSTÄNDE)/EIN_SITZ UNGEN)/PonAusZuf;
5. Tendenz über Zufall des Surfbeginns ZuschrLchEinSurfTendenz(Zuschauer_idx)= zustandEINtendenz(SURFEN);
6. Tendenz über Zufall des Beginns in einem nicht gefallenden Zustand: ViewrChanOnUnlikeBias(viewer_idx)= stateONbias(UNLIKED)

Die Berechnung der Matrixstichproben-Konzentrationstendenz folgt diesen Regeln:

1. Tendenz als multipel über gleichmäßig zufällig für Nicht-Beginn-Endzustandsübergänge: tendenz_mtx=(GefallendKanalTransMtx(2:NUM_GEFALLENDE_KANAL_ZUSTÄNDE, 2:NUM_GEFALLENDE_KANAL_ZUSTÄNDE)/Num_trans)/Ptrans_zuf;
2. Anzahl individueller Übergänge zwischen Nicht-Beginn-Endzuständen, die von dem Nutzer besucht werden: numGefüllteBins=Länge(finde(tendenz_mtx(:)));
3. Anzahl individueller Übergänge zwischen möglichen Nicht-Beginn-Endzuständen: numBins2Füll=länge(tendenz_mtx)^2;
4. Anteil möglicher Bins, die tatsächlich gefüllt sind: mtxFüllRatio=numGefüllteBins/numBins2Füll;
5. Binomiale Bin-Auswahlerwartung bezüglich der Anzahl von Stichproben und gleichmäßig zufälligem Erfolgsverhältnis: ExpAbdeckung=1-binocdf(minHitsPbin-1,Num_trans,1/numBins2Füll);
6. Tatsächlich beobachtetes Bin-Füllerfolgsverhältnis: AktAbdeckung=numGefüllteBins/numBins2Füll
7. ZuschrLchMtxSich(zuschauer_idx)=ExpAbdeckunglAktAbdeckung

Das Matrix-Sicherheitsverhältnis (MtxSich) zeigt die Wahrscheinlichkeit einer nicht zufälligen Prozesstendenz an. So tendiert sie dazu, Sicherheit darüber zu geben, dass eine Stichprobengruppe groß genug ist, um herzuleiten, dass sie einen nicht-gleichmäßig zufälligen Ursprung hat. Durch Erhöhen der minimalen Trefferzahl oder Erfolgszahl pro Bin (minHitsPbin) wird die Sicherheit einer adäquaten minimalen Stichproben-Gruppengröße erhöht (üblicherweise ist minHitsPbin=1 praktisch). Im Weibekategorie-Prototypbildungsprozess folgt auf den VM-parametrisierten Schritt die Interprototyp- oder lokale Verfeinerung. Dimensionen mit hoher Varianz oder, ebenso, niedriger Tendenz werden entfernt. Die repräsentativsten Klassifizierungsmerkmale sind die, die eine enge Stichproben-Verteilung aufweisen. Merkmale mit gleichmäßigeren Verteilungsdaten nähern sich einer gleichmäßig zufälligen Verteilung an, und sind bei der Unterscheidung von Gruppen nicht so nützlich. Eine typische Verfeinerungsabscheidung ist eine Standardabweichung für auf Gaußsche Art und Weise modellierte skalare Merkmale (σ_cut), und anderenfalls eine Tendenz (β_cut) von weniger als oder gleich einer gleichmäßig zufälligen erwarteten Stichprobenverteilung. Der Systemdesigner erzielt ein zunehmend striktes Verfeinerungskriterium durch Senken von σ_cut und Erhöhen von β_cut. Ein zu striktes Verfeinern führt dazu, dass wertvolle Gruppenseparationsinformation verloren geht, und könnte zu einem leeren Prototyp führen, indem alle Dimensionen entfernt werden. Ein zu lockerer Schwellenwert führt zu einem Verlust der Klassifizierungsleistung, indem zu viele nicht prädiktive Merkmale einbezogen werden. Das Produkt der Interprototyp-Verfeinerungsphase ist ein vorläufiger Werbekategorievorlagen-Prototyp. Die vorangegangenen Algorithmen werden auf jede Trainingsgruppe angewandt, was für jede ein lokal verfeinertes, möglicherweise leeres Referenzprofil erzeugt.
Nach der lokalen Prototypverfeinerung entfernt globales oder Intraprototyp-Verfeinern weiter überflüssige Information. Auf dieser Verfeinerungsstufe wird jeder Werbekategorie-Prototyp mit jedem anderen verglichen, und Dimensionen, die keine der Gruppen separieren, werden entfernt. Um Gruppendistanzen mit nichtskalaren, nicht-Gaußschen Dimensionen zu messen, ist jedoch ein neuartiges Verfahren notwendig. Allerdings korreliert, oder bewahrt, das VM die Merkmalwerte für jede Beobachtung nicht. Stattdessen halten alle Stichprobendaten-Dimensionen die beobachteten Merkmalwerte in ihren jeweiligen Verteilungsmodellier-Histogrammen fest, wenn sie unabhängig von Zeit und anderen Dimensionen auftreten. So ist es nicht möglich, Gruppen als Stichprobenpunkte des VM in einem n-dimensionalen euklidischen Raum zu definieren. Es ist wichtig, dass dieser übliche klassifizierende Gruppierungsansatz exponentiell mehr Speicherplatz zum Speichern jedes Stichprobenpunktes und seiner Übergangsgeschichte im Merkmalraum erfordert. Stattdessen ist der vorliegende Merkmalraum ein n-dimensionaler pseudo-euklidischer Aufbau, der absolute Distanzen durch relative Korrelationen zwischen Gruppen ersetzt. Da die Stichprobenpunkte in jedem Dimensionshistogramm keine dimensionsübergreifende Korrelation aufweisen, weist keine Gruppe eine räumliche Nachbarschaftsdarstellung auf. In hochdimensionalen Merkmalräumen ist eine Gruppennachbarschaft vor allem dann nützlich, wenn eine Gaußsche Verteilung der Stichproben vorliegt, da die varianzangepassten Gruppenmittel benutzt werden, um Distanzen zu berechnen. Bei multimodalen Verteilungen allerdings, d.h., nicht glockenförmigen, wie es hier der Fall ist, bietet diese Darstellung wenige Vorteile, da die euklidische Distanz nicht länger im üblichen Sinn zutrifft. Diskrete Merkmalvariablen, wie z.B. Programmnamen, stellen im euklidischen Raum eine zusätzliche Komplikation dar, indem sie keine numerischen Entsprechungen der Merkmaldimensionen sind, sondern Gruppentheoriedarstellungen. Um die Beschränkung des Stands der Technik zu überwinden, bestimmt eine neue Distanzmetrik, ob eine ausreichende Klassifizierungsdistanz zwischen zwei multimodalen Gruppen im Merkmalraum besteht. Die vorliegende Klassifizierungsarchitektur ersetzt die Mahalanobis-Distanz, oder die varianzangepasste euklidische Distanz, des Stands der Technik, mit einer dimensionalen Stimmarchitektur, die die Gruppennachbarschaftsüberlagerung als einen Prozentsatz von Dimensionen schätzt, die dafür stimmen, dass die Überlagerung existiert. Dies allein ist keine große Abweichung vom Stand der Technik, allerdings ist die Metrik zur Bestimmung der Überlagerung zwischen nichtskalaren und nicht-Gaußschen verteilten Gruppen neuartig. Wieder liegen drei grundsätzliche Datentypen vor, von denen jeder unterschiedlich behandelt wird; das heißt, skalar, Histogramm, und diskret, wie hier definiert. Skalare Merkmaldimensionen werden in Gaußscher Weise modelliert, und im Standardverfahren der μ, σ_cut-Nachbarschaftsunterscheidung behandelt. Klassifizierungsdistanzen zwischen entsprechenden Histogramm-Merkmaldimensionen werden allerdings als Verteilungskorrelationen berechnet.
Die Pseudo-Korrelation der Verteilung ist als eins minus dem Verhältnis der Distanz zwischen bestimmten Histogramm-Bins zu der Distanz des schlimmsten Falls definiert. Dies simuliert das wünschenswerte Korrelationsverhalten von:

1. Ausgabewerten zwischen 0 und 1
2. Ausgabe steigt (sinkt) linear, je (un)ähnlicher die Verteilungsformen und -amplituden sind.

Der folgende kommentierte prozedurale Pseudocode (in MatLag-Codierung) bestimmt, ob zwei Histogramme in einer Merkmaldimension derselben Klasse angehören (als beispielhafte Werte sind beliebige Werfe angegeben):

1. Um die Distanz des schlimmsten Falls zu ermitteln, wird jedes Histogramm-Bin als ein orthogonaler euklidischer Merkmalvektor behandelt, und es wird die Distanz des schlimmsten Falls zwischen diesen berechnet, indem alle Stichproben eines jeden in unterschiedlichen Bins angeordnet werden. schlechteste_diff(:)=0; schlechteste_dift(1)=hist1_alle_stichproben; schlechteste_diff(NUM_HIST_BINS)=hist2_alle_stichproben; schlechteste_distanz=sqrf(schlechteste_diff·schlechteste_diff);
2. Berechnen der effektiven euklidischen Distanz zwischen den zwei Histogrammen hist2hist_diff=hist1 – hist2; histDiff_sqr=hist2hist_diff·hist2hist_diff; nutzer_dist=sqrt(sum(histDiff_sqr))/schlechteste_distanz;
3. Bestimmen der Wahrscheinlichkeitsdichtefunktionen (wdf) für jedes Histogramm hist1_pdf=hist1/hist1_alle_stichproben; hist2_pdf=hist2/hist2_alle_stichproben;
4. Auffinden der Bins mit der höchsten Verteilungsdichte, und Ordnen nach Dichte [hist1_mass hist1_mass_bins]=sort(hist1_wdf); [hist2_mass hist2_mass_bins]=sort(hist2_wdf);
5. Für hist1 und hist2 Auffinden der dichtesten Bins mit einer Standardabweichung an Stichprobenpunkten bin1_1sdv=NUM_HIST_BINS-min(find(cumsum(fliplr(hist1_mass))>68)) + 1; bin2_1sdv=NUM_HIST_BINS-min(find(cumsum(fliplr(hist2_mass))>68)) + 1; bins_1sdv=union([hist1_mass_bins(bin1_1sdv:NUM_HIST_BINS)], [hist2_mass_bins(bin2_1sdv:NUM_HIST_BINS)]);
6. Modellieren der Varianz zwischen Histogrammen als die Variation der Bin-zu-Bin-Distanzen. Bestimmen der mittleren Bin-zu-Bin-Distanz zwischen 1 Sigma Bins in hist1 und hist2. Dies ist die geschätzte Distanzvariation zwischen entsprechenden Stichprobenpunkten; je konsistenter die Distanz zwischen Bins, desto sicherer ist die Separation zwischen Histogrammen. mittl_diff=mittl(hist2hist_diff(bins_1sdv)); abweichung=hist2hist_diff(bins_1sdv)-mittl_diff; variant_dist=sqrt(mittl(abweichung·abweichung'))/schlechteste_distance;
7. Definieren der Histogrammkorrelation als das Verhältnis der Bin-weisen euklidischen Distanz zu der Distanz des schlechtesten Falls. Definieren der Histogrammkorrelation als das Verhältnis der einen Bin-weisen euklidischen Distanz der Standardabweichung zu der Distanz des schlechtesten Falls. nutzer1sdvDist=sqrt(sum(histDiff_sqr(bins_1_sdv)))/schlechteste_distanz;
8. Dimensionenweises Berechnen von separierten Gruppen, wenn die sigma-reduzierte Gruppendistanz positiv ist, für alle Dimensionstypen KlasseKürzenDims(idx)=nutzer1sdvDist-varianz_dist; %für idx = 1 zu NUM_DIMS

Der globale Dimensionen-Reduzierungsprozess entfernt eine Dimension, wenn KlasseKürzenDims für eine jeweilige Klassifizierungsdimension negativ für im Wesentlichen alle Werbeprototypen ist, da dieses Merkmal weniger oder keinen prädiktiven Wert für das System besitzt. Das Resultat dieser lokalen und globalen Prototypverfeinerung ist eine minimale Beschreibung wichtiger Merkmalwerte, die jede Werbekategorie identifizieren und separieren.
Die VGM versorgt den Zielrichtungsserver (ZielServer – 6) mit der optimierten Gruppe von Werbekategorieprototypen zum Herunterladen auf den MitgliedAgenten im Fernsehgerät. Der letzte Schritt des Werbezielrichtungssystems ist es, einen TV-Nutzer in seiner wahrscheinlichsten Werbekategorie zu klassifizieren. Der MitgliedAgent wendet dann genau dieselbe
Gruppendistanz auf das identische VM an, wie auf der Serverseite, unter Hinzufügung der folgenden Klassifizierungsschritte:

1. Für alle Dimensionstypen, Berechnen der separierten Gruppenzugehörigkeit, wenn die sigmareduzierte Gruppendistanz positiv ist, dann Berechnen des Anteils separierender Dimensionen KlasseKürzenDims(idx)=nutzer1sdvDist-variant_dist; %für idx=1 zo NUM_DIMS gutDimVek=finde(KlasseKürzenDims>0); %finde alle separierten Dimensionen NUM_GUTE_DIMS=länge(gutDimVec); gutDims(gutDimVec)=1; %gute Dimensionen gutDims zunächst auf 0 einstellen WerbeGruppeKlassifRatio=NUM GUTE_DIMS/NUM_DIMS;
2. Bestimmen der Bestehen/Nichtbestehen-Werbekategorie-Zugehörigkeit für die Systemmodulinformation KLASSE_STIMME_KÜRZEN=4; % Anteil der Dimensionen, die richtig separiert sein müssen, um die Gruppe als klassifiziert zu zählen Bestimmen von separierten Gruppen, wenn Anteil der Klassifizierungsstimme ist KLASSE_STIMME_KÜRZEN wenn WerbeGruppeKlassifRatio>KLASSE_STIMME_KÜRZEN WerbeGruppeGruppierungStimme=1; sonst WerbeGruppeGruppierungStimme=0; Ende

Jede Werbekategoriegruppe weist eine WerbeGruppeKlassifRatio auf, die der Anteil der Gesamtdimensionen ist, die adäquat separiert wurden. Es ist ein proportionaler Messwert dessen, wie ähnlich Verhaltensgruppen sind. Das heißt, je (un)ähnlicher das Verhalten eines Nutzers zu dem Werbekategorie-Prototyp ist, desto mehr (weniger) Dimensionen überlagern sich, daher die höhere (niedrigere) WerbeGruppeKlassifRatio. So weist jeder Werbekategorie-Prototyp eine WerbeGruppeKlassifRatio, oder einen Zielrichtungswert, auf, der darstellt, inwieweit ein Nutzer zu der Zielwerbegruppe gehört. Der ZielServer stellt diese Information für jede Werbekategorie als eine Verteilung von relativen Zugehörigkeitswahrscheinlichkeiten bereit. Der ZielServer bestimmt zusätzlich einen Bestehen/Nichtbestehen-Wert für die Werbekategorie-Zugehörigkeit für Systemmodule, die eine binäre Vorhersage benötigen. WerbeGruppeGruppierungStimme ist ein binärer Zugehörigkeitswert, der gleich eins ist, wenn ausreichend Dimensionen vorhanden waren, die den Nutzer von dem betreffenden Werbekategorie-Prototyp separierten, und der ansonsten null ist.
Der MitgliedAgent berechnet regelmäßig oder nach Bedarf die Wahrscheinlichkeiten der Werbekategorie-Zugehörigkeit eines Nutzers zur Benutzung durch die Systemmodule. Der ZUSAgent benutzt Werbekategorie-Zugehörigkeitsinformation, um Inhalt zu speichern, der besser zu den Interessen eines Nutzers oder zu den Vermarktungszielen eines werbenden Kunden passt. Gemäß einer Ausführungsform speichert und löscht der ZUSAgent Programme, um den gesamten Zielwert des archivierten Inhalts statistisch zu maximieren.
Als ein einfaches Beispiel soll der Fall betrachtet werden, wobei der ZielServer drei Vorlagen an den MitgliedAgenten bereitstellt – Männlich, Weiblich und Teenager, und die Zugehörigkeitszielwerte der TV-Nutzer als 0,2, 0,8 und 0,4 berechnet. Dann speichert der ZUSAgent nur Werbung mit Metadaten, die zu diesen Kategorien passen, und proportional zu den Zielwerten. Wenn die Zielwerte auf eins summierend normiert werden, könnten sie als die Wahrscheinlichkeiten von Männlich = 0,14, Weiblich = 0,29, und Teenager = 0,57 gelesen werden. Daher würde der ZUSAgent Werbung speichern und löschen, um dieselbe anteilmäßige Verteilung im lokalen Speicher zu erreichen, und würde gespeicherte Werbung aufweisen, von der 14 % für Männer, 29 % für Frauen, und 57 % für Teenager wäre. Der VertAgent verteilt Werbepräsentationen ähnlich, um eine Anpassung an Werbekategorie-Zugehörigkeitsverteilungen zu erreichen. Eine breite Spanne von alternativen und weiter verfeinerten Optimierungsstrategien zur zielgerichteten Ausrichtung sind möglich, die dieser Philosophie entsprechen oder von ihr ausgehen.
Es versteht sich, dass das Herleiten einer Werbekategorie anhand des TV-Nutzungsverhaltens dem Identifizieren mehrerer Personen in einem Haushalt sehr ähnlich ist. Der Hauptunterschied ist der, dass die Nutzerprototypen mit unmarkierten Realzeit-TV-Klickablauf-Daten wahrscheinlichkeitstheoretisch hergeleitet werden. Dieselbe Methodologie und Architektur gilt für beide Probleme; allerdings verlangt das Problem der Identifikation mehrerer Nutzer zusätzliche Verfahren, um TV-Nutzungsbeobachtungen auf effektive Weise dem korrekten Nutzerprofil zuzuordnen.
Zusätzlich, oder als eine Alternative zu der vorangegangenen Beschreibung des Systems zur engen Eingrenzung von Werbezielen, ist das System der Erfindung auch geeignet, um bevorzugte Programmgestaltungsmodelle zu erstellen. Hier interagiert der Präsentationsagent PräsAgent mit dem Verhaltensmodell VM, um lokale Programmführer zu erstellen. Der PräsAgent ermittelt Nutzerpräsentationspräferenzen durch Anfragen an den VMA-Agenten. Um diese Notwendigkeit zu motivieren, geht den Interaktionsdetails der VMA-Maschine mit dem PräsAgenten eine gekürzte Zusammenfassung auf Systemebene voraus. Kurz gesagt ist es das Ziel des PräsAgenten, einen Programmführer für einen virtuellen Kanal zu erstellen, dessen Programmgestaltung aus Programmen stammt, die lokal von dem ZUSAgenten gespeichert sind. Die Programmgestaltung kann Unterhaltung oder Werbung, Audio, Video, Graphiken, oder jeder Multimedia-Inhalt sein. Der ZUSAgent speichert nur die am stärksten bevorzugten verfügbaren Programme, und fügt ständig Programme hinzu oder löscht diese, um den lokalen Speicher zu füllen, während dabei die Nutzerprogrammpräferenz-Gesamtwertung maximiert wird. Dieser virtuelle Programmführer oder virtuelle Kanal kann dasselbe Erscheinungsbild aufweisen und denselben Eindruck erwecken wie ein normaler TV-Kanal. Es sollte sehr natürlich wirken, ihn als nur eine weitere Leitung in einen Live-TV-Programmführer einzufügen. Allerdings weist der virtuelle Kanal den Vorteil auf, dass er an die Präferenzen des Nutzers angepasst ist und als Kanal „auf Abruf" erscheint, mit Inhalten und Sendezeiten, die den persönlichen Erwartungen des Zuschauers im Wesentlichen entsprechen. Um dieses Ziel zu erreichen, analysiert der PräsAgent die Metadaten der gespeicherten Programmpräsentation und die Nutzerpräferenzen, um die optimale zeitliche Programmanordnung in dem EPG des virtuellen Kanals (VEPG) zu bestimmen.
Die Metadaten zur Zielrichtung des Programms enthalten, insbesondere für Werbung, Präsentationsinformation. Werbepräsentationsmetadaten von dem Kopfende weisen den PräsAgenten an, entweder diesen Regeln genau zu folgen, oder lokale Präferenzinformation zu benutzen, um den Werbeinhalt auf intelligentere Weise zu sequenzieren.
Für gespeicherte Programme, die keine Einnahmen erzeugen, hat der Nutzer eine ähnliche Option, die Programmanordnung des virtuellen Kanals vorzugeben. Mehrere VEPG-Aufbaumodelle sind möglich, angefangen von trivialen bis zu hoch kontextabhängigen.
Eine triviale Implementierung zeigt einfach die lokalen Speicherinhalte in der Reihenfolge an, in der sie aufgezeichnet wurden, und ordnet Zahlungsprogramminhalte genau wie von ihren Präsentationsmetadaten angegeben an. Dies hat den Vorteil der Einfachheit, belastet den Nutzer jedoch mit dem Durchsuchen vieler unerwünschter Programme, und neigt dazu, bei jedem gesehenen Programm ein Herumspringen im Führer zu erzwingen. Dies ist einen Schritt höher als analoge Videoaufzeichnungen, indem beliebiger Zugriff und eine Inhaltsauflistung vorliegen.
Ein weiter verfeinerter Ansatz nutzt nicht-zeitliche Programmpräferenz-Information, um Programme mit ähnlicher Wertung zu gruppieren. Sofern die Präferenzwertungen genau sind, weist dieses Verfahren den Vorteil auf, dass es für den Nutzer leichter ist, weniger gefallende Programme zu überspringen, und unter wesentlich geringerem Suchaufwand stets gefallende Programme zu sehen. Allerdings herrscht immer noch der Eindruck einer sortierten Auflistung gespeicherter Medieninhalte vor.
Eine signifikante Verbesserung gegenüber dem Sortierverfahren von Inhaltspräferenzen nutzt zeitliche und sequenzielle Präferenzen, um ein VEPG zu erzeugen, das gemäß dem Realzeit-Sehkontext und der Präferenzgeschichte des Nutzers geordnet ist. Um dies zu erreichen, stellt der PräsAgent, wenn der Nutzer den Fernseher einschaltet, oder regelmäßig bevor der Fernseher eingeschaltet wird, eine Anfrage an die VMA-Maschine mit jedem gespeicherten Programmpräsentationskontext, und erstellt dynamisch einen VEPG, der am besten zu den Verhaltenspräferenzen des Nutzers zum jeweiligen Zeitpunkt unter den jeweiligen Bedingungen passt.
Die folgenden allgemeinen algorithmischen Schritte erstellen einen VEPG für einen typischen Fall:

1. Finde alle unerwünschten Sehzeiten, und lasse diese leer.
2. Ordne die höchstwahrscheinlich bevorzugten Programme beim Einschalten in dem aktuellen Zeitfenster an.
3. Finde alle lokalen Programmübergangskombinationen und zeitliche Präferenz und sequenziere die Programme entsprechend.

Als ein einführendes Beispiel kann angenommen werden, dass die folgenden 9 als bevorzugt angenommenen Programme lokal gespeichert sind:
Während das Fernsehgerät ausgeschaltet ist, oder bei seinem Einschalten, bestimmt der PräsAgent den Kontext der aktuellen Sitzung. Der aktuelle Kontext enthält Information wie z.B. Wochentag, Tageszeit, Zeit seit letzter Sitzung, und letzter Titel/Genre/Kanal.
Die ersten zu bestimmenden Punkte sind die Zeitintervalle ohne Fernsehen. Diese löschen die VEPG-Zeitintervalle, während derer historisch betrachtet meist nicht ferngesehen wird. Die Anfrage sieht folgendermaßen aus:
,AnfrageFunktion = Zeit_Summe, ZustandTyp = GefallendeKanäle, vonZustandID = null, zuZustandID null, ZeitTyp = TZ, ZeitWert = null".
Hier wird GefallendeKanäle als Aktivitätsindikator für TZ benutzt. Jede andere „gefallende" Zustandskategorie wäre ebenso geeignet.
Eine typische Antwort auf die Anfrage des ZUSAgenten könnte lauten:
[(SPÄT_ABENDS, SEHR_OFT); (NACHTS, NIE); (FRÜH_MORGENS; NIE); (MORGENS, MEISTENS); (VORMITTAGS; SELTEN); (NACHMITTAGS; SELTEN); (SPÄTNACHMITTAGS; MANCHMAL); (ABENDS; FAST_IMMER); (NACHTS, NORMALERWEISE)]
Der ZUSAgent durchsucht die Resultatsmatrix nach den am wenigsten wahrscheinlichen TZ-Intervallen, insbesondere
[(NACHTS, NIE),); (FRÜH_MORGENS; NIE), (VORMITTAGS; SELTEN); (NACHMITTAGS; SELTEN)].
Die entsprechenden Zeitintervalle würden in der VEPG leer gelassen. Wenn allerdings die aktuelle Fernsehperiode ein leer gelassener Intervall ist, werden die aktuellen VEPG-Zeitintervalle wenigstens für die übliche TV-Sitzungslänge des Nutzers verfügbar gemacht. Das heißt, beim Einschalten des Fernsehgeräts ist immer Programminhalt in dem aktuellen VEPG-Zeitindex aufgelistet, und wenigstens so lang, wie der Nutzer normalerweise für diese Periode fernsieht.
Die verfügbaren Zeitintervalle werden nach bevorzugter Programmanordnung durchsucht.
Der PräsAgent fährt fort, nach Programmen zu suchen, die der Nutzer bevorzugt, wenn er die TV-Sitzung startet. Jedes Programm wird nach der Startreferenz für Kanal/Genre/Titel/Schauspieler usw. durchsucht. Jeder modellierte Verhaltenszustand (d.h. gefallender Kanal, gefallendes Genre, gefallender Titel usw.) wird abgefragt, und die Ergebnisse werden in einer Sfarfwerfungsmatrix akkumuliert. Eine typische Anfrage zur Suche nach Start-Genrepräferenz ist:
Anfrage( [AnfrageFunktion = obere_n=5, ZustandTyp = Genre, vonZustandID=aus, zuZustandID=null, ZeitTyp = TZ, ZeitWert = Nachts)].
Derselbe Anfragestil wird für jeden Zustandstyp wiederholt, und die Ergebnisse werden mit den verfügbaren Programmen abgeglichen.
Der PräsAgent berücksichtigt ferner kontextabhängige Präferenzen hinsichtlich des zuletzt gesehenen Programms, indem er jede Kombination von zeitlichen und ZustandTyp-Übergängen durchsucht. Angenommen, dass für die Sitzung WT = Montag, TZ = Nacht (22.00), letzter_Titel = „Glücksrad"@Montag abends 19.00, letztes_Genre = Spielshow, und letzter_Kanal = NBC ist.
Eine typische Anfrage umfasst eine Suche nach wahrscheinlichen Übergängen, die in der Zeit seit dem letzten gesehenen Titel, Genre, und Kanal auftraten, in diesem Beispiel drei Stunden (22.00-19.00). Eine Suche der 3 am stärksten bevorzugten Titelübergänge drei Stunden nach dem Sehen von „Glücksrad" ist:
Anfrage: [AnfrageFunktion = obere_n=3, ZustandTyp = Titel, vonZustandID=Glücksrad, zuZustandID=null, ZeitTyp = TIP, ZeitWert = 3std]
Eine ähnliche Suche wird für Genre und Kanal wiederholt.
Der PräsAgent vergleicht die Tendenz aller Startwertungen und der letzten programmbasierten Präferenzen mit dem übrigen Programm hinsichtlich der besten Zuordnung. Wenn in diesem Beispiel ein wahrscheinliches Startgenre „Komödie Serie" war, und der wahrscheinlichste Startkanal „NBC", würde ein passendes Programm mit der höchsten Präferenzwertung, z.B. Seinfeld, als das Programm in dem aktuellen Zeitfenster angeordnet, wenn kein anderer Übergang drei Stunden nach dem Sehen von „Glücksrad", Spielshow, oder NBC bevorzugt wird.
Das System führt eine Tabelle mit Sitzungszeiten für jeden Zeitintervall, an jedem Tag der Woche. Wenn eine typische Sitzung für diesen Nutzer zu diesem Zeitpunkt 1,5 Stunden beträgt, dann ist dies der zu füllende Zeitblock. Der PräsAgent prüft jedes gespeicherte Programm auf Übergangstendenzen zum Folgen auf Seinfeld. Wieder werden alle gefallenden Zustandstypen nach dem wahrscheinlichsten Übergang von dem Zustand durchsucht, der Seinfeld zugeordnet ist. Eine typische erste Anfrage der Übergangsgesamtpräferenz-Suche könnte lauten:
[AnfrageFunktion = höchstwahrscheinlich, ZustandTyp = Titel, vonZustandID="Seinfeld", zuZustandID=null, ZeitTyp = TZ, ZeitWert = nachts]
Der PräsAgent findet die passendste Zuordnung und ordnet sie nach Seinfeld an. Der Nutzer kann z.B. am stärksten bevorzugen, nach einer kurzen Komödie zeitunabhängig eine wissenschaftliche Dokumentation zu sehen, so dass NOVA folgen sollte. Nachdem zwei Programme verbunden sind, fragt der PräsAgent auch nach etwaigen Zustandssequenzpräferenzen; d.h. Titel, Genre, Kanal usw. Für die Beispielsequenz ist die Ausgangsanfrage:
„AnfrageFunktion = höchstwahrscheinlich, ZustandTyp = TitelSequ, vonZustandIDs = ["Seinfeld", „NOVA"], LängenWert = null"
„AnfrageFunktion = höchstwahrscheinlich, ZustandTyp = GenreSequ, vonZustandIDs = ["serie:komödie", „serie:wissenschaft"], LängenWert = null"
Der PräsAgent fügt das wahrscheinlichste und spezifischste Resultat an die vorherige Sequenz. Dieser Prozess setzt sich für jedes Programm am Ende der wachsenden Sequenz fort, bis der Zeitblock der üblichen Sitzungszeit gefüllt ist. Der PräsAgent geht dazu über, alle anderen verfügbaren VEPG-Zeitblöcke zu füllen. Jeder Zeitblock beginnt mit einem Sequenzsamen, von dem das Wachstum ausgeht.
Der PräsAgent prüft jedes verbleibende Programm für alle verfügbaren Zeitfenster, und ordnet hoch wahrscheinliche zeitliche (nicht-zeitliche, WT, TD, TIP) Zuordnungen entsprechend an. Beispielsweise könnte eine typische Anfrage zum Prüfen der Anordnungspräferenz des Programms „Football" an einem verfügbaren Sonntagszeitfenster starten:
Anfrage: [AnfrageFunktion = höchstwahrscheinlich, ZustandTyp = gefallendesGenre, vonZustandID="Sport", zuZustandID=null, ZeitTyp = WT, ZeitWert = Sonntag]
und
Anfrage: [AnfrageFunktion = höchstwahrscheinlich, ZustandTyp = gefallendesGenre, vonZustandID="Sport", zuZustandID=null, ZeitTyp = TZ, ZeitWert = Nachmittags]
Wenn das Sehen von Sport am Sonntagnachmittag wahrscheinlicher ist als jedes andere Programm und jede andere alternative zeitliche Anordnung, würde Football diesen Zeitblock beginnen, und das hier beschriebene Sequenzaufbauverfahren würde den verbleibenden Sitzungsblock füllen.
Der erste Teil des VEPG-Anordnungsalgorithmus befasst sich nur mit stark bevorzugten Programmen in jedem Kontext. Wenn Programme für den VEPG-Eintrag übrig bleiben, ordnen nachfolgende Wiederholungen die wahrscheinlichsten Programme an. Wenn keine ausreichende historische Beweislage zur Herleitung vorliegt, nimmt der PräsAgent als letztes Mittel beliebige Anordnungen vor.
Es ist wichtig, dass der PräsAgent jedes Mal, wenn ein Zuschauer den Fernseher einschaltet, oder ein neuer Nutzer ermittelt wird, einen potentiell unterschiedlichen VEPG erzeugt, der auf die Präferenzen des Nutzers zugeschnitten ist, und auf den Kontext dieser Sitzung. Mehrere andere Verfeinerungen, Optimierungen und Erweiterungen des grundlegenden VEPG-Aufbauverfahrens sind möglich und vorgesehen. Einige hier beschriebene zusätzliche kontextabhängige Auflösungsverfahren erweitern den genannten Algorithmus. Die VMA-Maschine versorgt den PräsAgenten mit vielen anderen kontextabhängigen und Verhaltenstendenz-Anfragen. Einige umfassen:

1. Zuletzt gesehenes Programm
2. Verhaltenspsychometrie
3. Aufmerksamkeitsspanne
4. Beendigungsneigung

Diese Messwerte führen zu folgenden sequenziellen Programm-Anordnungspräferenzen.
Punkt 1 ist ein Verfahren zum erneuten Berechnen künftiger VEPG-Einträge, basierend auf dem zuletzt von dem Nutzer gesehenen Programm. Ähnlich wie beim Bestimmen der Start-Programmpräferenzen, die hier erläutert wurden, stellt der PräsAgent eine Anfrage für alle zeitlichen und ZusfandTyp-Übergangspräferenzen von den Programmen, die der Nutzer gewählt hat. Der VEPG wird umgestellt, wie zuvor beschrieben, mit den wahrscheinlichsten passenden Programmen des Anfrageergebnisses als neuem Samen.
Der PräsAgent benutzt Psychometrik, Punkt 2, wie z.B. Diversität, Neugier, Fokus, und Aufmerksamkeitsspanne, um die Programmsequenzierung näher an die Präferenzen des Zuschauers anzupassen. Wenn der Nutzer z.B. sehr hohe (niedrige) Messwerte für Genrediversität oder Fokus aufweist, vermeidet (bevorzugt) der PräsAgent proportional Sequenzen, die dasselbe Genre wiederholen. Ebenso lässt ein hoher (niedriger) Neugiermesswert den PräsAgenten proportional verwandte, aber weniger häufig besuchte Sequenzkandidaten vorziehen (vermeiden). Ein hoher (niedriger) Neugiermesswert kann bei einem Nutzer entstehen, der eine niedrige (hohe) Aufmerksamkeitsspanne aufweist, und der oft erfolglos (erfolgreich) beim Auffinden gefallender Programme ist. Eine andere Möglichkeit ist, dass der Nutzer eine kleine Kerngruppe gefallender Programmtypen aufweist, aber oft außerhalb dieser Gruppe nach neuen interessanten Programmen sucht. Der Neugiermesswert sucht so nach der Tendenz eines Nutzers, außerhalb zuvor gefallener Typen zu suchen, ohne viel Information zu den Gründen hierfür.
Aufmerksamkeitsspanne, Punkt 3, ermittelt die Menge und die Qualität der Zeit, die ein Nutzer normalerweise auf verschiedene Programmaspekte verwendet. Ein Histogramm modelliert die Aufmerksamkeitsverteilung für jeden modellierten Parameter. Verfolgte Parameter umfassen jeden EPG-Kategorieeintrag, wie z.B. Genretyp, einen Titel, einen Kanal, oder Fernsehstatistiken einschließlich Sitzungszeiten. Alle Parameter der Aufmerksamkeitsspanne sind kontextsensibel, wie durch das VM unterstützt. Der PräsAgent benutzt die Aufmerksamkeitsspanne, um die Programmlänge zu bestimmen, die in einem gegebenen Kontext von dem Zuschauer am meisten bevorzugt wird. Beispielsweise kann ein Nutzer allgemein einen langen dramatischen Film mögen, jedoch nicht morgens, bevor er zur Arbeit geht, oder nach einer Spielshow, sondern bevorzugt ihn an Abenden am Wochenende. Dieses Präsentationsfilter vermeidet viele der offensichtlichen Präferenzkonflikte der Nutzer-Programmlänge, indem vergangene Sehzeiten in einem gegebenen Kontext als eine Tendenz benutzt werden, um zukünftige Programme ähnlicher Länge vorzuziehen.
Sobald eine Fernsehsitzung, oder eine VEPG-Programmsequenz sich der typischen Fernseh-Aufmerksamkeitsspanne dieses Kontextes nähert, weist der PräsAgent eine Präferenz auf, ein Programm anzuordnen, das am besten zu der Beendigungstendenz-Geschichte des Nutzers passt.
Die Beendigungstendenz, Punkt 4, ist die vergangene Tendenz, eine Fernsehsitzung zu beenden, nachdem eine bestimmte VM-Kategorie gesehen wurde. Ein Beispiel dafür, wie der PräsAgent eine neue Beendigungstendenz von der Programmwiedergabe-Auswahl lernt, ist, wenn ein Nutzer, nachdem Late-Night-Talkshows wiedergegeben wurden, wie z.B. die „Tonight Show" während der Woche am späten Abend aufhört, fernzusehen, und nicht nachts. Der PräsAgent lernt sowohl von Live-Programmen als auch von wiedergegebenen Programmen. Die Fähigkeit, bevorzugte Wiedergabemuster zu erlernen, erlaubt es dem PräsAgenten, Programme adaptiv in dem am stärksten bevorzugten VEPG-Kontext anzuordnen. Eine typische TZ- Beendigungsneigung-VMA-Agentenanfrage für jeden ZustandTyp, z.B. für Talkshows, erscheint wie folgt:
Anfrage: [AnfrageFunktion = höchstwahrscheinlich, ZustandTyp = gefallendesGenre, vonZustandID=null, zuZustandID=Serie/Talk, ZeitTyp = TZ, ZeitWert = später_abend].
Der PräsAgent, der eine ähnliche Aufgabe hat wie die PBMA, erzeugt einen Programmführer, der dazu neigt, die tägliche Variation und Neuartigkeit anzupassen, die ein Nutzer bevorzugt.
Der PräsAgent ordnet VEPG-Werbung in einer ähnlichen Art und Weise an wie nicht-gezahlte Programme, nur dass Anordnungsentscheidungen Präsentationsmetadaten und maschinengesteuerte erlernte Nutzer-Zielinformation enthält. Werbung unterscheidet sich von Programmen in anderer entscheidender Hinsicht, indem ihre anfängliche VEPG-Anordnung nur eine voreingestellte Initialisierung ist, die verändert werden kann, abhängig von der Programmauswahl des Nutzers, und der Rechte des Werbeunternehmens, wie sie über Steuerungsmetadaten übermittelt werden. Obwohl als eine alternative Ausführungsform vorgesehen, ist es ebenso möglich, die VEPG-Programmgestaltung ständig neu aufzubauen, basierend auf dem laufenden Sehverhalten des Nutzers; allerdings gilt der Hauptvorteil auf die Zeitplanung für Werbung. Die Werbung ist nicht notwendigerweise in dem VEPG sichtbar, sondern ist als Werbepause zwischen den Programmen oder während des Programms vorgesehen. Die Pausen werden entweder am Kopfende (während des Programms) oder intern (zwischen den Programmen) erzeugt.
Der PräsAgent ist sich durch Programm-Metadaten oder andere Mittel im Voraus über die genaue Zeitplanung für Werbepausen im Programm im Klaren. In der vorliegenden Ausführungsform füllt der PräsAgent alle Werbepausen mit optimal ausgewählten vorgespeicherten Werbesendungen vor. In der Praxis weist dieses Verfahren einen wesentlichen Vorteil auf. Oft gibt es, aufgrund begrenzter Systemressourcen des Fernsehgeräts, nicht ausreichend Zeit, die beste Werbezeitplanung für eine Werbepause, die möglicherweise in nur wenigen Minuten stattfindet, in Realzeit zu berechnen. Diese Situation tritt normalerweise zu Beginn eines Programms auf, oder wenn eine Person kurz vor der geplanten Werbepause zuschaltet. In diesem Fall ist die voreingestellte PräsAgent-Sequenzierung der Werbung eine beste Schätzung der optimalen Anordnung. Wenn sausreichend Zeit für Berechnungen ist, kann der PräsAgent die VMA-Maschine nach Nutzer-Werbesequenzierungs-Präferenzen befragen.
Das Verfahren zum Sequenzieren der Werbung ist dasselbe wie das für die Programmgestaltung, mit den folgenden werbungsspezifischen Definitionen:

1. Titel ist der UPC des Produkts oder der Name des Werbesponsors
2. Genre ist die Haupt-SIC des Sponsorunternehmens
3. Die Semaphore Werbung_null ersetzt null als Anfragejoker, um nur Werbung zu durchsuchen.

Mehrere beispielhafte Anfragen folgen, die eine Spanne von kontextabhängigen Anordnungsmöglichkeiten zur Werbungssequenzierung demonstrieren.
Beispiel A:
Finde die drei oberen Produkte (UPC), die nachts während Seinfeld gefallen haben:
Anfrage: [AnfrageFunktion = obere_n=3, ZustandTyp = Titel, vonZustandID=Werbung_null, zuZustandlD="Seinfeld", ZeitTyp = TZ, ZeitWert = nachts]
Beispiel B:
Finde die 5 oberen Programme, die Sonntag nach der Pepsi-Werbung gefallen haben:
Anfrage: [AnfrageFunktion = obere_n=5, ZustandTyp = Titel, vonZustandID=Pepsi_UPC, zuZustandID=null, ZeitTyp = WT, ZeitWert = Sonntag]
Beispiel C:
Finde das am meisten gefallende Genre zu jedem Zeitpunkt vor einer Fahrzeugteil-Werbung:
Anfrage: [AnfrageFunktion = höchstwahrscheinlich, ZustandTyp = GefallendesGenre, vonZustandID=null, zuZustandID=Fahrzeugteile_SKU, ZeitTyp = nichtzeitlich, ZeitWert = null]
Beispiel D:
Von den dem Nutzer gefallenden Werbeprogrammen, finde die oberen 3 Werbeproduktkategorien während einer Sportsendung an Sonntagen:
Anfrage: [AnfrageFunktion = obere_n=3, ZustandTyp = GefallendesGenre, vonZustandID=sport, zuZustandID=Werbung_null, ZeitTyp = WT, ZeitWert = Sonntag]
Indem so der allgemeine Hintergrund beschrieben wurde, vor dem ein virtueller Kanal und/oder ein virtueller elektronischer Programmführer VEPG erstellt werden kann, gehen wir über zu einer spezifischen Implementierung eines beispielhaften VEPG. Der PräsAgent erstellt einen voreingestellten VEPG, kurz bevor der Nutzer den Fernseher einschaltet, oder beim Einschalten, der den zeitlichen, sequenzierten, und Programmpräferenzen des Nutzers am besten entspricht, bevor eine neue Nutzereingabe tatsächlicher Auswahl empfangen wird. Der PräsAgent hat die Option, und die Fähigkeit, falls die Zeit dies zulässt, basierend auf den Inhaltsauswahlmustern des Kunden den voreingestellten VEPG in Realzeit wieder zu erstellen. Die Kombination einer voreingestellten Inhaltsanordnung aufgrund „fundierter Vermutung", und einer Neuberechnung, die Realzeit-kontextabhängig ist, stellt eine robuste, und optimale Einschätzung der Nutzerpräferenz bereit.
Ein typischer grober VEPG, der von dem PräsAgent aus der Beispielgruppe gespeicherter Programme erzeugt wird, erscheint wie folgt:
Diese Programmanordnung könnte sich aus dem folgenden Szenario systemermittelter, nutzerkontextabhängiger Präferenzen ergeben. Das Programm „The Terminator" erfordert eine lange Aufmerksamkeitsspanne, und obwohl Nächte an Wochentagen genauso wie Samstagnacht qualifiziert sind, tritt das Gefallen von Filmen im Wesentlichen im letztgenannten Zeitfenster auf. Angenommen, der Nutzer weist eine starke allgemeine Präferenz zum Sehen von CNBC auf, und von Finanzprogrammen während des späten Nachmittags an Wochentagen, nachdem er von der Arbeit nach Hause gekommen ist. Der PräsAgent kann außerdem ermitteln, dass, nachdem der ZUSAgent „Market Wrap" einige Male aufgezeichnet hatte, der Nutzer dies während dieser Zeitperiode gesehen hat, und ordnet es entsprechend an. Wenn der PräsAgent allerdings eine stärkere Tendenz ermittelt, den „NFL Football" von Montagabend z.B. stattdessen am Spätnachmittag dienstags zu sehen, wobei niemals Finanzprogramme gesehen werden, nimmt das Football-Spiel das letztere, stärker bevorzugte Zeitfenster ein. Der Nutzer kann ebenso eine Präferenz für „Saturday Night Live" zeigen, jedoch an Sonntagabenden. Ein wiederholbares Muster könnte üblicherweise eine Nacht-Sitzung wochentags mit „Seinfeld" beginnen, wobei eine starke Tendenz besteht, danach „The Tonight Show" zu sehen und damit die Sitzung zu beenden.
Wenn der PräsAgent eine niedrige (hohe) Zustandsdiversität für einen zeitlichen Kontext ermittelt, wie z.B. ein tägliches Zeitfenster, zieht er es vor, die Abwechslung der Programme in dieser Periode zu senken (erhöhen). Der Nutzer weist im vorliegenden Beispiel einen niedrigen Diversitätsmesswert für die Blöcke spätnachmittags und nachts auf, jedoch viel höhere Messwerte während der Periode abends. In Abwesenheit von einer sequenziellen oder zeitlichen Tendenz kann der PräsAgent Diversität, oder Neugierinformation, benutzen, um bevorzugte Programme angemessener zu verteilen. In diesem Fall bemerkt der PräsAgent, dass das Zeitfenster abends beliebt ist, und dass der Nutzer eine ähnliche Präferenz für Science Fiction, Komödien, und Filme aufweist. Wenn allerdings die Diversitätsmesswerte des Nutzers während dieser Periode höher sind, wird der PräsAgent vermeiden, das tägliche Zeitfenster nur mit den am stärksten bevorzugten täglichen Programmtypen, z.B. „Star Trek" zu füllen, und wird stattdessen die verfügbaren Zeitfenster mit verschiedenen kurzen, gefallenden Programmen verteilen. Wenn „NOVA" in der Vergangenheit eine „wenig gefallend"-Wertung aufwies, würde eine hohe Neugierwertung in den abends-Zeitfenster den PräsAgent dazu motivieren, „NOVA" in die Aufreihung einzubringen. Es ist wichtig, dass der Nutzer einen VEPG findet, der seine „Hochzeit" nachts (21 bis 24 Uhr) und nicht, wie traditionell üblich, von 20 bis 22 Uhr widerspiegelt, und der ein Sehmuster widerspiegelt, das die sich stark wiederholenden Verhaltensweisen widerspiegelt, einschließlich der auftretenden regelmäßigen Ausnahmen, und der seine stärker forschenden Perioden, so diese existieren, mit dem Programmangebot füllt, das er mögen könnte.
Im Laufe der Zeit ermittelt das System sich stark wiederholende Präferenzmuster, sowie wichtige Ausnahmen. Die Auswahl und das Lernen von gespeicherten Programmnutzungsmustern lehrt das System fortwährend, wann und in welcher Sequenz Programmkategorien bevorzugt werden. Eine parallele Beschreibung gilt für die optimale Anordnung von Werbung.

Claims

Interaktives Fernseh-Programminhalts-Bereitstellungssystem umfassend eine entfernt liegende, kopfendige Seite und eine lokale Klientenseite, umfassend ein System zur gezielten Programmbereitstellung umfassend; ein entfernt liegendes, kopfendseitiges, zentrales Datenverarbeitungssystem, das angekoppelt ist, um Fernsehbenutzer-Betrachtungsaktivitätsdaten in Kombination mit einer allgemeinen, demographischen Metrik von einer Vielzahl von Fernsehzuschauern zu empfangen, wobei die Betrachtungsaktivitätsdaten aus einer Gruppe umfassend eine Programmbetrachtungs-Startzeit, eine Programmkanalauswahl, eine Programmbetrachtungsdauer, Programmbetrachtungssequenz und aus Programmbetrachtungsdaten ausgewählt sind; einen elektronischen Programmführer, der Metadaten umfasst, die den Inhalt von Programmen beschreiben, wobei der Führer dem zentralen Datenverabeitungssystem bereitgestellt wird; eine die Verhaltensweise gruppierende Softwaremaschine, die mit dem zentralen Datenverarbeitungssystem gekoppelt ist, wobei die Gruppierungs-Softwaremaschine eine Vielzahl von Betrachtunngsaktivitätsdaten verarbeitet, um eine Matrix von Betrachteraktivitäts-Übergängen zu entwickeln, wobei jedem Matrixelement ein Wahrscheinlichkeitsgewicht zugeordnet ist, wobei die Übergangsmatrix eine demographische Gruppe eines Benutzers entsprechend einer speziellen Übergangsaktivität des Benutzers voraussagt; und einen Programminhalts-Bestimmungs- und Bereitstellungs-Software-Agenten, der angekoppelt ist, um Programminhalt festzustellen und an einen speziellen Benutzer entsprechend der vorhergesagten, demographischen Gruppe des Benutzers bereitzustellen.
Programminhalts-Bereitstellungssystem nach Anspruch 1, das ferner umfasst eine Realzeit-Rückkopplungsschleife, um an das zentrale Datenverarbeitungssystem eine Realzeitinformation betreffend das Betrachtungsverhalten eines Benutzers mit Klick-Ablaufdaten abzugeben.
Programminhalts-Bereitstellungssystem nach Anspruch 1, worin die die Verhaltensweise zusammenfassende Softwaremaschine auf einem verborgenen Markov-Modell basiert.
Programminhaltsk-Bereitstellungssystem nach Anspruch 1, worin die die Verhaltensweise zu sammenfassende Softwaremaschine und der Programminhalts-Bestimmungs- und Bereitstellungs-Agent Softwaremodule sind, die jeweils geeignet sind, in einem maschinenlesbaren Medium in Form einer Vielzahl von von einem Prozessor ausführbaren Befehlen gespeichert zu werden.
Programminhalts-Bereitstellungssystem nach Anspruch 1, worin die die Verhaltensweise zusammenfassende Softwaremaschine eine demographische Zusammenfassungsinformation des Benutzers als statistische State-Maschinen-Übergangs-Modelle erzeugt.
Programminhalts-Bereitstellungssystem nach Anspruch 5, worin das State-Maschinen-Übergangs-Modell als Übergangsmatrix definiert ist, wobei die Übergangsmatrix Informationen über Programmübergänge enthält, die von dem Betrachter eingeleitet wurde.
Programminhalts-Bereitstellungssystem nach Anspruch 1, worin die Übergangsmatrix eine von wenigstens zwei gleichzeitig laufenden Übergangsmatrizen ist, die eine Kanalmatrix und eine Genrematrix umfassen.
Programminhalts-Bereitstellungssystem nach Anspruch 1, worin die Übergangsmatrix eine zweidimensionale Matrix mit Übergängen von Fernsehkanälen zu Fernsehkanälen ausgedrückt in einer zeitlichen Form ist.
Programminhalts-Bereitstellungssystem nach Anspruch 1, worin die die Verhaltensweise zusammenfassende Softwaremaschine konfiguriert ist, um das Verhalten des Benutzers mit einem pseudo-verborgenen Doppelzufalls-Markov-Prozess zu parametrisieren und um eine statistische Niedrigniveau-State-Machine, die eine Verhaltensgruppe modelliert, und eine statistische Spitzenniveau-State-Machine mit aktiven Verhaltensgruppen und eine Wechselwirkung zwischen den aktiven Verhaltungsgruppen zu definieren.
Programminhalts-Bereitstellungssystem nach Anspruch 1, worin die die Verhaltensweise zusammenfassende Softwaremaschine konfiguriert ist, um einen Doppelt-Zufallsprozess mit einer Vielzahl von Dimensionen zu definieren und um parallele Übergangsereignisse der statistischen State-Machine in wenigstens zwei von drei State-Kategorien zu bestimmen, die Kanal-, Genre- und Programmtitel-Inhalte umfassen.
Verfahren zur Bestimmung der interaktiven Betrachtungsgepflogenheiten eines Fernsehbetrachters, wobei das Verfahren umfasst: Aufzeichnen einer Betrachtungsaktivitäts-Verhaltensweise eines Betrachters in Form von Datenvariablen, die ausgewählt sind aus der Gruppe bestehend aus Programmbetrachtungsdaten, Programmbetrachtungs-Startzeit, Programmbetrachtungsdauer und Programmbetrachtungskanal; Eingeben von historischer, demographischer Information, die für den Betrachter spezifisch ist; Eingeben eines elektronischen Programmführers, der Metadaten umfasst, die den Inhalt von Programmen beschreiben; Verarbeiten der Betrachtungsaktivitäts-Verhaltensweise des Betrachters in Kombination mit dem elektronischen Programmführer in Form eines statistischen State-Machine-Übergangsmodells, um eine auf Programminhalt und Ausnutzung bezogene Präferenz zu entwickeln; Definieren einer Verhaltensweise-Modelldatenbank und Speichern darin von Informationen, die dem Betrachtungsverhalten des Fernsehbenutzers zugeordnet ist, wobei die Verhaltensweisen-Modelldatenbank adaptiv auf den neuesten Stand gebracht wird entsprechend den Benutzerpräferenzen bezogen auf Programminhalt und -Ausnutzung, wie sie durch gegenwärtige und historisch aufgezeichnete Betrachter Übergangs-Verhaltensweisen wiedergegeben werden; und worin der Schritt des Definierens der Verhaltensweisen-Modelldatenbank die Berechnung einer parametrisierten Übergangsmatrix umfasst, die Betrachtungsgepflogenheiten des Betrachters definiert, wobei die Übergangsmatrix eine Information über Programmübergänge enthält, die von dem Betrachter eingeleitet wurden.
Verfahren nach Anspruch 11, welches das Definieren von wenigstens zwei, gleichzeitig laufenden Übergangsmatrizen umfasst, die eine Kanalmatrix und eine Genrematrix umfassen.
Verfahren nach Anspruch 11, welches das Definieren der Übergangsmatrix als zweidimensionale Matrix mit Übergängen von Fernsehkanälen zu Fernsehkanälen in einer zeitlichen Form umfasst.
Verfahren nach Anspruch 11, das die Bereitstellung von Rückkopplungsinformationen mit den Betrachtungs-Verhaltensweisen den Betrachters durch Aufzeichnung eines Klick-Ablaufs umfasst.
Verfahren nach Anspruch 11, das die Parametrisierung der Betrachtungs-Verhaltensweise des Betrachters mit einem pseudo-verborgenen Doppelzufalls-Makov-Prozess und die Definition einer stati stischen Niedrigniveau-State-Machine, die ein Verhaltensprofil modelliert, und eine statistische Spitzenniveau-State-Machine mit aktiven Verhaltensprofilen und eine Wechselwirkung zwischen den aktiven Verhaltungsprofilen umfasst.
Verfahren nach Anspruch 15, das das Definieren eines Doppelzufalls-Verfahrens in einer Vielzahl von Dimensionen und das Feststellen paralleler, statistischer State-Machine-Übergangsereignissen in wenigstens zwei von drei State-Kategorieren umfasst, die einen Kanal, ein Genre und einen Titel umfassen.