-
ALLGEMEINER STAND DER
TECHNIK
-
GEBIET DER ERFINDUNG
-
Die
Erfindung betrifft das Gebiet der interaktiven Fernsehprogrammgestaltung.
Insbesondere betrifft die Erfindung ein Verfahren und System zum
Vorhersagen und Modellieren von TV-Benutzerprofildaten, ein Verfahren und
System zu Bestimmen einer Programm- und/oder Werbeprogrammpräferenz,
ein Verfahren und System zum gezielten Werben für Fernsehen und interaktives
Fernsehen, basierend auf der Profildaten-Vorhersage und -Modellierung
und der Präferenzbestimmung,
und ein Verfahren und System, mit dem eine vollständige Programmsequenz
einem Zuschauer basierend auf der Präferenzbestimmung und gespeicherter Programmgestaltung
präsentiert
werden kann. Das letztere soll als Erzeugen einer automatischen
Programmsequenz (virtueller Kanal) bezeichnet werden, und der virtuelle
Kanal soll als ein separater Kanal in dem elektronischen Programmführer (EPG)
präsentiert
werden.
-
STAND DER
TECHNIK
-
Systeme
und Verfahren für
zielgerichtetes Werben im interaktiven Fernsehen sind bekannt. Beispielsweise
beschreibt WO 00/04 708 ein Fernsehsystem, das ein vorzuschlagendes
Programm basierend auf der Sehaktivität des Zuschauers ermittelt.
Die Systeme und Verfahren des Stands der Technik richten Werbung
im Allgemeinen durch statistisch erfasste, programmbetriebene Verfahren
aus. Die Preisgestaltung der Fernsehwerbung erfolgt entsprechend
einer Bewertung eines bestimmten Programms und Zeitfensters. Werbung muss
so angeordnet werden, dass sie das angestrebte Zielpublikum erreicht.
Je mehr Zuschauer ein bestimmtes Programm erzielt, und je klarer
die Zuschauer hinsichtlich der demographischen Information gebündelt sind,
desto höher
ist der Preis zum Schalten der Werbung. Das bei weitem populärste TV-Bewertungssystem, das
gegenwärtig
in den USA genutzt wird, ist Nielsen Media Research. Das Nielsen-Bewertungs-
und Anteilssystem basiert auf einer nationalen Stichprobe von 5000
Teilnehmern und etwa 50 lokalen Marktproben. Die Information, die
der nationalen Stichprobe entnommen wird, basiert auf einer Messung,
welches Programm zu einem bestimmten Zeitpunkt in einem bestimmten
Fernsehhaushalt von welchen Haushaltsmitgliedern gesehen wird. Die
letztgenannte Information wird über
so genannte People-Meters (Personenmesser) bestimmt, die in den
Stichprobenhaushalten installiert sind, und über die die Zuschauer anzeigen,
wann sie zu einer bestimmten Zeit fernsehen, indem sie einen ihnen
einzeln zugeordneten Knopf drücken.
Die nationale Stichprobe nutzt eher grobe demographische Information,
um die Präferenzbewertungen
für die
Programmbestimmung zu definieren. Die Ergebnisse werden als Wertungen
veröffentlicht,
die im Verhältnis
zu dem statistischen Universum (z.B. allen Fernsehhaushalten, männlich 20
bis 40 Jahre alt usw.) und nach Anteilen definiert werden. Letztere
stellen einen Prozentanteil der Universumsmitglieder dar, die ein
bestimmtes Programm zum Zeitpunkt seiner Ausstrahlung sehen.
-
Ein
etwas genaueres System, das als der Portable People Meter (tragbare
People Meter) bezeichnet wird, wird gegenwärtig auf einem begrenzten lokalen
Fernsehmarkt von Arbitron getestet. Der Portable People Meter ist
ein elektronisches Sende- und Empfangsgerät von der Größe eines
Pagers, das die Fernsehnutzung einer Person über nicht hörbare Codes aufzeichnet, die
die Fernsehprogramme überlagern.
Am Ende des Tages wird das Sende- und Empfangsgerät auf einer
Basisstation angeordnet, von der die aufgezeichnete Information
dann an eine zentrale Datenverarbeitungseinrichtung gesendet wird.
-
Im
Zusammenhang mit der Vorhersage und Modellierung von TV-Nutzer-Profildaten
benutzen die Verfahren und Systeme des Stands der Technik keine
Programmzugangs- und -weggangsfrequenz und Klick-Taktung als Präferenzindikatoren.
Präferenzbewertungen
im Zusammenhang mit Programmvorhersagen sind auf diese Weise eher
rudimentär.
Da Systeme des Stands der Technik Übergänge, sequenzielles Programmverhalten,
und vorübergehende
Programmnutzung nicht in einer allgemein prädiktiven Architektur modellieren, sind
sie nicht dazu in der Lage, die Präferenz eines Nutzers anhand
von ausgefeilten Inhalts- und Zeitverhältnissen vorherzusagen.
-
Da
nicht festgestellt wird, wann angemessene Anzeichen für die Annahme
einer Präferenz
vorliegen, neigen bekannte Verfahren dazu, Nutzerpräferenzen
falsch vorherzusagen oder zu lang zu warten, bis eine höhere Sicherheit
erreicht wird. Bekannte Klassifizierungsverfahren verlangen, dass
alle Merkmalsdimensionen einer Stichprobe mit der Beobachtung korreliert
werden, und führen
dann eine Gaußsche
Verteilungsparametrisierung durch, um Gruppenbildungen zu beschreiben.
Allerdings ist dies ungenau, da die Daten allgemein keiner normalen
Verteilung unterliegen.
-
Im
Zusammenhang mit der Bestimmung der Programm- oder Werbeprogrammpräferenz verfügen die Verfahren
des Stands der Technik nicht über
eine automatische Nutzereingabe, und also über kein Verfahren zum Feststellen,
welche Messwerte die Präferenz
eines bestimmten Nutzers am besten vorhersagen. Wenn Präferenzwertungen
für eine
bestimmte demographische Gruppe vorliegen, sind diese zudem nur
stationär
gewichtet, und es wird keine dynamische Gewichtungsanpassung durchgeführt.
-
Im
Zusammenhang mit dem zielgerichteten Werben für Fernsehen und interaktives
Fernsehen benutzen die Verfahren des Stands der Technik hauptsächlich demographische
Information, und nicht kontextabhängige Verhaltensinformation
als Teil des Nutzerzielrichtungsprofils. Dies reduziert die Zielrichtungsleistung für nicht
demographisch klassifizierbare Nutzergruppen und die demographische
Beurteilungsgenauigkeit.
-
KURZDARSTELLUNG
DER ERFINDUNG
-
Deshalb
ist es eine Aufgabe der Erfindung, ein System und Verfahren für eine Verhaltensmodellgruppierung
bei der TV-Nutzung und für
zielgerichtete Werbung und Präferenzprogrammgestaltung
bereitzustellen, das die oben genannten Nachteile der bislang bekannten
Vorrichtungen und Verfahren dieses allgemeinen Typs überwindet.
-
Unter
Berücksichtigung
dieser und anderer Aufgaben ist, gemäß der Erfindung, ein Fernsehbewertungssystem
zur zielgerichteten Programm-Bereitstellung bereitgestellt, das
Folgendes umfasst:
eine Gruppierungsmaschine, die Fernseh-Dateneingaben
empfängt,
die Sehdateneingaben verarbeitet, und Nutzerprofile zur Ausrichtung
an Werbekategoriegruppen erzeugt;
ein klientenseitiges System,
das dazu angepasst ist, einen Fernsehnutzer in wenigstens eine Werbekategoriegruppe
einzuteilen;
ein Kontextverhaltensprofil-Erstellungssystem,
das mit dem klientenseitigen System verbunden ist und das Sehverhalten
eines Fernsehnutzers mit Inhalts- und nutzungsbezogenen Präferenzen
bestimmt; und
eine Verhaltensmodell-Datenbank, die mit dem
Profilerstellungssystem verbunden ist, und die darin Information
zu dem Sehverhalten des Fernsehnutzers speichert.
-
Gemäß einem
zusätzlichen
Merkmal der Erfindung ist die Gruppierungsmaschine ein Softwareagent, der
in einem zentralen Computersystem an einem Fernseh-Verteilungskopfende
angeordnet ist, und der programmiert ist, um Verhaltensprofilvorlagen
zu erzeugen, die zielgerichteten Werbekategorien von Fernsehzuschauern
entsprechen.
-
Gemäß einem
zusätzlichen
Merkmal der Erfindung wird die Gruppierungsmaschine im Wesentlichen ausschließlich durch
markierte Sehdaten von einer bestimmten Zielgruppe trainiert, um
ein am weitesten verallgemeinertes Profil der jeweiligen Zielgruppe
zu ermitteln.
-
Gemäß einem
weiteren Merkmal der Erfindung ist die Gruppierungsmaschine dazu
programmiert, Zuschauerprofile in jeder Gruppe in einer repräsentativen
Zusammenstellung zu verallgemeinern, und Werbekategorieprofile zu
bilden durch Summieren aller Dimensionen, die für die jeweilige Gruppe die
stärkte
Gemeinsamkeit und für
alle Zielgruppen die höchste
Besonderheit aufweisen.
-
Gemäß einem
weiteren Merkmal der Erfindung ist ein Werbemanager bereitgestellt,
der angeschlossen ist, um Anfragen an die Verhaltensmodell-Datenbank
zu stellen. Der Werbemanager ist dazu programmiert, Verhaltensprofile
der Verhaltensmodell-Datenbank zu parametrisieren und die parametrisierten
Verhaltensmodelle in einen Werbekategorie-Zugehörigkeitsagenten herunterzuladen,
der in dem klientenseitigen System angeordnet ist. Vorzugsweise
ist der Werbekategorie-Zugehörigkeitsagent
dazu konfiguriert, die heruntergeladenen parametrisierten Zielrichtungsmodelle
zu rekonstruieren, und eine Gruppierungsmaschine auf die Geschichte
des Fernsehzuschauers anzuwenden, um eine wahrscheinlichste Werbekategorie
zu bestimmen, zu der der Nutzer gehört, und die Ergebnisse als
Zielkategorie-Wahrscheinlichkeiten in einer Nutzerkategoriedatenbank
zu speichern.
-
Außerdem können Zielrichtungsagenten
und Präsentationsagenten
vorgesehen sein, die in dem klientenseitigen System angeordnet sind,
um die Zielkategorie-Wahrscheinlichkeiten und relevante Präferenzinformation
zu kombinieren, um wahlweise Werbung zu erfassen, zu speichern und
anzuzeigen, die gemäß der Optimierung
heruntergeladen wurde.
-
Unter
Berücksichtigung
der genannten und anderer Aufgaben ist außerdem gemäß der Erfindung eine Präferenzmaschine
zum Nutzen in einem interaktiven Anzeigesystem bereitgestellt, mit
einer Kopfendseite, die den Programminhalt verteilt, und einer Klientenseite,
die den Programminhalt empfängt
und den Programminhalt selektiv gemäß der Auswahl des Nutzers anzeigt.
Die Präferenzmaschine
bestimmt den bevorzugten Programminhalt des Nutzers und umfasst:
eine
Nutzerüberwachungsvorrichtung,
die an der Klientenseite angeschlossen ist, um kontextabhängige Übergangsverhaltensweisen
aufzuzeichnen, um ein Profil für
einen oder mehrere Nutzer zu erstellen, und um kontinuierlich eine
Informationsdatenbank mit Präferenzen
und kontextabhängigen Übergangsverhaltensweisen aufzubauen,
um ein Profil für
den oder die Nutzer zu erstellen; und
eine Vorrichtung zum
Bereitstellen des Programminhalts an den oder die Nutzer gemäß der demographischen Information
des Nutzers und dem kontextabhängigen Übergangsverhaltensprofil.
-
Die
Nutzerüberwachungsvorrichtung
der Präferenzmaschine
modelliert die Verhaltensinteraktion des Nutzers mit Werbeprogramminhalten
und mit Unterhaltungsprogramminhalten.
-
Gemäß einem
weiteren zusätzlichen
Merkmal der Erfindung ist die Präferenzmaschine
angeschlossen, um von dem Kopfende Metadaten zu empfangen, die den
Werbeinhalt beschreiben, und Metadaten, die den Unterhaltungsprogramminhalt
beschreiben, und dazu programmiert, um Inhaltspräferenzen aufzustellen, indem
Metadateninformation mit dem kontextabhängigen Übergangsverhaltensprofil kombiniert
wird, und um eine verhältnismäßige Informationsdatenbank
mit Verknüpfungen
zwischen dem Nutzerverhalten, demographischen Informationen, und
Programminhaltspräferenzen
aufzubauen. Die Präferenzmaschine
ist programmiert, um Muster von Nutzungsverhalten mit einem Verhaltensmodell
zu modellieren und Nutzungsschlüsselinformation
aus dem Verhaltensmodell in eine Verhaltensdatenbank zu extrahieren,
wobei jedem Eintrag in der Verhaltensdatenbank ein Sicherheitswert
zugeordnet wird, der eine Schätzung
einer Struktur- und Stichprobenqualität der Daten widerspiegelt,
die benutzt werden, um den Datenbankeintrag zu berechnen.
-
Unter
Berücksichtigung
der genannten und anderer Aufgaben ist außerdem gemäß der Erfindung ein System
für zielgerichtete
Programmbereitstellung in einem Programminhalts-Bereitstellungssystem
mit einer Kopfend-Seite und einer Klientenseite bereitgestellt.
Das Zielrichtungssystem umfasst:
ein zentrales Datensystem
an der Kopfend-Seite, das Betrachtungsdaten empfängt, die von der Gruppe ausgewählt sind,
die aus Betrachtungsdaten, Betrachtungsstartzeit, Betrachtungsdauer,
und Betrachtungskanal besteht, demographische Information, die einen
Programmnutzer beschreibt, und einen elektronischen Programmführer mit
Metadaten, die einen Programminhalt beschreiben;
einen Erfasser
einer demographischen Gruppeninformationsdatenbank, der Verhaltensdaten
des Nutzers empfängt
und eine Informationsdatenbank in Form einer Übergangsmatrix mit Gewichtungsgruppen
ausgibt, wobei die Übergangsmatrix
eine demographische Gruppe des Nutzers vorhersagt; und
ein
Programminhalts-Erzeugungsmodul, das Abläufe von Programminhalt einschließlich Werbung
an die Klientenseite bereitstellt, basierend auf der vorhergesagten
demographischen Gruppe des Nutzers.
-
Gemäß einem
weiteren zusätzlichen
Merkmal der Erfindung ist eine Realzeit-Rückkopplungsschleife zum
Bereitstellen von Realzeitinformation zum Sehverhalten eines Nutzers
an das zentrale Datensystem mit Klick-Ablaufdaten bereitgestellt.
-
Gemäß einem
weiteren zusätzlichen
Merkmal der Erfindung basiert der Erfasser der demographischen Gruppeninformationsdatenbank
auf einem verborgenen Markow-Modell.
-
Gemäß einem
weiteren Merkmal der Erfindung sind der Erfasser der demographischen
Gruppeninformationsdatenbank und das Programminhalts-Erzeugungsmodul
Softwaremodule, die jeweils dazu angepasst sind, auf einem maschinenlesbaren
Medium in Form von mehreren von einem Prozessor ausführbaren
Befehlen gespeichert zu sein.
-
In
einer bevorzugten Ausführungsform
erzeugt der Erfasser der demographischen Gruppeninformationsdatenbank
demographische Gruppeninformation des Nutzers in Bezug auf statistische
State-Machine-Übergangsmodelle.
Die State-Machines sind in der Übergangsmatrix
definiert, und die Übergangsmatrix enthält Information
zu den Programmübergängen, die
von dem Zuschauer eingeleitet wurden.
-
Vorzugsweise
sind wenigstens zwei gleichzeitig laufende Übergangsmatrizen vorgesehen,
darunter eine Kanalmatrix und eine Genrematrix. Andere Matrizen
sind ebenfalls möglich,
wie z.B. eine Titelmatrix, eine Schauspielermatrix usw.
-
Gemäß einem
weiteren Merkmal der Erfindung ist der Erfasser der demographischen
Gruppeninformationsdatenbank dazu konfiguriert, das Nutzerverhalten
mit einem pseudo-verborgenen Doppelzufalls-Markow-Verfahren zu parametrisieren,
und eine statistische Niedrigniveau-State-Machine zu definieren, die eine Verhaltensgruppe
modelliert, und eine statistische Spitzenniveau-State-Machine mit
aktiven Verhaltensgruppen und einer Interaktion zwischen den aktiven
Verhaltensgruppen.
-
Gemäß einem
begleitenden Merkmal der Erfindung ist der Erfasser der demographischen
Gruppeninformationsdatenbank dazu konfiguriert, einen Doppelzufallsprozess
mit mehreren Dimensionen zu definieren, und parallele statistische
State-Machine-Übergangsvorgänge in wenigstens
zwei oder drei Zustandskategorien einschließlich Kanal, Genre und Titel
des Programminhalts zu bestimmen.
-
Das
globale Profil stellt demographische Gruppeninformation des Nutzers
in Bezug auf die statistischen State-Machine-Übergangsmodelle dar. Die Erfindung
stellt das Vorhersagen und Modellieren von Fernsehnutzer-Profildaten
bereit: Die resultierenden Verhaltensmesswerte tendieren dazu, Individuen
und ihre Präferenzen
individuell zu charakterisieren. Die Übergangsprozesse modellieren
Nutzersequenzen und vorübergehende Übergangspräferenzen.
Die Erfindung stellt ein Verfahren zum Bestimmen der Sicherheit
bezüglich Datenquantität und -qualität bereit;
einen Algorithmus zum Bestimmen einer Distanz zwischen nicht-Gaußschen hochdimensionalen
Verteilungen; und ein Verfahren zum Bestimmen einer angemessenen
Separation zwischen Gruppen zur Gruppenzugehörigkeits-Klassifizierung.
-
Die
Anfrageschnittstelle gemäß der Erfindung
stellt Verhaltenspräferenzinformation
an andere Systemmodule bereit.
-
Die
neuartige Präferenzbestimmung
des Programms oder Werbeprogramms benutzt:
- – gewichtete
unscharfe Stimmpräferenzmesswerte
basierend auf dem modellierten Nutzungskontext, der Inhaltszugriffszeit,
und der Inhaltsparameter-Sequenzierung
- – frequenzverstärkte, nichtlineare
Präferenzmesswert-Stimmgewichts-Lernarchitektur
- – einen
Summierungsalgorithmus, der die n Spitzen-Inhaltsparameter (d.h.
Kanäle,
Genres, Schauspieler, Titel usw.) bestimmt, indem Stimme für Stimme
Qualität
und relative Präferenztrends
angepasst werden.
-
In
einer weiteren Konzeptgruppe stellt zielgerichtetes Werben für Fernsehen
und interaktives Fernsehen Folgendes bereit:
- – ein Trainingsverfahren
zum Zusammenstellen von Nutzern in der Zielkategorie
- – ein
Feinabstimmungsverfahren zum Erzeugen der repräsentativsten Nutzerausrichtungs-Kategorievorlage,
und zum effizienten Laden derselben in das Klientenfernsehsystem
- – ein
effizientes Verfahren zum Bestimmen der Nutzerausrichtungs-Kategoriezugehörigkeit
- – automatische
Erzeugung einer Programmsequenz des virtuellen Kanals unter Benutzung
gespeicherter bevorzugter Programmgestaltung, präsentiert als ein Kanal in dem
EPG.
-
Schließlich sind
Algorithmen vorgesehen, die gemäß dem bevorzugten
Kontext des Nutzers (d.h. Zeit, Sequenz usw.) gespeicherte Programme
und Werbeprogramme automatisch in den EPG eines virtuellen Kanals
stellen (zusammen mit normalen EPG-Einträgen).
-
Die
Erfindung stellt so ein sehr genaues System zum Vorhersagen und
Modellieren von Fernsehnutzer-Profildaten bereit. Verfahren des
Stands der Technik benutzen keine Programmzugangs- und -weggangsfrequenz
und -zeiten als Präferenzindikatoren,
so dass sie weniger genaue Präferenzwertungen
aufweisen. Hier werden Kategorien wie Gefallen, Nichtgefallen, und
Surfbedingungen separat modelliert, um die verschiedenen Bedeutungen
des Verhaltens einer Person für
jeden Fall besser zuzuordnen. Systeme des Stands der Technik modellieren
den sequenziellen und zeitlichen Übergang in einer allgemeinen
vorhersagenden Architektur nicht. So sind sie nicht dazu in der
Lage, die Präferenz
eines Nutzers anhand verfeinerter Inhalts- und Zeitverhältnisse
vorherzusagen. Indem nicht festgestellt wird, wann angemessene Anzeichen
zur Herleitung einer Präferenz
vorliegen, neigen bekannte Verfahren dazu, Nutzerpräferenzen
falsch vorherzusagen, oder sie warten zu lang, bevor eine höhere Sicherheit
aufgebaut wird.
-
Bekannte
Klassifizierungsverfahren verlangen, dass alle Merkmaldimensionen
einer Stichprobe mit der Beobachtung korreliert werden, und führen dann
eine Gaußsche
Verteilungsparametrisierung durch, um Gruppen zu beschreiben. Allerdings
ist dies ungenau, da die Daten im Allgemeinen nicht normal verteilt
sind. Die vorliegenden Verfahren sind dazu in der Lage, Gruppendistanzen
von multimodalen (nicht glockenförmigen)
Verteilungen zu bestimmen, und sparen Speicherplatz, indem sie nicht
jeden Stichprobenpunkt im Merkmalsraum bewahren. Außerdem treffen
Verfahren des Stands der Technik keine optimalen Entscheidungen zur
Gruppenklassifizierung, wenn die Stichprobenverteilungen multimodal
sind. Das System und das Verfahren der vorliegenden Erfindung führen angemessenere
Gruppenklassifizierungen durch, da sie mit einer arbiträren Verteilungsform
arbeiten.
-
Aufgrund
der überlegenen
und facettenreichen Verhaltensmodellierung ermöglicht die Erfindung eine genaue
Bestimmung der Programm- oder Werbungspräferenz. Indem reiche zeitliche
und sequenzielle Kontextinformation einbezogen wird, sagt das vorliegende
System die kontextabhängigen
Präferenzen
eines Nutzers voraus. Die Erfindung nutzt automatische Lernverfahren,
d.h., explizite Nutzereingaben, um die Präferenz eines jeweiligen Nutzers
optimal vorherzusagen. Das vorliegende System passt Präferenzvorhersageparameter
dynamisch an, um eine höhere
Gewichtung für
die am stärksten
prädiktiven
Merkmale beim Bewerten eines Inhaltsparameters zu benutzen.
-
Das
vorliegende System beeinflusst Präferenzwertungen mit stichprobenweisen
Wertungstrends, die die Systeme des Stands der Technik einfach summieren.
Durch Erhöhen
(Herabsetzen) einer Wertung mit Stichproben höherer (niedrigerer) Qualität wird eine
genauere relative Präferenzmetrik
erreicht. Durch besseres Modellieren des Präferenzverhaltens ermöglicht die
Erfindung also weit überlegene
Werbe- und Fernsehprogrammzielrichtung.
-
Im
Zusammenhang mit zielgerichteter Werbung für Fernsehen und interaktives
Fernsehen benutzen die Verfahren des Stands der Technik hauptsächlich demographische
Information, und nicht kontextabhängige Verhaltensinformation
als Teil des Nutzerprofils zur zielgerichteten Werbung. Entsprechend
liegen die Zielrichtungsleistung für nicht demographisch klassifizierbare
Kundengruppen und die demographische Annahmegenauigkeit niedriger.
-
Das
vorliegende System reduziert die Profilgröße, indem es weniger konservative
statistische Signifikanzmetrik benutzt, was die Größe der Zielrichtungsvorlage
weiter reduziert, während
die Klassifizierungsleistung aufrechterhalten wird, indem keine
statistisch falsche Profilinformation geladen wird. Indem die Zugehörigkeit
eines Fernsehzuschauers zu einer Zielkategorie als sicherheitsherabgesetzte
Distanzen von einfachen lokalen Vorlagen hergeleitet wird, erreicht
das vorliegende Verfahren sehr genaue proportionale Zugehörigkeitswahrscheinlichkeiten,
da, im Gegensatz zu dem Stand der Technik, Vorlagenproflle in statistischer
Hinsicht nicht falsch parametrisiert werden.
-
Zusätzlich zum
genauen Klassifizieren der Zuschauerpräferenzen für zielgerichtete Werbung ermöglicht die
Erfindung außerdem
die automatische Erzeugung vorgeschlagener Programmsequenzen. Hier
beziehen wir uns auf die Erzeugung einer Programmsequenz für einen
virtuellen Kanal mit Hilfe einer gespeicherten bevorzugten Programmgestaltung.
Die vorgeschlagene Programmsequenz kann als ein separater Kanal
in dem elektronischen Programmführer
(EPG) präsentiert
werden. Der virtuelle Kanal ist gegenüber Systemen des Stands der
Technik insofern überlegen,
als der Nutzer den EPG des virtuellen Kanals mit derselben Gestaltung
und demselben Eindruck erlebt wie jeden anderen Kanal, nur dass
die Programme und Ausstrahlungszeiten so angeordnet sind, wie der
Nutzer es bevorzugt. Der virtuelle Kanal stellt ein höheres Niveau
bevorzugter Programmgestaltung bereit als die einfache Auflistung
von Inhalten, die im lokalen Speicher verfügbar sind. Das neuartige System
gibt dem Fernsehnutzer das Gefühl
eines Kanals „auf
Abruf".
-
Hinsichtlich
System und Geschäftsmodell
zielt die vorliegende Erfindung auf ein zielgerichtetes Werbesystem
ab, das Folgendes bereitstellt:
- – Ein innovatives
Gruppierungsverfahren zum Erzeugen und Bestimmen der repräsentativsten
Fernseh-(TV, bezeichnet digitales Fernsehen oder eine Kombination
aus analogem Fernsehen und einem Digitalempfänger, beide mit Programmspeicherung)-Nutzerprofile,
die am besten auf individuelle Nutzer-Werbekategoriegruppen ausgerichtet
sind.
- – Ein
klientenseitiges System zum Klassifizieren eines TV-Nutzers in eine
oder mehrere Werbegruppenkategorien.
- – Ein
kontextabhängiges
Profilerstellungssystem, das die TV-Nutzung und inhaltsbezogene
Präferenzen
eines Nutzers bestimmt.
- – Eine
Verhaltensmodelldatenbank, die von anderen Systemmodulen nach Nutzerpräferenzen
abgefragt wird, und die verhaltensgemäß zielgerichtete Werbung, den
Aufbau eines präferentiellen
elektronischen Programmführers
(EPG) für
den virtuellen Kanal, eine Speicherung bevorzugter Programm, und
automatische Programmvorschläge
unterstützt.
-
Das
neuartige zielgerichtete Werbungssystem leitet die Werbekategorie
eines TV-Nutzers her, ohne dass der Zuschauer die Information explizit
eingeben muss. Eine Werbekategorie bezeichnet hier eine Gruppe von
beschreibenden Merkmalen, die eine Untergruppe von Nutzern in Kategorien
einteilt, die mit einem Zielinteresse von Werbern korreliert werden
können.
Traditionell basierten diese Kategorien auf demographischen Merkmalen;
allerdings erweitert die vorliegende Erfindung die Nutzermodellierung
und -zielrichtung, um Verhaltensmesswerte einzubeziehen. So wird
ein wesentlich robusteres und stärker
verfeinertes System für
zielgerichtete Werbung möglich.
Anders als beim Stand der Technik ist das vorliegende zielgerichtete
System nicht von programmierten Daten, sondern von Verhaltensdaten
angetrieben. Die Grundvoraussetzung dieser Erfindung ist, dass Personen
der gleichen Kategorie bestimmte Verhaltensweisen aufweisen, die
mit einem beträchtlichen
Grad von Konsistenz modelliert und gruppiert werden können. Der
primäre
zugrunde liegende Aspekt der Erfindung ist es, ein genaues Modell
des dynamischen Prozesses zu entwickeln, so dass eine Gruppierungsmaschine
mit einer praktischen Gruppe von charakteristischen Dimensionen
effizient die große
Mehrheit der Zuschauer separieren oder klassifizieren kann. Zusätzlich zur
automatischen Zielrichtung auf Werbekategoriezugehörige ist
es das Ziel, die Verhaltensmodellierungs-Maschine und -Datenbank
anzuwenden, um die kontextabhängige
Präferenz
eines TV-Nutzers für
Programmgestaltung und Werbung zu bestimmen.
-
Die
vorliegende Erfindung modelliert das Betrachten eines TV-Programms
als einen pseudoverborgenen Doppelzufalls-Markow-Prozess, wobei
eine verborgene statistische State-Machine (SSM) niedrigen Niveaus
vorhanden ist, die eine Verhaltensgruppe modelliert, und eine beobachtbare
Spitzenniveau-SSM, die die aktiven Verhaltensgruppen und deren Interaktion
untereinander herleitet. Das System wird mit markierten Lerndaten
(z.B. Realzeit-TV-Klick-Ablaufdaten,
die mit der demographischen Identität von Zuschauern markiert sind)
einer statistisch repräsentativen,
fernsehenden Bevölkerungsstichprobe
trainiert. Das Klassifizierungsmodell ist eine hybride Kombination
eines parametrisierten Zufallsprozesses, Heuristik, und mehrerer eindimensionaler
Verhaltensmesswerte. Mehrere Datenqualitätsmesswerte bestimmen die statistische
Signifikanz und Sicherheit von Trainings- und Testdaten.
-
Die
vorliegende Erfindung umfasst einen innovativen Sicherheitsmesswert
von Stichprobengröße. Diese
Metrik schätzt
die Abweichung in dem Zufallsprozess, der die SSM antreibt, indem
unter der Annahme, dass Zustandsübergänge gleichmäßig zufällig ausgewählt wurden,
das Verhältnis
der erwarteten Zustandsübergangsabdeckung
zu der tatsächlichen
Zahl beobachteter verschiedener Zustandsübergänge berechnet wird. Das Verhältnis stellt
den Zustandsübergangsfokus
im Vergleich zum -zufall dar und zeigt an, inwieweit genügend Stichproben
vorhanden sind, um einen nicht-uniformen Zufallsprozess, insbesondere
die Persönlichkeit
eines Zuschauers, als die SSM-Struktur in bedeutungsvoller Weise
bestimmend herzuleiten.
-
Das
Doppelzufalls-Prozessmodell weist mehrere Dimensionen auf, um eine
breite Spanne von typischen, aber oft individuellen TV-Nutzungsverhaltensweisen
zu erfassen. In der bevorzugten Ausführungsform erzeugen jede Handlung
des Nutzers oder gewählte
Nicht-Handlungen des Nutzers parallele SSM-Übergänge in jeder der drei Zustandskategorien:
Kanal, Genre und Titel.
-
Diese
Zustandskategorien sind weiter in den Zustand der Merkmale gefallend/nicht_gefallend
und kurzes_sehen/nicht-kurzes_sehen unterteilt. In jeder kategorischen
State-Machine, die hier beschrieben ist, sind chronologische Dimensionen
vorhanden, die zeitabhängige
Zustandsübergänge modellieren.
Die zeitlichen Dimensionen der bevorzugten Ausführungsform modellieren die Übergangschronologie
mit Hilfe einer neuen Strategie, die Wochentag, Tageszeit, abgelaufene_Zeit_nach_Einschalten_des_Fernsehers,
und seit_der_letzten_Änderung_verstrichene_Zeit
enthält.
Der Programmauswahlprozess des TV-Nutzers ermittelt, wenn er durch dieses
zeit- und übergangsabhängige Modell
betrachtet wird, komplexe Nutzungsmuster, die dazu neigen, für Individuen
und im weiteren Sinne für
interessante Klassen von Individuen einzigartig zu sein. Verhaltenssequenzen,
die größer als
ein Übergang
sind, wie z.B. Kanalsurfen, und mehrere heuristische Verteilungen,
wie z.B. Sitzungssehzeiten, und psychometrische Parameter, wie z.B.
Genreneugier, liegen als Dimensionen in einem pseudo-euklidischen
Klassifizierungsraum außerhalb
der SSM.
-
Ein
neuartiges Gruppierungsverfahren kombiniert die SSM-Übergangsmodelle
(mit Hilfe von Parametrisierungsverfahren für die Übergangsmatrix) und nicht-Gaußsche Parameterverteilungen
(durch Definieren individueller Histogramm-Verteilungsdistanzmesswerte),
um durch eine Dimensionswahlarchitektur eine Nutzerseparabilität zu bestimmen.
Jede Dimension bestimmt zwei Gruppierungen als separat, wenn die
mittlere Separationsdistanz zwischen den meisten Punkten größer ist
als ihre Separationsvarianz. Das Überschreiten einer bestimmten
Schwellenanzahl von dimensionalen Separationsstimmen bestimmt, ob
die Gruppierungen separat sind. Der Anteil der Dimensionen, die
als nicht zwischen zwei Gruppierungen separabel bestimmt werden,
nähert
ihre Überlappungsgröße an.
-
Gemäß einem
zusätzlichen
Merkmal der Erfindung ist der Gruppierungsmaschinen-(GM)-Softwareagent in
einem singulären
Computersystem angeordnet, das an dem TV-Verteilungskopfende (bezeichnet
als Werbemanager) angeordnet ist, und erzeugt Verhaltensprofilvorlagen,
die Zielwerbekategorien von Fernsehzuschauern entsprechen. Um das
am stärksten
verallgemeinerte Profil einer bestimmten Zielgruppe festzustellen,
wird die GM allein mit markierten Sehdaten dieser Gruppe trainiert.
Die GM verallgemeinert die Zuschauerprofile jeder Gruppe in eine
repräsentative
Zusammenstellung für
die jeweilige Zielwerbekategorie.
-
Werbekategorieprofile
entwickeln sich, indem alle Dimensionen summiert werden, welche
bei der Gruppe die stärkste
Gemeinsamkeit zeigen und für
die Zielgruppen am individuellsten sind.
-
Gemäß einem
weiteren Merkmal der Erfindung, der prototypischen Werbegruppenkategorie,
werden Verhaltensprofile innovativ durch den Organisationsteil für die Verteilung
von Werbungs- und
Werbeprogramminformations-Metadaten des Werbemanagers (bezeichnet
als Werbeserver) parametrisiert, um die Zielmodelle für das bandbreiteneffiziente
Herunterladen auf Werbekategorie-Zugehörigkeitsagenten (MitgliedAgent) zu
komprimieren, die in den Feldfernsehern angeordnet sind.
-
Gemäß einem
weiteren Merkmal der Erfindung rekonstruieren die Feldfernseher-MitgliedAgenten
die heruntergeladenen parametrisierten Zielmodelle und benutzen
eine ähnliche
GM, die auf die TV-Nutzerhistorie angewandt wird, welche von dem
TV-Profilerstellungsagenten (ProfAgent) erzeugt wird, um die wahrscheinlichsten
Werbekategorien zu bestimmen, zu denen der Nutzer gehört, und
die Resultate in die Nutzerkategoriedatenbank einzugeben. ZielundSpeicher-Agenten
und Präsentationsagenten
(PräsAgent)
im Fernseher kombinieren diese Zielkategoriewahrscheinlichkeiten
und andere relevanten Informationen (PräfInfo), um selektiv die optimalen
heruntergeladenen Werbefilme zu erfassen, zu speichern und an den
Nutzer auszustrahlen, einschließlich
Videos und Bannern.
-
Die
ProfAgenten im Klienten oder in den Feldfernsehern bauen fortlaufend
eine Informationsdatenbank zu Präferenzen
und kontextabhängigen Übergangsverhaltensweisen
auf, welche ein Profil für
den/die TV-Nutzer des Haushalts bilden. Der ProfAgent modelliert
die Verhaltensinteraktion mit Werbung und regulären, oder unterhaltenden, Programmen
in derselben Weise, allerdings mit möglicherweise unterschiedlichen Zustandskategoriebezeichnungen.
Präferenzen
für Unterhaltungsprogramme
umfassen Affinitäten
für ein
Metadatenfeld oder Einträge
in einem elektronischen Programmführer (EPG), wie Titel, Genres,
Kanäle
und Schauspieler. Ein Übergang
tritt zwischen entsprechenden Programm-EPG-Einträgen auf (z.B. erzeugt ein Übergang
zwischen Programmen mit unterschiedlichen Kanälen und Genres einen entsprechenden
Kanal- und Genreübergang).
Werbung weist eine eigene Version von EPG-Information auf, die ähnlich wie
die regulärer
Programme ist. Das System lernt die Werbeübergangspräferenzen eines Nutzers in derselben
Art und Weise wie bei regulären
Programmen, mit der Ausnahme, dass das Werbegenre der Standard-Industriecode (SIC)
ist, der Titel der Werbung der universelle Produktcode (UPC) oder
SKU-Code ist, und dass das System den Schauspieler der Werbung als
den Unternehmenssponsor betrachtet. So modellieren identische Datenstrukturen
und Algorithmen die Programm- und Werbeübergangsverhaltensweisen des
Nutzers.
-
Diese
Information wird von einem Kopfende in den Metadaten der Werbung
in derselben Weise bereitgestellt, wie Inhaltsinformationsdaten
und EPG der Ausstrahlung vorgeschaltet sind. Daher lernt der ProfAgent
die Produkt- und Sponsorgruppenpräferenz für Werbung in derselben Weise,
wie Genre- und Schauspielerpräferenzen
gelernt werden, wie hier genau beschrieben werden soll. Dies ermöglicht die
gezielte Zielrichtung von Werbung nicht nur auf die hergeleitete
Demographie eines Nutzers, sondern auf dessen spezifische Interessen
hinsichtlich Produkt- oder
Unternehmensmarken oder allgemeiner Produktkategorien. Beispielsweise
kann der ProfAgent durch den SIC herausfinden, ob ein Nutzer Finanzdienstleistungs-
oder Autowerbung mag. Ähnlich
kann eine Pepsi-Cola-Markenkampagne auf Nutzer abzielen, die den
Erfrischungslimonaden-SIC mögen,
oder speziell Werbung mit dem Namen Coca Cola. In einem anderen
Aspekt könnte
das Unternehmen Gillette mit Hilfe des UPC auf Nutzer abzielen,
denen speziell Werbung eines elektrischen Rasierers des Modells
Remington 3000 gefällt.
In einem weiteren Aspekt des Zielrichtungssystems könnte eine
Werbeagentur auf Nutzer abzielen, die beispielsweise Werbung der
Apple Computer Company, aber keine andere Computerwerbung mögen. Es
kann sein, dass diese Nutzer durch ihre Werbung unterhalten werden,
aber kein Interesse an ihrem Produkt haben. Dies könnte eine
Gelegenheit für
die Werbeagentur bieten, eine Infomercial-Werbung auf den Nutzer
auszurichten, um für
den Nutzer eine Brücke
vom Markenbewusstsein hin zum Produktkauf zu errichten.
-
Im
Laufe der Zeit erkennt eine groß angelegte
Verhältnisinformations-Datenbank
sehr wertvolle Beziehungen zwischen dem TV-Nutzungsverhalten des
Nutzers, Demographie, Programmen und Werbepräferenzen. Diese Informationsdatenbank
erhöht
nicht nur die Zielgerichtetheit im Fernsehen, sondern weist auch
ein Einnahmenerzeugungspotential durch Vermarktung der gesammelten
persönlichen
Information an Dritte auf.
-
In
einem Beispiel der vorliegenden Erfindung modelliert ein TV-ProfAgent
Muster des TV-Nutzungsverhaltens
mit einem Verhaltensmodell (VM), das ähnlich aufgebaut ist wie die
Gruppierungsmaschine, die am TV-Kopfende benutzt wird, und extrahiert
Nutzungsschlüsselinformation
von dem VM in einer Verhaltensdatenbank. Jeder Eintrag der Verhaltensdatenbank
weist einen Sicherheitswert auf, der von einer Vielzahl neuartiger
Verfahren erzeugt wird, die hier detailliert vorgestellt werden
sollen. Die in der Datenbank eingetragene Sicherheit, die von dem
ProfAgent registriert wird, spiegelt eine Schätzung der Struktur- und Stichprobenqualität der Daten
wider, die benutzt wurden, um den Datenbankeintrag zu berechnen.
-
Das
Fernsehgerät
empfängt
Werbezielrichtungs-Metadaten mit beschränkenden Anfragebedingungen,
um die betreffende Werbung nur ausgewählten Nutzern zu zeigen, deren
Datenbankeinträge
die Anfragebeschränkungen
erfüllen.
Jede Werbemetadaten-Anfragebedingung
weist eine minimale Sicherheitsschwellen-Bedingung auf, die das
niedrigste Sicherheitsniveau der Erfüllung der Anfragebedingung
oder Anfragebedingungen angibt, die akzeptabel sind, um eine Werbung
zu zeigen.
-
Beispielsweise
führt eine
Werbezielrichtungsbeschränkung
wie „Geschlecht:
Männlich@80%
UND Alter:25-35@50%" dazu,
dass die Werbung nur Nutzern gezeigt wird, für die der vorbestimmte ZUSAgent
zuvor mit einer Sicherheit von 80% annimmt, dass sie männlich sind,
und mit einer Sicherheit von 50% annimmt, dass sie zwischen 25 und
35 Jahre alt sind.
-
In
einem anderen Aspekt der Festlegung des Sicherheitsniveaus liegt
folgende Sicherheitsschwelle auf Ausdrucksniveau vor: „(Geschlecht:
Männlich
UND Alter:25-35)@80%".
Dieser Zielrichtungsmodus wählt nur
solche Nutzer zur Werbungsausstrahlung, für die das System mit wenigstens
80%iger Sicherheit annimmt, dass sie männlich und zwischen 25 und
35 Jahre alt sind. Diese Verfahren stellen Flexibilität bereit
und erlauben es Werbung, die wichtigsten Zielrichtungsauswahlbedingungen
festzulegen, oder einen Gruppe von Personen festzulegen, die dem
gewünschten
Zielprofil nahe genug kommen, um ihnen die Werbung zu zeigen. Der
Zielrichtungs-und-Speicher-Agent (ZUSAgent) wählt nur solche Profile aus
der Datenbank aus, deren gesamte Sicherheitsbewertung pro Dimension
die Anfragebedingungen erfüllt,
die von den Werbezielrichtungsmetadaten aufgestellt sind.
-
In
einem weiteren Aspekt des Sicherheitsschwellenwert-Systems ist das
Anfrageauswahlfilter als ein unscharf logischer und nicht-booleanscher
Ausdruck dargestellt. Der Zielrichtungsanfrageausdruck ist ähnlich wie
die Sicherheitsbedingungen mit Wahrscheinlichkeitsprozentsatz, mit
zwei wichtigen Ausnahmen: Unscharfe Zugehörigkeitsliterale ersetzen die
Prozentualbedingungen, und eine unscharfe Literaltabelle synchronisiert Klient
und Server.
-
Beispielsweise
erscheint der Anfrageausdrucksmodus wie folgt:
„Geschlecht:
Männlich@SEHR_SICHER
UND Alter:25-35@ZIEMLICH_SICHER"
-
Diese
Anfrage würde
Nutzer auswählen,
bei denen der ZUSAgent sehr sicher ist, dass sie männlich sind,
und ziemlich sicher, dass ihr Alter zwischen 25 und 35 Jahren liegt.
Eine unscharfe Literaltabelle (ULT) listet die zulässige Spanne
unscharfer Zugehörigkeit
auf, die für
jede Werbekategorie vorliegen darf. Ein Beispiel einer unscharfen
Literaltabelle (ULT) ist:
Männlich:
[UNSICHER, ZIEMLICH_SICHER, SEHR_SICHER]
Alter: [UNSICHER,
ZIEMLICH_SICHER, SEHR_SICHER, SICHER]
-
Der
Vorteil des letztgenannten Ausdrucksverfahrens ist, dass die neue
Werbeagentur das erforderliche Ausmaß an Sicherheit nur in intuitiver,
nicht-mathematischer Hinsicht festlegt, und die genaue Spanne des Sicherheitsprozentsatzes
der Entscheidung und ständigen
Optimierung durch den ZUSAgenten überlässt. Zusätzlich behandelt das unscharfe
Verfahren die nichtdeterministische Bedeutung der prozentualen Sicherheitsbedingungen
in der Datenbank. Der ZUSAgent erlernt die prozentualen Sicherheitsbewertungsspannen,
die historisch jedem unscharfen Leistungsniveau zugeordnet sind.
-
Andere
Merkmale, die als kennzeichnend für die Erfindung betrachtet
werden, sind in den beiliegenden Ansprüchen dargelegt.
-
Obwohl
die Erfindung hier als in einem System und Verfahren zur Verhaltensmodellgruppierung
bei der TV-Nutzung und zielgerichteter Werbung und Präferenzprogrammgestaltung
dargestellt und beschrieben ist, ist trotzdem keine Beschränkung auf
die dargestellten Details vorgesehen, da verschiedene Modifikationen und
strukturelle Änderungen
daran vorgenommen werden können,
ohne den Geist der Erfindung und den Umfang und Bereich von Äquivalenten
der Ansprüche
zu verlassen.
-
Der
Aufbau der Erfindung, zusammen mit weiteren Aufgaben und Vorteilen
derselben, wird allerdings am besten anhand der folgenden Beschreibung
der spezifischen Ausführungsform
unter Bezugnahme auf die begleitenden Figuren deutlich.
-
Kurze Beschreibung der
Figuren:
-
1 ist
ein Blockdiagramm, das die wichtigsten Module des Systembetreiberteils
des Systems zur Programm- oder Werbezielrichtung gemäß der Erfindung
zeigt;
-
2 ist
ein Blockdiagramm einer Verhaltensgruppenmaschine, die einen Teil
des erfindungsgemäßen Systems
bildet;
-
3 ist
eine diagrammhafte Übersicht über ein
verborgenes Markow-Modell mit Doppelzufallsverarbeitung;
-
4 ist
ein Diagramm, das eine statistische State-Machine mit drei Zustandsräumen zeigt,
die als Wahrscheinlichkeitsdichte-Funktionen dargestellt sind;
-
5 ist
ein Diagramm einer beispielhaften Kanalübergangsmatrix, die eine State-Machine
darstellt;
-
6 ist
ein Blockdiagramm eines Zielrichtungsservers, der ein Werbekategorie-Verhaltensprototyp-Lernsystem
darstellt;
-
7 ist
ein Blockdiagramm, das die Feineinstellung innerhalb des Profils
in dem Gruppensummierungsabschnitt des Zielrichtungsservers aus 6 näher darstellt;
-
8 ist ein Blockdiagramm eines klientenseitigen
Werbekategorie-Klassifizierungssystems;
-
9 ist
ein Blockdiagramm eines Werbezielrichtungssystems, das die Serverseite
und die Klientenseite zeigt;
-
10 ist
ein blockdiagrammhafter Überblick über eine
Architektur einer Maschine zur Präferenzbestimmung;
-
11 zeigt
drei Graphen, die verschiedene Nicht-Surf-Programmbetrachtungsverhältnisse
aufzeichnen (mit 1657 Nutzereingaben);
-
12 sind
vier Graphen, die Statistiken zum Sprungverhalten von 1657 Nutzern
zeigen;
-
13 ist ein Zustandssequenzmodell;
-
14 sind vier Graphen mit typischen statistischen
Verteilungen des Nutzerverhaltens mit der wöchentlichen Aufzeichnung von
1657 Nutzern; und
-
15 sind vier Graphen, die verschiedene zusätzliche
Parameterverteilungen für
die beispielhaften 1657 Nutzer darstellen.
-
Genaue Beschreibung der
bevorzugten Ausführungsformen
-
Detailliert
Bezug nehmend auf die Figuren, dabei insbesondere auf 1,
ist ein diagrammhafter Überblick über ein
erfindungsgemäßes System
dargestellt. Der Kern der Erfindung ist die Anwendung einer verborgenen
Markow-Kette und von statistischen Daten zum Nutzerverhalten, um
die demographische Gruppe eines TV-Zuschauers und/oder das beliebteste
Verhalten für
eine einzelne demographische Gruppe zu modellieren und vorherzusagen.
Das Hauptziel ist es, die demographische Gruppe eines jeweiligen
Zuschauers vorauszusagen, und/oder welche Programme der Zuschauer
gerne sehen würde,
und die Vorhersage- und Modellierungsgenauigkeit zu verbessern,
während
mehr Realzeit-Sehdaten verfügbar
werden.
-
Das
System stellt zwei Verfahren zum Vorhersagen der demographischen
Gruppe eines Zuschauers bereit, nämlich über eine Informationsdatenbank
mit dynamischen demographischen Gruppen (DDG), und basierend auf Ähnlichkeiten
zwischen dem, was ein Zuschauer sieht, und den virtuellen Kanälen, die
von dem PBMO für
die demographische Gruppe vorhergesagt werden.
-
Wie
oben erwähnt,
befassen sich die wichtigsten Aufgaben der Erfindung mit der gezielten
Ausrichtung von Werbeinhalten und Programminhalten auf einen Zuschauer
oder eine Gruppe von Zuschauern, die bestimmte demographische Bedingungen
erfüllen,
wenn eine solche Anforderung vorliegt.
-
Das
in 1 gezeigte System ist in ein Kopfende und einen
Klienten unterteilt. Programmgestaltung, Werbeinhalt und Sequenzierung
des TV-Inhalts wird an dem Kopfende bestimmt. Die Programmablaufinformation
wird in einem Multiprogrammstrom an die Klientenseite übertragen.
Wie durch die gestrichelte Linie angezeigt, stellt, zurückkehrend
von dem Empfänger
an das Kopfende, eine Programmauswahl-Rückkopplung Realzeit-Information
zum Sehverhalten des Klienten bereit. Obwohl die Rückkopplungsverbindung
im Allgemeinen in digitalen Kabelsystemen oder anderen direkten
Verbindungssystemen verfügbar
ist, kann die Erfindung auch ohne direkte Rückkopplung implementiert werden.
Details der Realzeit-Rückkopplung
und der Ausführungsformen
mit Stichproben-Rückkopplung
werden aus der folgenden Beschreibung hervorgehen.
-
Die
Daten, die von außen
angeordneten Quellen bereitgestellt werden, enthalten Information
zu der Fernsehüberwachungsinformation
aller demographischen Gruppen, an denen Anbieter von Werbung oder
Inhalten interessiert sein könnten.
Diese Variablen umfassen (a) Sehdatum, (b) Sehbeginn (c) Sehdauer,
(d) Sehkanal, und (e) demographische Information des Nutzers, wie
z.B. Alter, Geschlecht usw. Die Eingabedaten enthalten außerdem Information
zum empfangenen elektronischen Programmführer (EPG).
-
Die
historischen Daten erfüllen
die Rolle der Vorinformation zu den demographischen Gruppen. Diese Daten
definieren die Verhaltensinformation des Zuschauers. Die Systeminformation
beschränkt
sich zunächst auf
diese demographischen Gruppen.
-
Der
Kern der Erfindung – hinsichtlich
der Erfassung von Daten für
das nötige
Verhaltensmodell – ist der
Erfasser der Informationsdatenbank für demographische Gruppen, der
auf dem verborgenen Markow-Modell basiert. Die Eingabe des Moduls
sind die Verhaltensdaten und, wenn verfügbar, die Klickablauf-Rückkopplung.
Die Ausgabe des Moduls ist die Informationsdatenbank in Form einer Übergangsmatrix
mit Gewichtungsgruppen, die im folgenden Text erläutert werden.
-
Die
Erfindung stellt außerdem
Verbesserungen bei dem Modellieren und Vorhersagen basierend auf Rückkopplungsinformation
bereit, welche Realzeit-Verhaltensdaten in der Form von Klick-Abläufen (z.B.
Fernbedienungs- oder TV-Gerät-Klicksequenzen)
enthält.
-
Unter
Hinwendung zu verschiedenen Details des neuartigen Systems zeigt 2 eine
pseudoeuklidische Verhaltensgruppenmaschine (VGM) gemäß einer
Ausführungsform
der vorliegenden Erfindung. Ein pseudo-verborgenes Markow-Modell 1 (pVMM)
erfasst Verhaltenszustandsübergänge. Ein
Heuristische-Verhaltensmetrik-(HVM)-Unterblock 2 ermittelt
algorithmisch mehrere vorhersagende TV-Nutzermerkmale und stellt
diese statistisch dar. Der TV-Steuerablauf 3 des TV-Nutzers,
z.B. der Klick-Ablauf der Fernbedienung, wird an das pVMM und die
HVM geleitet. Diese Blöcke
sind zu einem hochdimensionalen Klassifikationsraum 5 parametrisiert,
der eine räumliche
Gruppierung der Trainingsdaten an Folgemodule 6 weiterleitet.
-
3 ist
ein Diagramm, das sich auf den pVMM-Block aus 2 konzentriert.
Mehrere statistische State-Machines arbeiten im Tandem, um den Nutzer-Klickablauf
zu modellieren. Die bevorzugte Ausführungsform weist mehrere verborgene
Verhaltensprozesse niedrigen Niveaus auf, und einen Nutzerübergangsprozess
des Spitzenniveaus. Die verborgenen Zufallsprozesse umfassen die
Titelzustandsräume
Kanal, Genre, und Gefallen, die parallel operieren. Der Spitzenniveau-Zufallsprozess,
oder die statistische Spitzenniveau-State-Machine (SSM), modelliert
die Wahrscheinlichkeit, dass bestimmte Verhaltensprozess-Aktivierungen,
und andere heuristische Verhaltensfaktoren, einen bestimmten Nutzer
nahe legen. Jeder Zustandsraum weist einen vorübergehend sensiblen Übergangsunterraum
auf, der verschiedene zeitlich abhängige Nutzerverhaltensweisen
verfolgt.
-
Die
Architektur der pseudo-euklidischen Verhaltensgruppenmaschine (VGM)
aus 2 stellt eine Ausführungsform der vorliegenden
Erfindung dar. Sie umfasst ein pseudo-verborgenes Markow-Modell (pVMM) zum
Erfassen eines Verhaltenszustandsübergangs. Im Allgemeinen zeigt
der Kennzeichner „Pseudo", dass dieses System
von der traditionellen Definition abweicht, aber wesentliche Ähnlichkeiten
beibehält, wie
sie nach einer kurzen Beschreibung des VMM beschrieben werden sollen.
-
Ein
VMM ist ein Doppelzufallsprozess, der einen zugrunde liegenden Zufallsprozess
aufweist, der nicht beobachtbar und deshalb verborgen ist. Allerdings
sind einige Aspekte dieses verborgenen Prozesses durch einen anderen
Zufallsprozess oder eine Gruppe von Zufallsprozessen beobachtbar.
Der beobachtete Zufallsprozess erzeugt eine Sequenz von Symbolen,
im vorliegenden Fall wahrscheinliche Nutzerkategorien, die wir mit
bestimmten statistischen Eigenschaften messen können. Das Modell versucht,
sowohl die kurzfristigen Variationen in dem Zufallsprozess, als
auch die stationären
Merkmale zu beschreiben. Besonders interessant sind hier die Übergänge von
einem Intervall zu einem anderen. Wir nehmen allgemein an, dass
statistische Gesetze die beobachteten zeitlichen Variationen im
Fernsehprozess steuern.
-
Das
Ziel des VGM ist es, die TV-Nutzungs- und -Inhaltsauswahl, Zeitserien-Datenmuster,
die von einer TV-Fernbedienung oder durch gedrückte Fernsehgerätknöpfe erzeugt
werden, und die hier als Klick-Abfolge bezeichnet werden, zu modellieren
und zu gruppieren. Es gibt zwei Formen von Klick-Ablaufdaten; und
zwar realzeitliche und statistisch erfasste.
- – Realzeitdaten
sind solche Daten, die das konkrete TV-System von den TV-Steuerbefehlen
des Nutzers registriert. Diese Daten werden sehr schnell gesammelt,
wobei es sich um jeden Fernsehgerät-Steuerknopf handeln kann,
und sie können
vorübergehend
zur späteren
Benutzung in einer Datei akkumuliert werden.
- – Statistisch
gesammelte Daten werden von einem dritten Teil aufgezeichnet, wie
z.B. Nielsen oder Arbitron, und weisen im Allgemeinen genauere Nutzerinformation
und eine begrenzte zeitliche Auflösung auf, und erfassen nur
Kanalwechsel einer statistisch repräsentativen Untergruppe der
fernsehenden Bevölkerung.
-
Zwei
primäre
Aspekte des Werbezielrichtungssystems hängen direkt von den Klick-Ablaufdaten
ab. Erstens modelliert der Profile erstellende Agent (ProfAgent)
am Fernsehgerät
TV-Nutzer durch einen Realzeit-Klick-Ablauf und durch Programminhaltsinformationsdaten
oder Daten des elektronischen Programmführers (EPG). Zweitens nutzt
die VGM statistisch erfasste Klick-Ablaufdaten und entsprechende vergangene EPG-Daten,
um Werbekategorie-Verhaltensgruppen zu erstellen. Alle statistisch
erfassten TV-Nutzerdaten im vorliegenden Dokument benutzen durch
die BARB TV Research Corp. (London, England) über einen Zeitraum von sechs
Monaten im Jahr 1998 digital aufgezeichnete Marktforschungsdaten
von 1657 britischen Satelliten-TV-Nutzern.
-
Mehrere
heuristische Messwerte schätzen
die Nutzerpräferenz
für TV-Programme,
Kategorien der Programmgestaltung, und bestimmte Nutzerverhaltensweisen.
Mit diesen Präferenzmesswerten
benutzt eine Präferenz-Bestimmungsmaschine
(PBMA) ein wahlbasiertes, bestärktendes
Lernsystem, um allen EPG-Einträgen
Präferenzwertungen
zuzuteilen.
-
Die
Präferenz-Bestimmungsmaschine
(PBMA), deren Architektur in 10 darstellt
ist, stellt gefallend-Prädiktoren
für alle
demographischen Gruppen bereit, d.h. für eine Gruppe anstelle einer
einzelnen Person. Der Unterschied zwischen einer Person und einer
Gruppe ist der, dass die Bestimmungsmaschine Programme ermitteln
muss, die einer Mehrheit der Personen einer demographischen Gruppe
für eine
bestimmte Zeit zusagen. Zusätzliche
Details der Implementierung der PBMA können der gemeinschaftlich erteilten
Parallelanmeldung [Attorney Docket No. P02408US] entnommen werden,
die hier durch Querverweis zitiert wird.
-
Die
Gruppenwahrscheinlichkeit kann wie folgt bestimmt werden:
wobei
die
Wahrscheinlichkeit ist, dass eine Person j einer demographischen
Gruppe i das Programm auf Kanal C zum Zeitpunkt t mag; N ist die
Anzahl der Personen in der demographischen Gruppe i, für die die höchste Wahrscheinlichkeit
besteht, dass sie Kanal C zum Zeitpunkt t sehen.
-
Dann
ist der ermittelte Kanal der mit dem höchsten
-
Die
Architektur der Präferenz-Bestimmungsmaschine,
die in 10 dargestellt ist, weist mehrere
Präferenzmessfilter 10 (PMF)
auf, eine Verhaltensmodell-Datenbank 11 (VMdbank), eine
Stimmerzeugungsschicht, Ausgabe-Wahlgewichtungen, und einen bestärkenden
Lehrmechanismus. Jeder Präferenzmesser
filtert Nutzerverhaltensmuster in einen Analogwert, der zu dem Ausmaß proportional
ist, in dem das Zielverhalten auftritt. PMF und pVMM empfangen Nutzer-Klick-Ablaufdaten
von einem Klick-Ablaufmesser 12, und verwalten die VMdbank 11 dynamisch.
Die vorliegende VM-Ausführungsform
umfasst das folgende neuartige PMF, wie es in den folgenden Punkten
definiert ist:
- 1. Sehze/Verfügbare_Zeit,
für Programme
ohne Surfen und Sprünge
- 2. Verpasste_Zeit/Verfügbare
Zeit für
alle Programme ohne Surfen
- 3. Verbleibende_Zeit/Verfügbare
Zeit, für
alle Programme ohne Surfen
- 4. Sehzeit/Verfügbare_Zeit,
für Programme
mit Sprüngen
- 5. Zeit zwischen Sprüngen
für Programme
mit Sprüngen
- 6. Zahl der Sprünge
pro Programm
- 7. Zeitunabhängige
Besuchsneigung aller EPG-Einträge
- 8. Zeit-im-Programm (ZIP) Besuchsneigung für alle EPG-Einträge
- 9. Zeit-in-Sitzung (ZIS) Besuchsneigung für alle EPG-Einträge
- 10. Tageszeit (TZ) Besuchsneigung für alle EPG-Einträge
- 11. Wochentag (WT) Besuchsneigung für alle EPG-Einträge.
-
Obgleich
diese Begriffe selbsterklärend
sind, wird nachfolgend eine Erläuterung
für diese
Begriffe angegeben.
-
In
Punkt 1 ist der Ausdruck Sehzeit (Tw) die
gesamte Sehdauer, möglicherweise
nicht zusammenhängend,
für ein
bestimmtes Programm. Verfügbare_Zeit
(Ta) bezeichnet die Programmdauer. Das Verhältnis Sehzeit/Verfügbare_Zeit
(Tw/Ta) zeigt an,
wie viel von einem Programm der Nutzer gesehen hat, und spiegelt
sein Interesse am Inhalt statistisch wider.
-
In
Punkt 2 ist der Term Verpasste_Zeit (Tm)
die Zeitmenge, mit der ein Nutzer verspätet zu einem Programm stößt (negativ,
falls verfrüht).
Das Verhältnis
Verpasste_Zeit/Verfügbare_Zeit
(Tm/Ta) stellt die
Willigkeit und mögliche
Planung des Nutzers dar, den Beginn des Programms zu sehen, also
eine größere Programmpräferenz,
als wenn der Nutzer oft verspätet
zuschaltet. Wenn negativ, ist dies ein besonders starker Indikator dafür, dass
der Nutzer einen größeren Planungsaufwand
getrieben und also eine größere Präferenz dafür hat, den
Beginn des Programms zu sehen.
-
In
Punkt 3 ist der Ausdruck Verbleibende_Zeit (Tl)
die Zeit des Programmendes minus die Zeit, zu der der Nutzer das
Programm verlassen hat (negativ, wenn er nach dem Ende bleibt). Verbleibende_Zeit/Verfügbare_Zeit
(Tl/Ta) ist ein
Verhältnis,
um das Interesse eines Nutzers daran zu bestimmen, das Programmende
nicht zu verpassen, also eine größere Präferenz für das Programm
als für
den Fall, dass der Nutzer es häufig
früh verlässt.
-
Zusammengenommen
bestimmen diese Messwerte die Quantität und Qualität möglicher
Zeit, die darauf verwendet wird, ein Programm zu sehen. Wie in 10 gezeigt,
neigen die meisten Menschen dazu, sich eng in jeder solchen Metrik
zu gruppieren. Das Resultat ist eine gute Korrelation zu der Programmpräferenz. Genaue
gleiche Schlüsse
und Messwerte wie Tw/Ta,
Tm/Ta, und Tl/Ta gelten ebenso
für Werbesendungen
wie für
Programme.
-
Präferenzmesswerte
in Bezug auf Programmsprünge,
Punkte 4 bis 6, schätzen
die Programmpräferenz
im Verhältnis
zum Sprungverhalten. Ein Programm-Sprung ist die Handlung des Verlassens
und Zurückkehrens
zu demselben Programm. Ein Programm-Surfen ist die Handlung des
Besuchens und Verlassens eines Programms innerhalb einer kurzen
Zeitperiode, z.B. 5 Minuten. Wenn ein Nutzer zu einem Programm zurückkehrt,
ist dies ein starker Indikator dafür, dass dieses Programm etwas
hat, wofür
sich eine Rückkehr
lohnt, oder das gefällt. 11a stellt Tw/Ta Programme mit Sprüngen dar. Es versteht sich,
dass Programme mit Sprüngen
länger
betrachtet werden als die im Nicht-Sprung-Fall. Eine Sprunganzeige
ist also eine Anzeige einer größeren Präferenz.
-
In
Punkt 5 bezeichnet der Ausdruck Zeit zwischen Sprüngen die
Zeit (in Minuten), die der Nutzer vor seiner Rückkehr nicht bei dem ursprünglichen
Programm verbracht hat. Wie dargestellt, weisen die meisten Nutzer
Sprünge
auf, die weniger als 2 % des Programms betragen. Jenseits des intuitiven
Appells dieser Messwerte demonstrieren diese Daten in Kombination
mit der oben genannten Präferenzneigung
für Programme
mit Sprüngen
eine Tendenz, dass die Präferenz
des Nutzers für
das ursprüngliche
Programm um so höher ist,
je kürzer
die Zeit der Abwesenheit ist.
-
Mit
einem ähnlich
intuitiven und beobachtbaren Appell ist die Anzahl der Sprünge pro
Programm von Punkt 6 eine umgekehrt proportionale Annäherung an
die Nutzerprogrammpräferenz.
Das heißt,
je öfter
ein Nutzer in einem Programm hin und zurück springt, desto weniger gefällt das
Programm. 11c zeigt an, dass die meisten
Menschen nur einmal oder zweimal in einem Programm springen, das überhaupt
Sprünge
aufweist. Es ist wichtig, zu beachten, dass eine höhere Sprunghäufigkeit
zunehmend selten wird und also nicht bevorzugt wird, da die meisten
Programme mit Sprüngen
ein relativ hohes Tw/Ta-Verhältnis aufweisen.
-
Eine
weitere neuartige Klasse von Programmpräferenz-Messwerten basiert auf
einem einzigartigen Verfahren zum Bestimmen der Verhaltenstendenz
eines Nutzers, Punkte 7 bis 11. Nutzertendenz, wie hier benutzt,
ist der voreingenommene Fokus von Verhaltensweisen, eine signifikant
eingeschränkte
Untergruppe von möglichen
Alternativen zu wählen.
Mit diesem Konzept als Motivation nimmt Tendenz die theoretische
Form eines Verhältnisses
der erwarteten gleichmäßig zufälligen Auswahlverteilung
im Gegensatz zu der beobachteten Verhaltensauswahlverteilung an.
Die Nutzerverhaltenstendenz ist ein psychometrisches Werkzeug, das die
psychologische Tendenz eines Nutzers misst, ein Zielverhalten gegenüber anderen
Optionen in seinem Verhaltensbereich vorzuziehen. Eine mathematische
Behandlung der Tendenzmetrik folgt später einer Zusammenfassung ihrer
Anwendung auf Nutzer-Programmpräferenzen.
-
Die
Verhaltenstendenzmetrik kann bestimmen, ob eine jeweilige Auswahl
genug Indizien liefert, dass die Nutzerwahl eine bevorzugte Handlung
ist. Genauer ausgedrückt,
zeigt sie die Wahrscheinlichkeit eines nicht-gleichmäßigen zufälligen Auswahlprozesses
an. Wenn beispielsweise die Auswahl eines bestimmten Kanals mit
derselben Wahrscheinlichkeit wie beim Zufall auftritt, gibt es keine
Indizien für
eine Nutzer-Verhaltenstendenz, und es wird angenommen, dass der
Kanal nicht bevorzugt wird. In der umgekehrten Situation, wobei
die Auswahl um ein Mehrfaches wahrscheinlicher ist als Zufall, wird
angenommen, dass der Kanal bevorzugt wird.
-
In
gleicher Weise liefert die Präferenzwahl
von Punkt 7 die Gesamttendenz, einen bestimmten EPG-Eintrag zu besuchen.
Punkte 8 bis 11 sind zeitlich eingeschränkte Tendenzanfragen.
-
Punkt
9 liefert eine Wahl der Tendenz, eine bestimmte Auswahl zu einem
bestimmten Zeitpunkt nach dem Beginn einer Fernsehsitzung zu treffen.
Eine Sitzung ist die TV-Nutzungsdauer, die mit dem Einschalten beginnt
und mit dem Ausschalten des Fernsehgeräts endet. Eine Besuchstendenz
ist die Inhalts- oder Kategoriebesuchsfrequenz über Zufall.
-
In
gleicher Weise beschränkt
Punkt 10 die Tendenzanfrage auf die Tageszeit, und Punkt 11 ist
eine Präferenzanfragewahl
zur Wochentagsauswahl. Die vorgeschriebenen Tendenzmesswerte sind
denjenigen des Stands der Technik überlegen, indem sie absolute
Häufigkeiten
eines Geschehens berechnen, und nicht die relative Wahrscheinlichkeit
einer bestimmten beobachteten auftretenden Ereignishäufigkeit.
In jeder kurzen Zeitperiode kann ein gleichmäßig zufälliger Prozess den Eindruck
erwecken, dass einige Möglichkeiten anderen
vorgezogen werden, und kann ein häufigkeitsbasiertes Präferenzbestimmungssystem
dazu verleiten, eine Nutzerpräferenz
anzunehmen. Allerdings würde
unter solchen Umständen
das vorliegende Neigungsermittlungsverfahren anzeigen, dass nicht
ausreichend Stichproben vorliegen, oder dass diese nicht konzentriert genug
sind, um eine Nutzerpräferenz
anzunehmen. Dies führt
dazu, dass das Vertrauen in besuchsfrequenzbasierte Messwerte von
geringer Qualität
sinkt, und senkt ihren Beitrag zur abschließenden Wertung der Programmpräferenz;
auf diese Weise wird die Genauigkeit durch das Zurückweisen
von statistisch fehlerhaften Stichprobendaten erhöht.
-
Zusätzlich zu
der Präferenz
bezüglich
des EPG-Eintrags sind mehrere verhaltensbezogene Präferenzen
vorgesehen, wie z.B. die hier beschriebenen. Verhaltenspräferenzen
stellen einen Mechanismus bereit, Vorhersagen zur Programmpräferenz im
Kontext eines vergangenen Handlungsmusters eines Nutzers zu erstellen.
Es ist oft der Fall, dass die Stimmung eines Zuschauers, oder kontextabhängige Bedingungen
einschließlich
zeitlicher Warteschlangen, die Präferenzen so beeinflussen können, dass
ein Programm in einem Kontext gefällt, und in einem anderen nicht
bevorzugt wird. Insoweit, als die VGM den Verhaltenskontext des Interesses
modelliert, ist eine genauere Vorhersage der Programmpräferenz möglich.
-
Die
Verhaltensmodell-Datenbank VMdbank 11 aus 10 wird
durch eine standardisierte Verhaltensmodell-Anfragemaschine bedient.
Die entsprechende Zielanfrage der Verhaltensmodell-(VM)-Daten soll
im Folgenden beschrieben werden:
Alle modellierten Verhaltensweisen
und zeitlichen Beziehungen in der VGM, wie sie hier beschrieben
sind, dienen als die VMdbank für
Systemmodule, um Anfragen mit dem Realzeit-Nutzungsmuster des Zuschauers während einer
TV-Sitzung zu stellen, und die Schätzung nicht einfach mit Hilfe
der gemittelten Präferenz
des Nutzers für
ein Programm zu erstellen. Die VMdbank ist ein Verhaltenspräferenz-Anfrageserver
für jedes
Systemmodul, das bestimmte Verhaltenswahrscheinlichkeiten benötigt, um
eine optimale Entscheidung zu treffen. Module, die die VMdbank abfragen,
umfassen den Präferenzbestimmungsagenten
(PBMA) 13, den ZUSAgenten und den PräsAgenten. Die Verhaltensmodell-Anfragemaschine
(VMA-Maschine) bedient alle Suchanfragen an die VMdbank.
-
Eine
Umgebungszustandsvariable (wie z.B. Fernsehgerät-Lautstärke), oder ein EPG-Eintrag
(z.B. Kanäle),
oder ihre Ableitungen, ist potenziell eine Hyperebene in Dimension
1 unten des Verhaltensmodells. Das bevorzugte Verhaltensübergangsmodell
weist die folgenden fünf
Dimensionen (Dim) auf:
- – Dim 1 [gefallenderTitel,
gefallenderKanal, nichtgefallenderKanal, surfKanal, gefallendesGenre,
nichtgefallendesGenre, surfGenre]
- – Dim
2 [vom Zustandscode, d.h. Kanal, oder Genre, oder Titel-ID-Nummer]
- – Dim
3 [zum Zustandscode, d.h. Kanal, oder Genre, oder Titel-ID-Nummer]
- – Dim
4 – [nichtzeitlich,
WT, TZ, ZIS, ZIP]
- – Dim
5 – [zeitlich
unscharfer Bin]
-
Dim
1 wählt
die Art der Zustandsvariable.
-
Dim
2 stellt eine Einschränkung
für den „von"-Zustand des Interesses
mit der Referenz-ID auf. Ein „von"-Zustand ist der
Zustand, den der Zuschauer verlässt,
wenn ein Zustandsübergang
erfolgt.
-
Dim
3 stellt die „zu"-Zustands-ID für die Anfrage
auf. Der „zu"-Zustand ist genau
wie der „von"-Zustand definiert, außer, dass
es der Zustand ist, in den ein Zuschauer bei einem Zustandsübergang
eintritt. Die Referenz-IDs können
Kanalaufrufbuchstaben, wie z.B. „ABC", Genrenamen wie „Film", oder Hash-Codes von Titeln sein.
-
Dim
4, die Art der zeitlichen Beziehung; und,
Dim 5 den entsprechenden
Zeitintervall; z.B. sind eine gültige
Auswahl für
WT: Mo., Di., Mi., Do., Fr., Sa. und So.
-
Es
gibt etwa 14 bis 16 unscharfe Zugehörigkeitskategorien, die ein
zuverlässiges
unscharfes Modell bereitstellen. Die Anzahl der Mitglieder in den
Kategorien kann eingestellt sein, von etwa sieben für relativ
unwichtige Zugehörigkeitskategorien
(Verhältnis
verbleibende_Zeit/Sehzeit) bis etwa 17 für die wichtigsten Kategorien
(z.B. Sehzeit) zu variieren.
-
Zusätzlich zu
den VM-Suchbeschränkungen
gibt es Funktionsspezifikationen. Funktionsspezifikationen umfassen,
sind aber nicht beschränkt,
auf Folgende:
Anfragefunktion – [höchstwahrscheinlich, unwahrscheinlichst,
Obere_n, Untere_n, Zeit_Summe]
-
Die
(un)wahrscheinlichste Suchfunktion kehrt zu den höchsten (niedrigsten)
Wahrscheinlichkeitszuständen
und Tendenzwerten zurück,
die den Rest der Anfragebeschränkungen
erfüllen. „Obere_n" (Untere_n) liefert
die Anzahl „n" der Zustände der
höchsten
(niedrigsten) Wahrscheinlichkeit und der Tendenzwerte, die den Rest
der Anfragebeschränkungen
erfüllen.
Die Funktion „Zeit
Summe" summiert
alle Tendenzausdrücke (durch
Mittelwertbildung oder Zählen
usw.) in jeweils spezifizierten ZeitWert-Intervallen des ZeitTyps.
So ist ein allgemeines Anfrageformat:
,[AnfrageFunktion] [ZustandTyp]
[vonZustandID] [zuZustandID] [ZeitTyp] [ZeitWert]'
-
Beispielsweise
sucht die folgende Anfrage nach den oberen 5 gefallenen Genres am
Sonntag:
,AnfrageFunktion=Obere_n=5, ZustandTyp=GefailendeGenres,
vonZustandID=Null, zuZustandID=Null, ZeitTyp=WT, ZeitWert=Sonntag'
-
Ein
typisches Anfrageergebnis, wobei 100 die maximale Präferenz ist,
lautet
[Action=60, Nachrichten=40, Komödie=30, Null, Null]
wenn
nur drei Genres an Sonntagen gefallen haben.
-
Eine
typische Benutzung von ,Zeit_Summe' ist es, nach der wahrscheinlichsten
Aktivitätszeit
für einen bestimmten
ZustandTyp zu suchen. Beispielsweise: Finde die 3 wahrscheinlichsten
Tageszeiten, zu denen ein Nutzer fernsieht. Die Anfrage lautet
,AnfrageFunktion=Zeit_Summe,
ZustandsTyp=GefallendeKanäle,
vonZustandID=Null, zuZustandID=Null, ZeitTyp=TZ, ZeitWert=Null'.
-
In
diesem Fall summiert die Funktion ,Zeit_Summe' alle Übergangstendenzen pro TOD-Intervall,
und liefert eine Liste der Ergebnisse. Wenn die Person morgens,
abends und spät
abends am aktivsten ist, könnte eine
typische Anfrageantwort lauten („;" impliziert eine neue Zeile, und „," eine neue Spalte):
[(spät_abends,
sehr_oft); (nachts, nie); (früh_morgens_nie);
(morgens, meistens); (vormittags; selten); (nachmittags; selten);
(spätnachmittags;
manchmal); (abend; fast_immer); (nachts, üblicherweise)]
-
Ein
Modul mit einer Schärfungstabelle
sucht die gelieferte Matrix für
die oberen drei Wahrscheinlichkeiten, nämlich,
[(morgens, immer);
(spät_abends,
sehr_oft); (abends; fast_immer)].
-
Eine
Vielzahl standardisierter Anfrageschnittstellen ist leicht einsetzbar,
um an die VMA-Maschine
zu koppeln. Beispielsweise würde
eine SQL-Schnittstelle die dimensionalen Attribute als „AUSWÄHLEN...VON...WOBEI"-Klauseln spezifizieren;
wenn z.B. die wahrscheinlichste, oder beliebteste, ZEIT zum Sehen
von FILM.ACTION der Abend ist, lautet die SQL-Anfrage:
-
Ein
einfacher SQL-Übersetzer
wandelt SQL-Suchparameter in dimensionale Attributbeschränkungen für die VMA-Maschine
um. In diesem Beispiel,
AnfrageFunktion = höchstwahrscheinlich, ZustandTyp
= GefallendesGenre, vonZustandID = Null, zuZustandID = Film:Action,
ZeitTyp = TZ, ZeitWert = abends.
-
Obwohl
eine breite Spanne modellierter Verhaltensweisen und Anfragearchitekturen
vorgesehen ist, gibt es trotzdem noch viele andere. Es folgt eine
allgemeine Aufzählung
einiger Verhaltenspräferenzkategorien.
Hier hängt
die Ausgabe von dem Realzeit-Sehkontext ab:
- 1.
Zeitabhängige Übergangspräferenzen
für alle
EPG-Einträge
- 2. Zustandssequenzierung
- 3. Übergangsumkehrtendenz
- 4. Sehzeit pro Sitzung, und für alle EPG-Einträge
- 5. Fernsehgerätsteuerungs-Verhaltensmuster
- 6. Tw/Ta, Tm/Ta, und Tl/Ta für alle EPG-Einträge
- 7. EPG-Eintrag und Verhaltensdiversitätsfokus (Breiten- und Tiefensuchsteuerung)
- 8. Wahrscheinlichster Start- oder Endzustand
-
In
Punkt 1 erzeugt das BM zeitempfindliche und zeitunabhängige Übergangswahrscheinlichkeiten
für jeden
EPG-Eintrag. Jede EPG-Eintragsklasse wird weiter in mehrere Verhaltenskategorien
unterteilt, einschließlich
der Zustände
Surfen/Nicht Surfen, Springen, und gefallend/nicht gefallend, wie
zuvor definiert. Jede Nutzerhandlung erzeugt Übergangsstatistiken in jedem
dieser Bereiche gemäß dem SSM-Algorithmus.
-
Ein
Beispiel ist eine Anfrage an die VMA-Maschine nach der Wahrscheinlichkeit,
dass ein bestimmter Schauspieler (oder irgendein EPG-Feldeintrag)
gesehen wird, nachdem die Nachrichten (oder irgendein anderer EPG-Feldeintrag)
gesehen wurden, ohne zeitliche Beschränkung. Eine typische zeitsensible
Präferenzanfrage
würde wie
folgt aussehen:
,Was ist die Wahrscheinlichkeit, dass am Montag
(oder irgendeinem Tag) Sport gesehen wird
UND
am Abend
(oder zu irgendeiner Zeit),
UND
nach einer Stunde (oder
einer anderen Zeitmenge) Fernsehen,
UND
während das
aktuelle Programm (oder irgendeine gesehene Programmzeitmenge) halb
abgelaufen ist.
-
Es
ist wichtig, dass die Anfrage mit weniger konjunktiven Verbindungen
gelockert oder mit mehr Beschränkungen
verschärft
wird. Mit Hilfe dieses Mechanismus kann ein Systemmodul die Realzeit-Kontextinformation
an die VMA-Maschine weiterleiten und feststellen, dass, obwohl,
der Nutzer Sport im Allgemeinen mag, er/sie Sport nicht gerne montagabends
innerhalb einer Fernsehstunde nach Ablauf eines halben Programms sieht.
Dieser hoch spezielle Fall ist eine Demonstration der großen Detailliertheit
der Lern- und Kontextpräferenz,
die in dem vorliegenden System möglich
ist. Das Systemmodul sendet die gesamte Spanne von Anfrage abstraktionsniveaus,
d.h. von sehr allgemein (z.B. finde gefallende Genres) bis hin zu
einer voll konjunktiven EPG-, zeitlichen und zustandssequenzierten
Wahrscheinlichkeitssuche. Das Systemmodul findet das wahrscheinlichste
Niveau der Anfrageabstraktion und bewertet die Programmgestaltung
nach dessen Distanz von den Anfrageparametern.
-
Wenn
beispielsweise ein Sportprogramm gewertet werden soll, könnte die
erste und abstrakteste Anfrage sein „gefällt Sport", woraufhin nachfolgende Anfragen zunehmend
einschränkende
Bedingungen hinzufügen,
abhängig
von dem Realzeit-Kontext, wie „gefällt Sport
an Montagabenden nach dem Sehen der Nachrichten", und eine noch spezifischere Anfrage
könnte
der letztgenannten Anfrage „auf
Kanal 2" hinzufügen, usw.
Wenn die letzte und spezifischste Anfrage am wahrscheinlichsten
war, würde
ein Sportprogramm am Montagabend nach dem Schauen der Nachrichten
auf Kanal 2 höher
bewertet werden als dasselbe Sportprogramm, wenn diese Verhaltensbeschränkungen
nicht erfüllt
würden.
Im Fall der PBMA-Anfrage ist der Verhaltenswahlbeitrag bei der PBMA-Bewertung
umso höher
(niedriger), je näher
(weiter) ein Programm am bzw. von der wahrscheinlichsten Verhaltensbeschränkung ist.
-
In
einem weiteren Aspekt von Punkt 1 unterstützt die VMA-Maschine eine Anfrage
nach dem wahrscheinlichsten Übergang
mit Parametern eines modellierten Kontexts (d.h. EPG-Einträge, Zeiten,
Verhaltensweisen). Die VMA-Maschine antwortet mit allen Wahrscheinlichkeiten,
welche die Anfragebedingungen erfüllen, unter der Annahme, dass
unbeschränkte
Modelldimensionen ein Joker sind. So wendet die VMA-Maschine rekursiv
die beschränkten
Dimensionen auf alle nicht beschränkten Verhaltensdimensionen
an. Aus Demonstrationsgründen
nehmen wir an, dass das VM für
gefallene Titel, Kanäle
und Genres Wochentag (WT) und Tageszeit (TZ) modelliert. Eine typische
Anfrage und Antwort erscheint wie folgt.
-
Anfrage: „Was ist
der wahrscheinlichste Genreübergang
von Genre = Wetter, WT = Montag, und TZ = Abend".
-
Beispielantwort: „Genre
= Komödie,
Tendenz = mittel".
-
Wenn
eine Bedingung nicht spezifiziert ist, sucht die VMA-Maschine alle
Einträge
der nicht eingeschränkten
Dimensionen nach Anfrageübereinstimmungen
ab. Wenn beispielsweise WT aus der letzten Anfrage ausgelassen wurde,
würde jeder
Abend nach dem wahrscheinlichsten Übergangsgenre von „Wetter" durchsucht. Eine
mögliche
Anfrageantwort ist „[Genre
= Drama, WT = Dienstag, Tendenz = hoch]", wenn der wahrscheinlichste Übergang
von Genre = Wetter zu einem Drama dienstags ist. Wenn die Kontrollbedingung der
letzten Anfrage „höchstwahrscheinlich" zu „alle" geändert wird,
würde jedes
Zielgenre jedes Abends mit einem Übergang vom Wetter ausgegeben.
-
Derselbe
Mechanismus stellt das Ermitteln der typischen Zeitdauer bereit,
für die
ein Nutzer dazu neigt, von einem gefallenden Programm weg zu springen.
Dieses Verhalten könnte
durch ein Überspringen von
Werbesendungen oder durch das Teilen von Zeit mit in ständiger Konkurrenz
stehenden Inhalten entstehen. Ein Beispiel einer Anfrage, die oberen
2 wahrscheinlichsten Sprungzeiten für das Programm namens „Seinfeld" zu finden, erscheint
wie folgt:
Anfrage: ,[AnfrageFunktion = Obere_n=2, ZustandTyp
= Titel, vonZustandID=Null, zuZustandID='Seinfeld', ZeitTyp = ZIP, ZeitWert = NULL). Wenn
die Person normalerweise nur Werbesendungen 2 Minuten und 15 Minuten
nach Beginn von Seinfeld in 30 bzw. 50 % aller Übergänge zu der Sendung überspringt,
wäre die
unscharfe Zeitbin-Anfrageantwort
[(SCHNELL_SURFEN,30);(SEHR_KURZ,50)).
-
Die
Benutzung von Übergangskontextinformation
ermöglicht
es der PBMA, bessere Programm-Präferenzwertungen
zuzuordnen, und erlaubt es dem PräsAgenten, Programme auf einem
virtuellen Kanal in einer vom Nutzer bevorzugten Programmreihenfolge
und -zeit zu bestellen.
-
Eine
Anfrage zur Zustandssequenzierung, Punkt 2, befasst sich mit der
Wahrscheinlichkeit, dass ausgewählte
EPG-Einträge
Teil einer bevorzugten Zustandssequenz sind, und liefert die beobachteten
Wahrscheinlichkeiten und Zustände.
Eine Zustandssequenz ist definiert als jede zusammenhängende Gruppe
von Zustandsübergängen von
mehr als eins. Jede modellierte Zustandsübergangsmatrix weist eine begleitende Zustandssequenztabelle
auf. Anstatt die tatsächliche
Durchdringung der beobachteten Zustandssequenzen zu speichern, erfasst
die Zustandssequenztabelle die besuchten Zustände und ihre Häufigkeit.
Da menschliches Verhalten sich selten mit präziser Genauigkeit wiederholt,
ist es wichtiger, Übergangssequenzen
zu parametrisieren, um Verhaltenstendenzen zuzuordnen. So gibt es
zwei geordnete Tabellen. Eine zweidimensionale Tabelle weist Zeilen
als die individuelle Kombination von besuchten Zuständen in
einer beobachteten Sequenz auf, und die Spalten sind die IDs der
besuchten Zustände.
Die Zeilen werden nach Spaltenvektorlänge geordnet, und die Spalten
sind alphanumerisch geordnet. Diese Ordnung beschleunigt das Durchsuchen
der Tabelle nach einem bestimmten Anfragemuster. Eine entsprechende
Tabelle, effektiv eine dritte Dimension, akkumuliert die Häufigkeit,
mit der ein Zustand in der Sequenz besucht wurde. Jedes Mal, wenn
dieselbe Kombination von Zuständen
in einer Übergangssequenz
besucht wurde, wird die Häufigkeit
pro Zustand diesem Zähler
hinzugerechnet. Eine effektive vierte Dimension akkumuliert die
Sequenzlängen
der Sequenzen zugeordneter besuchter Zustände. Eine fünfte und letzte Sequenzmodellierungsdimension
zählt die
Häufigkeit,
mit der eine Zeile mit einer bestimmten Zustandssequenzkombination
auftritt. Diese Dimension wird benutzt, um die mittlere Sequenzlänge und
die mittlere Häufigkeit
des erneuten Besuchs eines Zustands in einer Sequenz zu berechnen.
Eine Zustandsbesuchssequenz-Zuordnung erfolgt, wenn die in einer
neuen Sequenz besuchten Zustände
genau einem Zeileneintrag mit besuchten Zuständen zugeordnet werden können. Wenn
eine Zuordnung erfolgt, werden die Zustandsbesuchshäufigkeit
und die Sequenzlänge
ihrem jeweiligen dimensionalen Akkumulator hinzugerechnet. Anderenfalls
wird in geeigneter Weise ein neuer Eintrag erzeugt.
-
13 zeigt ein typisches Beispiel. Das Beispiel
betrifft Kanalzustände,
doch der Algorithmus gilt für jede
Zustandssequenzmodellierung. 13A zeigt
eine ursprünglich
leere Datenbank nach der Verarbeitung von zwei Stichproben-Zustandssequenzen.
Die zwei Sequenzen weisen wenigstens einen unterschiedlichen besuchten
Zustand auf, was zu zwei neuen Zeileneinträgen führt. In 13B werden
zwei zusätzliche
Sequenzbeispiele verarbeitet. Sequenz drei, obwohl nicht identisch
mit Sequenz eins, wird in demselben Zeileneintrag summiert wie Sequenz
eins, da genau dieselben Zustände
besucht wurden. Sequenz vier unterscheidet sich in einem Zustand,
so dass ein neuer Datenbankeintrag erzeugt wird. Das ständige oder
regelmäßige Ordnen
der Spalten macht die Anfragesuche effizienter.
-
Ein
typisches Sequenz-(Sequ)-Wahrscheinlichkeitsanfrage-Format erscheint
wie folgt:
[AnfrageFunktion] [ZustandTyp] [sequZustandIDs]
[LängenWert]
-
Die
Bedingung „AnfrageFunktion" weist dieselben
Parameter auf wie im Fall der Übergangsanfrage. Zusätzliche „ZustandTyp"-Attribute identifizieren
den Typ des auszuwählenden
Zustands, z.B.: KanalSequ, GenreSequ, TitelSequ, SurfGenreSequ,
SurfKanalSequ, oder jeder EPG-Eintrag, wie z.B. SchauspielerSequ usw.
Die Anfrage-Einschränkungsbedingungen „vonZustandIDs" und „zuZustandIDs" sind ähnlich wie
im Fall der vorangegangenen Übergangsanfrage,
nur, dass sie jeweils eine Liste von entweder bereits besuchten
bzw. noch zu besuchenden Zuständen
sind. Die Anfragebedingung „LängenWert" beschränkt die
mittlere Sequenzlänge,
nach der zu suchen ist. Es folgen einige typische Beispiele für eine sequenzbezogene
VMA-Maschinenanfrage.
-
Beispiel 1:
-
Finde
die oberen 5 wahrscheinlichsten Kanäle, die eine vollständige Sehsequenz
ohne Surfen aufweisen, wobei, mit den zuvor besuchten Kanälen 30 und
40, die Anfragebeschränkungen
lauten
AnfrageFunktion = Obere_n=5, ZustandTyp = KanalSequ,
sequZustandIDs = [30,40], LängenWert
= Null.
-
Wenn
die Kanäle
43, 58, und 60 die höchste
Wahrscheinlichkeit einer vollständigen
Sequenz aufweisen, und ihre Wahrscheinlichkeiten 80, 10 bzw. 20
Prozent sind, wäre
das Anfrageresultat:
[(43,80), (58,10), (60,20), null, null].
-
Beispiel 2:
-
Finde
die oberen 5 wahrscheinlichsten Kanäle, die eine vollständige Surfsequenz
von drei Kanälen aufweisen,
wobei, mit den zuvor besuchten Kanälen 30 und 40, die Anfragebeschränkungen
lauten
AnfrageFunktion = Obere_n=5, ZustandTyp = SurfKanalSequ,
sequZustandIDs = [30,40], LängenWert
= 3.
-
Wenn
nur Kanal 43 die höchste
Wahrscheinlichkeit einer vollständigen
Surfsequenz von drei Kanälen aufweist
und seine Wahrscheinlichkeit bei 80 liegt, wäre das Anfrageresultat:
[(43,80),
null, null, null, null].
-
Beispiel 3:
-
Finde
aus allen Sequenzen von wenigstens 4 Programmen die Wahrscheinlichkeit,
dass die folgenden drei Programme sequenziell gesehen werden: Friends,
Frasier, und Seinfeld (unter der Annahme, dass sie chronologisch
parallel oder aufeinander folgend waren).
AnfrageFunktion =
höchstwahrscheinlich,
ZustandTyp = TitelSequ, vonZustandIDs = [„Friends", „Seinfeld", „Frasier"], LängenWert
= 4.
-
Wenn
diese Anfragebeschränkungen
bei 20 % aller Sequenzen mit einem LängenWert von wenigstens 4 beobachtet
wurden, wäre
ein typisches Anfrageresultat [20].
-
In
jedem dieser Beispiele werden die Kanal- oder Sequenzwahrscheinlichkeiten
berechnet, indem von der Gesamtzahl ähnlich eingeschränkter Aufzeichnungen
einfach die Häufigkeit
gezählt
wird, mit der ein die Anfrage erfüllender Zustand besucht wurde.
Ein vollständigeres
Modell von Verhaltenssequenzen enthält zusätzlich eine einzelne Übergangsinformation,
um statistisch die wahrscheinlichste Veränderung herzuleiten. Das neuartige
beschriebene Sequenzmodellierungsverfahren wendet die oben genannte „besuchte
Zustände"-Modellinformation
an, um beobachtete Kombinationen herzuleiten, sowie VM-Zustandsinformation,
um die wahrscheinlichsten Veränderungen
einzuschätzen,
d.h. Sequenzreihenfolge. Der Vorteil dieses Sequenzmodellierungsverfahrens
ist, dass es Verhaltenssequenzierungs-Stördaten im Wesentlichen herausfiltert
und Speicherplatz spart, während
die charakteristische Zustandssequenzierungsinformation beibehalten
wird. Es ist gut bekannt, dass die Speicheranforderungen zum Speichern
aller möglichen
Permutationen der numerischen Sequenz mit dem Faktor der Sequenzlänge ansteigen.
In der TV-Umgebung ist dies häufig
eine beschränkende
und verschwenderische Nutzung begrenzter Ressourcen. Eine pessimistisch
geschätzte
Wahrscheinlichkeit für
das Auftreten einer bestimmten Sequenzreihenfolge entspricht in
etwa dem Produkt der Wahrscheinlichkeit passender Sequenzparameter
(d.h. Länge, Zustände, und
Zustandsbesuchshäufigkeit), und
der Wahrscheinlichkeit für
jeden auftretenden Übergang.
Da kein Sequenzübergang
unabhängig
von dem vorangehenden ist, stellt diese Schätzung offensichtlich die untere
Grenze dar. Es sind verschiedene heuristische Verfahren zum Vergleichen
der relativen Wahrscheinlichkeit einer Permutation gegenüber einer
anderen vorgesehen, unter Berücksichtigung
der direktionalen Tendenz jedes Übergangs.
Kurz gesagt, ist eine Permutation wahrscheinlicher, wenn ihre Übergangsrichtungen
eine signifikante Tendenz gegenüber
der umgekehrten Richtung aufweisen. Ein simples heuristisches Verfahren
zum Berechnen einer Ordnungswahrscheinlichkeitsmetrik ist es, die
Differenz Vorwärtsrichtung
unter Abzug der Übergangstendenz
in umgekehrter Richtung für
jeden Sequenzschritt zu summieren.
-
Mit
dieser Information kann ein Systemmodul die erwartete Wahrscheinlichkeit
einschätzen,
dass ein Zustand sich in einer bestimmten Sequenz befindet. Wenn
beispielsweise ein TV-Nutzer beginnt, CNN zu schauen, und dann zu
FOX umschaltet, könnte
eine Anfrage an die VMA-Maschine
die wahrscheinlichsten Folgekanäle
und ihre Wahrscheinlichkeiten liefern. Wie hier im Detail gezeigt,
kann diese Information von der PBMA benutzt werden, um die Präferenz eines
Programms oder eine sequentielle Anordnung eines Programms in einem
virtuellen Kanal durch den PräsAgenten
zu verschieben.
-
Die Übergangsumkehrtendenz,
Punkt 3, versucht jede direktionale Neigung im Zustandsübergangsverhalten
eines Nutzers zu ermitteln. Ein Beispiel ist, wenn ein Zuschauer
dazu neigt, von CNN auf PBS umzuschalten, aber selten von PBS auf
CNN. Ähnlich
kann bei Genres ein Nutzer bevorzugen, öfter vor einem langen dramatischen
Film die Nachrichten zu sehen. Viele solche Präferenzen können in Titel oder jedem EPG-Eintrag
auftreten. Systemmodule, die auf die Programmsequenzierung reagieren,
können
die Umkehrtendenz benutzen, um die bevorzugte Programmreihenfolge
des Zuschauers vorherzusagen. Die PBMA benutzt die direktionale
Tendenz, um eine Präferenzbewertung
eines Programms hinsichtlich des Übergangskontextes der jüngeren Geschichte
eines Zuschauers zu beeinflussen. Nimmt man an, dass ein Nutzer
z.B. gerade die Nachrichten gesehen hat, so muss die PBMA die am
meisten bevorzugten Programme im EPG berechnen, um diese zum Sehen
vorzuschlagen. In dem Fall, dass die PBMA in jeder anderen Hinsicht
Programme auf CNN und PBS gleich bewertet, würde sie das PBS-Programm höher bewerten,
wenn eine signifikante Übergangsneigung
von CNN zu PBS gegenüber
dem umgekehrten Fall vorliegen würde.
Der MitgliedAgent benutzt dies als einen Verhaltensparameter, um
Zuschauerklassen zu ermitteln. Die direktionale Zustandsneigung
hilft dem PräsAgenten
dabei, den Programmführer
für virtuelle
Kanäle
besser zu sequenzieren.
-
Informationen
wie die typische Sehzeit, Punkt 4, pro EPG-Eintrag und Fernsehsitzung,
helfen den Systemmodulen dabei, die Aufmerksamkeitsspanne eines
Zuschauers besser spezifischen Arten von Inhalt zuzuordnen. Wenn
ein Zuschauer zu kurzen Fernsehsitzungen neigt, werden kürzere Programme
höher bewertet als
längere.
Wenn ein Nutzer Actionfilme über
einen kürzeren
Zeitraum hinweg sieht als Komödien,
dann werden die Programme in den jeweiligen Kategorien nach und
nach entsprechend bevorzugt. Im Prinzip gilt die Aufmerksamkeitsspanne
für alle
EPG-Einträge, und
dabei hauptsächlich
für Kanal,
Genre, Titel, und Schauspieler. Die Aufmerksamkeitsspanne unterteilt
möglicherweise
die Zuschauer (für
den MitgliedAgenten), und wirkt sich auf ihre bevorzugte Mischung
von Inhaltssehzeiten aus (für
die PBMA und den PräsAgenten).
-
Das Überwachen
von Fernsehgerät-Steuermustern,
aufgeführt
in Punkt 5, ist ein wesentliches Werkzeug zum verhaltensabhängigen Identifizieren
von Nutzern, und bildet oft eine Grundlage für Schlüsse über die Programmpräferenz.
Ein typisches Beispiel ist das Modellieren des Nutzerverhaltens
für das
Steuern des Ton-aus- und Lautstärkeknopfes.
Die PBMA benutzt den Ton-aus-Knopf als einen Indikator für weniger
bevorzugte Programme. Im Kontext des Werbesehverhaltens benutzt
der MitgliedAgent den Ton-aus-Knopf, um Werbung zu ermitteln, die
ein Nutzer nicht mag. Andere Fernsehgerät-Steuerknöpfe, wie z.B. die Lautstärkeregelung,
bieten ein ähnliches
prädiktives
Potential. Wenn ein Nutzer die Lautstärke eines bestimmten Programms
anhebt, ist es wahrscheinlicher, dass ihm das Programm gefällt. Hinsichtlich
der Nutzeridentifizierung ist es wahrscheinlicher, dass Teenager
die Lautstärke
von Musikvideos erhöhen,
als Erwachsene mittleren Alters. In ähnlicher Weise gelten Modellierungs-
und Anfragemechanismen wie bei der zeitlichen Modellierung, nur
dass Zeitintervallebenen durch die geeigneten Steuerparameter-Intervalle
ersetzt werden.
-
Dasselbe
Tw/Ta, Tm/Ta, und Tl/Ta der Programm-Präferenzwertung
gilt ebenso für
die Verhaltens-Präferenzwertungen,
wie in Punkt 6. Im Verlauf der Sehgeschichte eines Nutzers wird
jeder EPG-Eintrag
eine angenommene Präferenz
aufweisen, die dem Programmsehverhalten des Nutzers zugeordnet ist.
Wenn ein Nutzer beispielsweise oft Programme mit einem bestimmten Schauspieler
verspätet
einschaltet, würde
der Zustand, der diesem Schauspieler entspricht, ein hohes Tm/Ta-Verhältnis aufweisen.
Das gleiche gilt für
jede Kombination von PMF und EPG-Eintrags-SSM.
-
Als
eine weitere Metrik beleuchtet Punkt 7 die Bedeutung der psychometrischen
Verhaltensparameter Neugier und Diversität. Diversitätsmesswerte versuchen, die
räumliche
Abdeckung jedes Interessengebiets durch einen Nutzer zu charakterisieren.
Jeder modellierte Zustandsbereich erhält eine Fokusbewertung, die berechnet
wird, indem während
eines bestimmten Zeitraums die besuchte Auswahl durch die insgesamt
zur Verfügung
stehende Auswahl geteilt wird; z.B. Kanal Diversität = Zahl
besuchter KanälelKanalgesamtzahl.
Unterschiedliche Verhaltenszustandsklassen, oder EPG-Einträge, weisen
ihre eigenen Diversitätsmesswerte
auf; z.B. Genrediversität
usw. Unterschiedliche Menschen neigen dazu, eine weite Spanne von
Bereichsdiversitäts-Messwerten
aufzuweisen, die sie charakterisieren. Ältere Menschen können weniger
gesehene Kanäle aufweisen,
als beispielsweise Teenager. Ähnlich
wie Diversifäfs-Messwerte
gelten Fokus-Messwerte für
dimensionsübergreifende
und oft hybride Bereiche. Diese Hybride sind oft Verhaltensderivative
von EPG-Einträgen,
und keine direkten Messungen der EPG-Auswahlverteilungen. Beispielsweise
messen Kanal-Sequenz und Surf-Fokus, wie wenige individuelle Zustände alle
beobachteten Sequenzen oder Surfvorgänge bilden. Eine andere psychometrische
Klasse sind die Neugier-Messwerte. Neugier-Messwerte schätzen die
psychologische Tendenz eines Nutzers, eine bestimmte Inhaltskategorie
zu erforschen. Beispielsweise ist Kanal_Neugier der Anteil der Anzahl
gefallender Kanäle,
gegenüber
allen Kanälen
ohne Surfen. Je niedriger dieses Verhältnis, desto mehr erforscht
der Nutzer Kanäle,
die ihm zuvor nicht gefallen haben. Eine Person, die nicht sehr
neugierig ist, würde
dazu tendieren, sich nur an Dinge zu halten, die ihr in der Vergangenheit gefallen
haben, und hätte
eine sehr niedrige Neugier-Bewertung.
-
Die
Präferenz-Bestimmungsmaschine
PBMA benutzt Diversitäts-,
Fokus- und Neugier-Messwerte, um
die richtige Mischung hoch bewerteter Programme zu bestimmen, um
eine Sehempfehlung für
diese zu machen. Zusammen genommen steuern diese Messwerte die Breite
und Tiefe der Programmvorhersagen, die dem Zuschauer präsentiert
werden. Wenn beispielsweise ein Zuschauer eine niedrige Genre-Diversitätsbewertung
aufweist, würde
die PBMA Spitzenprogrammempfehlungen innerhalb der geringsten Anzahl
von Genrekategorien konzentrieren, und umgekehrt, wenn die Bewertung
hoch wäre.
Menschen neigen dazu, eine vorhersagbare Spanne von Diversitäts- und
Neugier-Verhältnissen
aufzuweisen. In der Benutzung durch den MitgliedAgenten tendiert
die Kombination dieser Messwerte dazu, Individuen und die Klassen,
denen sie angehören,
zu unterteilen. Hinsichtlich der PBMA ist es so, dass, wenn ihre
Kanalneugierbewertung hoch ist, die PBMA solchen Kanälen eine
Empfehlungspräferenz
zuteilt, die zuvor nicht oft gesehen wurden. Der PräsAgent,
der eine ähnliche
Aufgabe hat wie die PBMA, erzeugt einen virtuellen Programmführer, der
dazu tendiert, die tägliche
Abwechslung und Neuartigkeit, die ein Nutzer bevorzugt, anzupassen.
-
Der
wahrscheinlichste Start- oder Endzustand von Punkt 8 ist ein wichtiger
Parameter für
alle Module. Die PBMA benutzt Start- oder Endzustandswahrscheinlichkeiten,
um Programmbewertungen nach Nutzergeschichte zu verschieben, wenn
diese das Fernsehgerät
ein- und ausschalten. Diese Parameter tragen auch dazu bei, Nutzer
für den
ZUSAgenten zu identifizieren. Die PBMA koppelt Endzustandsinformation
mit Vorhersagen zur Sitzungsdauer, um Programme zu Endzustandspräferenzen
hin zu verschieben, während
die tatsächliche
Sitzungszeit näher
rückt und
die erwartete Fernsehsitzungs-Endzeit überschreitet. Der PräsAgent wendet
ein ähnliches
Prinzip an, wenn er einen zeitlich passenden virtuellen Programmführer erzeugt.
Wenn beispielsweise zu einem bestimmten Zeitpunkt und Programmgestaltungszustand
ein Nutzer oft die Sitzung auf einem bestimmten Kanal beendet, erhält jede
Programmgestaltung auf dem Kanal eine Präferenzwertungstendenz. Im Allgemeinen
sind solche Wertungstendenzen relativ gering und sollen Programme
bevorzugen, die ansonsten ähnlich
gewertet sind, aber eine kontextabhängige Tendenz aufweisen, wie
z.B. Sequenzierung.
-
Es
versteht sich, dass die obigen Erläuterungen nur beispielhafte
Ausführungsformen
und Implementierungen der Erfindung sind. Eine breite Spanne von
Permutationen und Variationen der Präferenzmesswerte liegen im Umfang
dieser Erfindung.
-
Die
folgende Beschreibung stellt Details zu der erfindungsgemäßen Verhaltensmodellverarbeitung
bereit.
-
Unter
Bezugnahme auf 2 und 3 erzeugt
jede Handlung oder ausgewählte
Nicht-Handlung parallele SSM-Übergangsvorgänge in jedem
der drei SSM-Zustandsräume:
Kanal, Genre, und Titel. Diese Zustandsraumkategorien weisen jeweils
zeitlich abhängige
und unabhängige
Dimensionen auf. Die erste Dimension, von oben nach unten, ist zeitlich
unabhängig,
und notiert jeden Zustandsübergang,
wenn ein solcher auftritt. Die zweite SSM-Dimension verfolgt die
Zeit im Programm, nämlich,
wie viel Zeit seit dem letzten Übergang vergangen
ist, wenn der Zustandsübergang
erfolgt. Dimension drei modelliert Übergänge im Verhältnis zu der Zeit seit dem
Beginn einer Fernsehsitzung. Die vierte SSM-Dimension erfasst Tageszeit-Verhaltensmuster, und
die fünfte
die von Wochentagen. Das Ziel ist es, periodische sequenzielle Vorgänge zu ermitteln,
die eine relative zeitliche oder sequenzielle Tendenz gewissen Ausmaßes aufweisen.
Jede Zustandsraumdimension weist eine Übergangsmatrix auf, die als
unscharfe Bins agiert, um die zeitliche Zugehörigkeit zu quantifizieren, zu
der eine Zustandsübergangssequenz
gehört.
-
Beispielsweise
besteht die Dimension Tageszeit für die SSMs Kanal, Genre und
Titel aus sich gegenseitig ausschließenden Übergangsmatrizen, die in jeden
Zustandsübergang
in einer der folgenden Zeitmatrizen eintreten:
Spät_Nachts,
Nachts, Früh_Morgens,
Morgens, Vormittags, Nachmittags, Spätnachmittags, Abends, Nachts
-
4 zeigt
einen Fall des bevorzugten Zustandraums, und die legalen Übergangsflüsse innerhalb
jeder statistischen State-Machine (SSM). in jeder der Wahrscheinlichkeitsdichte-Funktionen existiert
nur ein Zustand zugleich. Die SSMs der bevorzugten Ausführungsform
sind gefallende Titel, Kanäle,
und Genres; und nicht gefallende Kanäle, und Genres; und Kanäle mit Surfen,
und Genres. Jede SSM enthält
feste und variable Zustände.
Feste Zustände
beschreiben Übergänge zwischen
SSMs.
-
Der
erste feste Zustand für
alle SSMs ist der AUS-Zustand. Der AUS-Zustand tritt ein, wenn das
Fernsehgerät
ausgeschaltet ist.
-
Die
SSMs, die gefallende Zustandsübergänge modellieren,
weisen als zweiten festen Zustand den Zustand NICHT_GEFALLEND auf.
-
Umgekehrt
weisen die SSMs, die nicht gefallende Zustandsübergänge modellieren, als zweiten
festen Zustand den Zustand GEFALLEND auf. Kanäle und Genres, die für weniger
als eine bestimmte Schwellenzeitdauer von z.B. 5 Minuten geschaut
werden, zählen
als Surfübergänge.
-
Die
SSMs ohne Surfen weisen einen dritten festen Zustand namens SURFEN
auf. Der Zustand SURFEN ist aktiv, wenn der Nutzer ein Programm
für eine
kürzere
Zeit als den Surfschwellenwert sieht. Die Kanal- und Genre-Surf-SSMs
weisen nur die festen Zustände
AUS und NICHT_SURFEN auf. Variable Zustände für Zustandsräume sind Idealerweise alle
Zustände,
die besucht werden können.
Allerdings begrenzen praktische Ressourcenbeschränkungen oft die Anzahl der
Zustände
wesentlich, die vollständig
modelliert werden können.
Ein Verfahren, um das VM ohne wesentliche Fehler zu komprimieren,
ist es, nur die repräsentativsten oder
am stärksten
bevorzugten Zustände
aller Zustandsräume
als variable Zustände
in die SSMs aufzunehmen und darin aufzulisten.
-
Eine
Präferenz-Bestimmungsmaschine
(PBMA) – siehe 10 – weist
Titeln, Kanälen,
und Genres Präferenzwertungen
zu. Die maximale Anzahl von Zustandsressourcen-Genehmigungen wird
den oberen Wertungen in jeder Kategorie entnommen. Zustände von
Surf-SSM-Modellen sind eine Vereinigung von gefallenden und nicht
gefallenden SSM-Zuständen.
Wie bei jeder State-Machine kann die SSM nur einen Zustand zugleich
einnehmen. Wenn beispielsweise ein gefallender Kanal gesehen wird
und ein Übergang
zu einem nicht gefallenden stattfindet, wäre der „zu"-Zustand der feste Zustand „NICHT_GEFALLEND" der SSM Gefallender
Kanal, und der „von"-Zustand der SSM
Nicht Gefallender Kanal ist der feste Zustand GEFALLEND.
-
Übergänge zwischen
variablen Zuständen
definieren den Block namens Wahrscheinlichkeitsdichte-Funktion,
oder „wdf", da diese die Wahrscheinlichkeit
für das
Auftreten eines jeweiligen Verhaltenszustandsübergangs modelliert. Variable
Zustände
werden der wdf je nach ihrer statistischen Signifikanz im Laufe
der Zeit hinzugefügt
oder aus dieser entfernt. In der Praxis kann es sein, dass die meisten
Zuschauer individuell im Laufe von sechs Monaten weniger als 30
von 100 Kanälen
und 50 von 100 Genres besuchen. Unter Benutzung dieser Beobachtung
kann ein Systemdesigner, der unter Bedingungen mit beschränktem Systemspeicherplatz
arbeitet, die Ressourcenanforderungen an das System wesentlich reduzieren,
und trotzdem weiterhin den größten Teil
des Nutzerverhaltens erfassen. Bis zu einer bestimmten Grenze ist
die Leistung der vorliegenden Erfindung proportional zu, und damit
skalierbar mit, der Anzahl der am meisten bevorzugten Zustände in der
SSM. Die untere Grenze der Anzahl erforderlicher Zustände ergibt
sich oft aus der minimal benötigten Leistung
für Individuen,
die sehr ähnlich,
aber auf subtile Weise verschieden sind. Die obere Grenze ist durch den
abnehmenden Leistungsvorteil des Hinzufügens von Zuständen gegenüber den
Nachteilen von Systemressourcenbeschränkungen gesetzt. Um eine optimale
Grenze zu ermitteln, legt eine Simulation Modell-Ressourcenparameter über eine
statistisch repräsentative
Bevölkerungsstichprobe
für Fernsehverhaltensweisen. Eine
solche Optimierung der Speicherausnutzung ist am wichtigsten für den TV-ProfAgenten.
In einem Realzeit-Modellerstellungsmodus ist ständig eine bestimmte Anzahl
von vorübergehenden
Zuständen
nötig,
während
der ProfAgent ausreichend Indizien ansammelt, um zu bestimmen, welche
in die SSM mit einbezogen, oder aber als nicht ausreichend aktiv
verworfen werden sollen. Nachdem das verfügbare Speicherlimit erreicht ist,
ermittelt der Agent die am wenigsten bevorzugten Zustände, wie
sie von einem einzigartigen Algorithmus in der PBMA bestimmt werden.
-
Wenn
ein Nutzer einen Inhaltsübergang
einleitet, wird ein Übergangsvorgang
registriert, wie er in jeder jeweiligen SSM beschrieben ist. Ein
handlungsbasierter Übergang
ist jeder explizit gedrückte
Fernsehgerät-Steuerknopf;
z.B. ein Kanalwechsel, oder eine Steigerung der Lautstärke. Ein
Nicht-Handlungsvorfall tritt ein, wenn Inhalte sich ohne explizite
Nutzerhandlung ändern;
z.B. ein neues Programm auf demselben Kanal. Im letzteren Fall erzeugt
ein neuer Programmvorgang einen Selbstübergang für jeden anderen Zustand, der gleich
geblieben ist, d.h. ein stabiler Kanal ist ein Kanalzustands-Selbstübergang.
Ein anderer möglicher
Fall ist kein Kanalwechsel, sondern eine Wiederholung desselben
gefallenden Programmtitels. In diesem Fall weisen alle SSMs einen
Selbstübergang
in ihren letzten Zustand auf. Es ist wichtig, dass ein Selbstübergang
zu Programmen, die so kurz sind, dass er anderenfalls als Surfen
gezählt
würde,
als Übergang
ohne Surfen gezählt
wird. Diese Entscheidung folgt der Philosophie des heuristischen
Modellierens der Verhaltensabsicht des Nutzers.
-
5 zeigt
detailliert eine repräsentative
Zustandsraum-SSM-Matrix aus 4 und ihre
Operation. Die Zeilen stellen den „von"-Zustand und die Spalten den „zu"-Zustand eines Zustandsübergangs
dar. Der Prozess kann als eine dynamische demographische Gruppen- Informationsdatenbank
hinsichtlich der Übergangsmatrix-
und Gewichtungseinstellung (ÜMGE)
bezeichnet werden.
-
Die Übergangsmatrix
beschreibt im Prinzip das Zuschauerverhalten in einer Art zeitlicher
Form. Die Übergangsmatrix,
die in 5 dargestellt ist, ist eine Kanalübergangsmatrix.
Die Dimension der Matrix ist A × A.
A ist die Anzahl der verfügbaren
Kanäle
plus 2.
-
Die
Anzahl verschiedener Arten von Matrizen ist 2, eine steht für Kanal-
wie in 5 gezeigt – und eine
steht für
Genre.
-
Es
gibt zwei Gruppen von Matrizen für
jeden Wochentag für
jede demographische Gruppe, d.h., es gibt 14 Matrizen für Kanalgruppe
i (i=1,2,3,...N; N die Anzahl der Gruppen). Eine Gruppe für Sehaktivitäten, eine
andere für
das Surfen.
-
Die
Matrix aus
5 zeigt die folgenden Übergänge: Ein→K.5→K.2→K.6→K.100→Aus. Ein
Punkt in der Matrix (A,B,C,D,E) ist der Mittelwert aller
der demographischen Gruppe
für die
Handlung, z.B. Übergang
von Kanal 5 zu Kanal 2. Punkte in der Ein-Spalte und der Aus-Spalte
und die Matrizen für
das Surfen sind Zähler
für die
Handlung.
-
Basierend
auf der Übergangsmatrix
ist es möglich,
eine demographische Gruppe vorherzusagen. Nach Konstruktion der Übergangsmatrix
müssen
Gewichtungsgruppen für
alle demographischen Gruppen optimiert werden. Die Optimierung basiert
auf der Maximum-Entropie-Theorie und bestärkendem Lernen.
-
Auf
der Klientenseite wird die Vorhersage in derselben Weise erreicht,
es sei denn, eine Speicherbeschränkung
liegt vor. Wenn dies der Fall ist, wird Entropiebewertung benutzt,
um diejenigen Spalten zu eliminieren, die weniger wichtig sind.
Die Gewichtungspunkte, die später
erläutert
werden sollen, werden zur Benutzung durch den Klienten optimiert
und festgesetzt. Wenn der Klient allerdings mehr Rechenleistung
besitzt, als er verbrauchen kann, kann er diese Gewichtungsgruppen
optimieren und lokal bewahren.
-
Nehmen
wir beispielsweise eine Übergangsmatrix
für einen
gesehenen Kanal
,
wobei i ein Kanal; j eine Gruppe, und C die Entropie eines „zu"-Kanals ist, d.h.
eine Spalte in einer Kanalübergangsmatrix.
Es ist zu beachten, dass die Spalte einen umso höheren Wert des Informationsinhalts
aufweist, je niedriger die Entropie ist. Ein niedrigerer
|bedeutet,
dass ein nützlicher
zu-Übergangswert
für diesen
Kanal existiert. Idealerweise sind
|,
i=1,2,3...N, j=1,2...M, N, die Anzahl der Kanäle und M, die Anzahl der Gruppen,
unterschiedlich für
Gruppen, was bedeutet, dass die Übergangsmatrix
dazu beitragen wird, die demographische Gruppe des Zuschauers zu
bestimmen.
-
Das
finale Ziel ist es, eine Wahrscheinlichkeit P
j für einen
Zuschauer zu erhalten und dann
|als j, die vorhergesagte
Gruppe des Zuschauers zu nehmen.
-
Die
Wahrscheinlichkeit pj kann aus zwei Gruppen von Übergangsmatrizen hergeleitet
werden, mit der folgenden Übergangsmatrix
des Zuschauers:
Berechne zunächst
,wobei
X Kanal und Genre sind, außerdem
sowohl für
das Sehen als auch das Surfen, d.h., X nimmt 4 Werte an.
-
Berechne
|,
das die Entropie von von ist, d.h. von den Zeilen.
-
Berechne
dann die Wahrscheinlichkeitsverteilung sowohl für Spalten als auch Zeilen
und
-
Erzeuge
als nächstes
wird eine Gewichtungsmatrix
|
von jeder Übergangsmatrix
für alle
Gruppen. Die Punkte w
x,y in der Matrix sind
wobei
w
x,y die Gewichtung für eine Übergangshandlung ist.
-
Nun
berechne eine gewichtete Punktdistanz zwischen der Informationsdatenbank
und der Übergangsmatrix
des Zuschauers
wobei L eine der Übergangsmatrizen
ist. Die Ausdrücke
L
K und L
P sind L-Matrizen
für Informationsdatenbank bzw.
Zuschauer.
-
Zuletzt
sollte bestärkendes
Lernen, z.B. des Typs Monte Carlo, benutzt werden, um
|
für das
beste Ergebnis zu optimieren. Ein gutes Ergebnis besteht darin,
dass die Zuschauergruppe korrekt vorhergesagt wurde.
-
-
Es
gibt zwei Arten von Empfänger,
mit dem das System arbeiten kann, einen mit Rückkopplungskanal, und einen
ohne. Der optionale Rückkopplungskanal
ist als eine gestrichelte Linie in 1 angezeigt.
Wenn ein Empfänger
mit Rückkopplungskanal
demographische Information bereitstellt, ist die Aufgabe der Werbung aufgrund
der demographischen Gruppe recht klar, wie im Folgenden beschrieben
werden soll. Auch ist die Leistung der Werbung leicht messbar. Wenn
der Empfänger
keine demographische Information der Zuschauer bereitstellt, wird
er wie ein Empfänger
ohne Rückkopplungskanal
behandelt, abgesehen von der Art und Weise, wie die Leistung festgestellt
wird, die direkt über
den Rückkopplungskanal
ermittelt werden kann.
-
Für Empfänger ohne
Rückkopplungskanal
sind zwei Verfahren zum Bestimmen der demographischen Gruppe des
Zuschauers vorgesehen. Welches Verfahren benutzt wird, hängt vom
besseren Entsprechungsprinzip der beiden ab, das durch den Maximum-Entropie-Messwert
für Pj der vorangegangenen Ausführungen gemessen
wird. Es sollte das Verfahren benutzt werden, das den kleineren
Entropiewert erzeugt. Die Leistung der Empfänger ohne Rückkopplungskanal sollte durch
Marktforschung gemessen und dann in den Lernkreis eingebracht werden,
wie bei solchen mit Rückkopplungskanal.
-
Die
Realzeit-Rückkopplung
der Zuschauerhandlung mit demographischer und mit Leistungsinformation
existiert natürlich
nur, wenn ein Rückkanal
für den
Empfänger
eines Zuschauers vorhanden ist. Er enthält Information des Verhaltensinformationsstroms
des Zuschauers sowie die Leistung der demographischen Vorhersage.
Der Verhaltensstrom sollte wenigstens die oben genannten Punkte
enthalten, nämlich
Sehdatum, Sehbeginnzeit, Sehdauer, Sehkanal, und demographische
Information. Die Leistung ist eine Zeitliste, um anzuzeigen, ob
die Vorhersage des Empfängers
richtig ist oder nicht.
-
Da
die demographische Information der Empfänger bekannt ist, kann der
Informationsdatenbank-Erfasser
(siehe mittlerer Kasten in 1) Änderungen
anhand der rückgekoppelten
Information vornehmen.
-
Zusammengefasst
zeigt 5 deshalb eine repräsentative nicht-zeitliche Zustandsraum-SSM-Matrix und ihre Operation.
Der beispielhafte Kanalzustandsraum benutzt den Übergang von AUS zu den Kanälen 5, 2,
6 und 100, und zurück
zum AUS-Zustand, ausgehend von einer leeren Matrix. Der ProfAgent
erhöht
den betreffenden Übergangsmatrixeintrag
für jedes
Zustandspaar. Bei dem vorliegenden Beispiel würden die folgenden (von, zu)-Matrixeinträge erhöht (5, EIN),
(5,2), (2,6), (6,100), und (100,AUS). Die Besuchshäufigkeit von
Kanal 5 ist die Summe aller Einträge in Spalte 5, die globale
Wahrscheinlichkeit ist diese Zahl geteilt durch den Matrixgesamtwert.
Sobald Kanal 5 eingeschaltet ist, ist die Wahrscheinlichkeit, auf
Kanal 2 umzuschalten, der Inhalt von (5,3), geteilt durch die Summe
von Zeile 5 (von-Zustände
Kanal 5).
-
Ein ähnlicher
Prozess steuert die Akkumulation und Analyse von höherdimensionalen Übergangsmatrizen
wie z.B. zeitlichen. Der Mechanismus ist identisch, nur dass der
Eintrag in der passenden Zeitintervallebene des Übergangs erhöht wird.
Ein wichtiger Unterschied zwischen der Pseudo-VMM-Implementierung
und dem theoretischen VMM ist, dass die Zustandsübergänge in der Markow-Kette nicht
notwendigerweise von dem letzten Zustand unabhängig sind. So entspricht die
Wahrscheinlichkeit, eine Zustandssequenz zu durchlaufen, nicht unbedingt
dem Produkt der einzelnen Zustandsübergangswahrscheinlichkeiten.
Es handelt sich allerdings um eine untere Schranke. Solange das
Zustandsauswahlverhalten des Nutzers gleichmäßig zufällig ist, tendiert das pVMM
zum theoretischen VMM. Der Mangel an Übergangsunabhängigkeit
löscht
nicht die Nützlichkeit
eines teilweise zufälligen
State-Machine-Modells
aus, da das Auswahlverhalten des Nutzers dazu tendiert, ein Gaußsches Auswahlverhalten
zu sein, doch es erfordert zusätzliche
statistische Information zur Kompensation. Sequenzmodellierung,
wie sie hier beschrieben ist, ist ein solcher Versuch.
-
Die
Präferenzbestimmung
und die Profilmodellierung, die zuvor beschrieben wurden, können in
verschiedenen Zusammenhängen
implementiert werden. Hier konzentrieren wir uns auf das zielgerichtete
Ausrichten von Werbeinhalt, basierend auf den Präferenzbewertungen und der Profilmodellierung.
-
6 zeigt
die Werbekategorie-Gruppenlernarchitektur, die im Zielrichtungsserver
angewandt wird. Die VGM erzeugt m-Gruppen von m Nutzern von einer
bestimmten Werbekategorie-Trainingsgruppe.
Der Gruppenaggregatorblock extrahiert die repräsentativsten Aspekte der gelernten
Gruppen und erzeugt ein typisches Profil der Gruppe. Nach einem
Training über
n Werbekategorien werden n typische Werbekategorie-Verhaltensprofile
erzeugt. Das heißt, 6 zeigt
ein Werbekategorie-Verhaltensprototyp-Lernsystem, d.h. die obere
Werbekategorie-Gruppenlernarchitektur.
Das Modul ist in dem Kopfend-Werbemanager innerhalb des Zielrichtungsservers
angeordnet. Gruppenlernen ist ein fortlaufender Prozess des Definierens
und Optimierens von Werbekategoriegruppen und ihren korrelierten
Verhaltensprofilen, basierend auf qualitativ hochwertigen, markierten
und gesammelten TV-Nutzer-Erfassungsdaten. Die demographischen Verhaltensdaten werden
entweder von einer dritten Partei und/oder von Feldeinheiten eingegeben.
Ein Auswahlfilter extrahiert die Zielwerbekategorie der Trainingsgruppe
für die
VGM. Die VGM verarbeitet jeden Nutzereintrag in der Trainingsgruppe,
als ob er von demselben Nutzer stammen würde, und erzeugt so ein sehr
großes
Gesamt-VM. Das resultierende VM wird parametrisiert und zu einer
Untergruppe von ausschließlich
hoch tendenziellen Dimensionen verfeinert, die als die repräsentative
Verhaltenssignatur für
die Werbekategorie dienen. Dieser Schritt wird als Inter-Prototyp-Verfeinerung
bezeichnet, da er nur schlechte, unzureichend tendenzielle Dimensionen
aus einem jeweiligen VM entfernt. Die VGM wiederholt diese Prozedur
für jede
Trainingsgruppe, bis jede Werbekategoriegruppe ein entsprechendes
Verhaltenssignaturprofil aufweist, sofern eines existiert. Ein typisches
Werbekategorieprofil existiert, wenn, und nur wenn, wenigstens eine
Verhaltensdimension eine signifikante Tendenz gegenüber Zufall
zeigt. Jede SSM weist eine entsprechende Gruppe von neuartigen Parametrisierungen
allgemeiner, charakteristischer Zustandsübergangs-Verhaltensweisen auf, die dazu tendieren, Nutzer
zu separieren.
-
7 zeigt
die Verfeinerungsphase des Aufstellens einer Werbekategorievorlage.
Diese Phase distanziert die Prototypen, indem die Dimensionen entfernt
werden, die zwischen den Kategorien die größte Gemeinsamkeit aufweisen.
Die zweite Stufe des Aufstellens von Werbekategorie-Verhaltensprototypen,
die hier als Intra-Prototyp-Verfeinerung oder Intra-Profil-Verfeinerung
bezeichnet wird, entfernt die Dimensionen jedes VM, die allen anderen
entsprechenden VM-Dimensionen ähnlich sind.
Dieser Schritt wählt
die unterscheidungskräftigsten
Dimensionen für alle
Zielreferenzprofile auf und erzeugt so eine minimale Beschreibungslänge für jeden
Werbekategorieprototyp. Wenn das Resultat dieses Verfeinerungsprozesses
das Entfernen aller, oder im Wesentlichen aller, Klassifizierungsdimensionen
eines Prototyps ist, werden die ähnlichsten
Werbekategorien zu einer einzigen prädiktiven Klasse verschmolzen,
so dass die beste Zielrichtungsauflösung des Systems auf die verschmolzenen
Werbekategorien reduziert wird. Wenn beispielsweise eine unzureichende
Distanz drei männliche
Altersgruppen von 20, 30 und 40 Jahren separiert, werden diese Werbeklassen
zu einer einzigen Klasse von Männern
zwischen 20 und 40 Jahren verschmolzen. Der Zielrichtungsserver
sendet die abschließenden
Zielrichtungswerbeprofil-Prototypen, ihre Kategoriemarkierungen,
und die erwartete Vorhersageleistung an den Werbeserver.
-
Es
folgen die genauen Aspekte des neuartigen Trainings-, Verfeinerungs-
und Verschmelzungsverfahrens. Die VGM beginnt den Trainingsprozess
durch Erstellen des VM mit markierten Nutzerdaten von den ausgewählten Zielgruppenmitgliedern.
Die VGM berechnet Übergangs-
und bestimmte Verhaltensmuster von jeder Nutzerhandlung. Übergangszählvorgänge, die
von dem VM unterstützt
werden, umfassen Änderungen
in einem EPG-Programmeintrag,
die mit verschiedenen relativen Zeitmaßen auftreten. Eine minimale
Vorgangs-Trainingserfassung
erscheint als:
<NutzerlD><Datum><Zeit><Kanal><Genre><Titel><Programmlänge>
-
Da
die Trainingsgruppe eine bereits bestehende Datenbank ist, erfolgt
das Lernen im Batch-Modus und
nicht in Realzeit. Im Batch-Modus werden alle gesehenen Programme
innerhalb eines bestimmten Lernfensters zugleich gewertet und geordnet.
Die VM-Simulation legt das Lernfenster über die Nutzerdaten oder die
Lernperiode. Mit Realzeitdaten ist ein vorübergehender Haltebereich nötig, während ausreichend
Indizien gesammelt werden, um den Übergang in eine statistische
State-Machine SSM aufzunehmen. Das Lernfenster bestimmt die zeitliche
Leistung des Systems. Auf der Serverseite besteht im Allgemeinen
keine Speicherbeschränkung,
weshalb es nicht nötig
ist, möglicherweise
weniger bevorzugte Zustände
zu löschen,
um neue Beobachtungen aufzunehmen. Der Haupteffekt des Lernfensters
ist es, die Leistung des VM der Klientenseite über eine Spanne von speicherbegrenzten
Nutzer-Geschichtsperioden
hinweg einzuschätzen.
Ein Ziel der vorliegenden Erfindung ist es, stationäre Verhaltensparameter
und ihre typische Varianz zu identifizieren. Wenn die Wahrscheinlichkeitsdichte-Funktion
für die
Zufallsvariable eine Funktion der Zeit ist, wird der Zufallsprozess
als nicht-stationär
bezeichnet. Um die statistische Stabilitätsperiode für das nichtstationäre Zufallsprozessverhalten
der Gruppe zu bestimmen, wird das Lernfenster ständig angepasst, von einigen
Tagen bis zu einigen Monaten. Die annähernde stationäre Periode
ist die Größe des Lernfensters,
die die beste Korrelation zwischen den Fensterschritten aufweist.
Jede Werbekategorie weist potenziell eine unterschiedliche mittlere stationäre Periode
auf. Beispielsweise können ältere Menschen
für einen
breiteren Zeitintervall ein repetitiveres Verhalten als Teenager
aufweisen. Der Zielrichtungsserver versorgt den Werbeserver mit
erwarteten Lernzeiten, die benötigt
werden, um Vorhersagestabilität
und Konvergenz für
jede Werbekategorie zu erreichen.
-
8 zeigt das Realzeit-Werbekategorieeinschätzungs-System.
Der MitgliedAgent vergleicht das Realzeit-Nutzverhalten des TV-Nutzers
mit Werbekategorievorlagen und berechnet eine Wahrscheinlichkeitsverteilung
der Werbekategorie des Nutzers.
-
9 umreißt das TV-Werbezielrichtungssystem
gemäß der bevorzugten
Ausführungsform.
Der ZUSAgent empfängt
Werbungen vom TV-Kopfende und interpretiert die Metadaten zur gezielten
Ausrichtung der Werbungen. Der ZUSAgent vergleicht das Zielpublikum,
das durch den Zielanfrageausdruck der Werbung vorgegeben ist, mit
Punkten, die von Vorhersagedaten zur Werbekategorie von Haushaltsnutzern
ausgewählt wurden,
und erzeugt eine Zielrichtungsbewertung, die der ZUSAgent und der
PräsAgent
benutzen, um zu bestimmen, welche Werbung jeweils gespeichert und
gezeigt werden soll.
-
Bezug
nehmend auf 10, ist die Architektur der
Präferenz-Bestimmungsmaschine
gemäß der Erfindung
dargestellt. Der Profilerstellungsagent (ProfAgent) bringt das Verhaltensmodell
VM mit jedem Inhaltsänderungsvorgang
schrittweise auf den neuesten Stand. Zunächst wird der Vorgang in Zustände und,
wenn vorhanden, zeitliche Beziehungen aufgeteilt. Gefallende Zustände sind
alle modellierten Aspekte, Merkmale oder Nutzungen, die einem gefallenden
Programm zugeordnet sind. Der ProfAgent empfängt Programmpräferenzbewertungen
von der Präferenz-Bestimmungsmaschine
(PBMA). Die PBMA bestimmt ein gefallendes Programm durch Werten
des Wahlnetzwerks aus 10. Es gibt drei Hauptkomponenten
der PBMA, das Realzeitinhalts- und Kontextpräferenz-Lernen (ProfAgent),
die Präferenzvorhersage
(VorhersAgent), und einen VMA-Agenten. Eine Beschreibung des VorhersAgenten
folgt dem Überblick über den
ProfAgent. Die Ausgabe ist eine wahrnehmungsartige gewichtete lineare
unscharfe Wahl-Kombination der zuvor aufgezählten Präferenzmessfilter (PMF):
-
Der Lernalgorithmus des
ProfAgenten
-
- – Einleitung
1.
Alle n Gewichtungen auf 1/n einstellen
2. ρ, δ und η auf konservative Schätzungen
einstellen (z.B. ρp = ρn = 0, ηp = ,1, ηn = δ =
,05), wobei ρ ein versuchsabhängiger Lernmomentausdruck
ist. η ist
eine versuchsunabhängige
Lernrate. Die tief gestellten Indizes n und p entsprechen jeweils
einem negativen bzw. einem positiven Vorgang.
- – Berechnung
der Ausgabeaktivierung O
3. 0 = Σwi·Vi für
alle i = 1 zu n
Wobei Vi die unscharfe
Ausgabewahl der PMF ist.
- – Gewichtungstraining
4.
Für jeden
positiven Vorgang:
wi(t + 1) = wi(t) + ηpwi(t), für alle Vi ≥ θ
wi(t + 1) = wi(t) – ηpwi(t), für alle Vi < θ
5.
Für jeden
negativen Vorgang:
wi(t + 1) = wi(t) – ηnwi(t), für alle Vi ≥ θ
wi(t + 1) = wi(t)
+ ηnwi(t), für alle Vi < θ
θ ist der
minimale unscharfe Gefallenswahlschwellenwert.
- – Aktualisierte
Lernrate
6. Im Fall eines positiven Vorgangs:
ρp(t
+ 1) = ρp(t) + ρp(t)·(0(t) – O(t – 1)MAX_STIMME)
ηp(t + 1) = ηp(t)
+ ηp(t)·ρp(t
+ 1) + δ
ηnt + 1) = ηn(t) – ηn(t)·ρp(t
+ 1) – δ
7.
Im Fall eines negativen Vorgangs:
ρn(t
+ 1) = ρn(t) + ρn(t)·(O(t – 1) – O(t)MAX_STIMME)
ηn(t + 1) = ηn(t)
+ ηn(t)·ρn(t
+ 1) + δ
ηpt + 1) = ηp(t) – ηp(t)·ρn(t
+ 1) – δ
δ ist ein
frequenzverstärkender
Ausdruck.
-
Der
ProfAgent passt die Gewichtungen des einzelschichtigen n-Knotennetzes
gemäß einem
bestärkenden
Lernschema an. Die n Gewichtungen, vorzugsweise nutzerspezifisch,
werden ebenfalls auf 1/n initialisiert; d.h., alle PMF haben eine
gleiche Stimme. Jedes Mal, wenn der Benutzer dasselbe Programm besucht, verstärkt das
Trainingsregime Knoten, die das Programm als gefallend bestimmen,
und vernachlässigt
die übrigen.
Diese Philosophie bestätigt
Präferenzvorhersagen
durch Beobachtungsfrequenz. Um Stabilität und Konvergenz zu fördern, wendet
eine Lernrate η ein
inkrementales Bestärkungssignal
an, um Gewichtungen anzupassen.
-
Zwei
Lernraten steuern den Trainingsprozess, eine negative (ηn) und eine positive (ηn)
Vorgangsrate. Ein positiver Vorgang liegt vor, wenn der Nutzer das
Programm wählt,
und ein negativer Vorgang liegt vor, wenn ein Programm in einem
zuvor gefallenden Kontext verfügbar
war, aber ein anderes Programm gewählt wurde. In der Praxis ist
mehr Kausalinformation in positiven Beispielen als in negativen
vorhanden. Daher ist ηp normalerweise viel höher als ηn.
Der Momentausdruck ρp(ρn) erhöht
(senkt) Trainingsbelohnungen, wenn die Präferenzstimmausgabe einen zunehmenden
(sinkenden) Präferenztrend
zwischen positiven (negativen) Vorgängen anzeigt, und senkt ηp(ηn), um eine positive (negative) Lerntendenz
widerzuspiegeln. Der Lernratenausdruck δ bestärkt die Programmbesuchsfrequenz.
Diese Bestärkung
ist für
jeden positiven Vorgang positiv, und ansonsten negativ. Im Laufe
der Zeit erlernt das vorliegende Präferenzlernsystem automatisch
die PMFs, die die Programmpräferenz
am besten vorhersagen, und gibt den übrigen weniger Vorrang. Die
Lernraten werden angepasst, um sich an die Zeitkonstante von periodischen
Präferenzverschiebungen
der Nutzer anzunähern. Alle
PMFs geben einen unscharfen Präferenzbewerfungsbereich
in Schritten von einem minimalen Bewertungswert (z.B. HASST_PROGRAMM=1)
bis zu einem maximalen Wert (z.B. OBERES_PROGRAMM=MAX_STIMME=6)
aus.
-
θ ist der
Wert der minimalen unscharfen Zugehörigkeit, der wenigstens ein
gefallendes Programm anzeigt (z.B. Vi=MAG_PROGRAMM/MAX_STIMME=4/6=0,66).
Die PMF-Bestärkung
wird durch den Vergleich der Stimme einer PMF mit θ bestimmt.
Eine Stimme ist positiv, wenn Vi ≥ θ, und ist
ansonsten negativ. Der Effekt ist, dass eine PMF-Stimmgewichtung
belohnt wird, wenn sie während
eines positiven (negativen) Programmsehvorgangs positiv (negativ)
stimmt, und anderenfalls vernachlässigt wird.
-
Die
PBMA berechnet die Präferenzbewertung
R des Programms oder jedes anderen Zustandstypen wie folgt:
- – Wenn
das Programm bereits ein Zustand in einer SSM ist: Ok ist
die chronologisch geordnete Reihe von Präferenzstimmen für das Programm.
t
ist die Anzahl neuerer Bewertungen des Programms, t Punkte zur aktuellen
Wahl O.
q ist die Anzahl vergangener Bewertungen, um den gleitenden
Mittelwert mit einzubeziehen.
c ist eine zeitliche Gewichtungskoeffizientenreihe,
wobei ck<=1.
λ(t) ist ein
versuchsunabhängiger,
aber häufigkeitsabhängiger Tendenzausdruck,
wobei λ(t)<=1.
- – Wenn
das Programm noch kein Zustand in einer SSM ist
R = O
-
Die
Präferenzbewertung
R eines Programms ist ein gewichteter gleitender Mittelwert der
aktuellen und vergangenen Programmpräferenzstimmen. Ein Fachmann
im Systemdesign stellt die Verteilung ck auf
die gewünschte
zeitliche Tendenz vergangener Wertungen ein. Üblicherweise sinkt im Laufe
der Zeit der Wert alter Information, weshalb die Wertungen im Laufe
der Zeit an Wert verlieren. λ(t)
erhöht
proportional die Gesamtwertung, je nach dem, wie oft das Programm
gewertet wurde. λ(t)
ist vorzugsweise eine kleine und langsam zunehmende Funktion der
Sehhäufigkeit;
z.B. λ(t)=c·log(t)=[0,
0,03, 0,05, 0,1, 0,12, 0,15...]. Der Effekt von λ(t) ist es, eine umso größere Präferenz für ein Programm
anzuzeigen, je öfter
es gesehen wird, unabhängig
von der PMF-Stimme.
-
Wenn
beispielsweise ein Zuschauer immer nur die ersten 20 Minuten der
Tonight Show sieht, wäre
die Wertung des Programms niedrig, während der Häufigkeitsausdruck λ(t) stetig,
beispielsweise logarithmisch, die Wertung erhöhen würde, um die Dauerhaftigkeit
der Sehpräferenz
widerzuspiegeln; z.B. eine 3 % höhere Wertung
nach 3 Malen, und 12 % nach 5 Malen usw. Alle Zustandstypen, die
einem Programm zugeordnet sind, erben die effektive Präferenzstimme
O des Programms.
-
Wenn
beispielsweise das Programm eine GEFALLEND-Wertung aufweist, erhalten
sein Genre, Kanal, Schauspieler usw. ebenfalls eine GEFALLEND-Wertung.
Die PBMA berechnet eine Präferenzwertung
R eines Zustandskandidaten, wie für das Beispiel Titel oben beschrieben,
dargestellt in Gleichung (1). Wenn beispielsweise ein Nutzer zwei
Komödienserien
gesehen hat, „Seinfeld" dabei mit einer
GEFALLEND-Wertung, und dann eine ganze Zeit später „Friends" mit einer INTERESSIERT-Wertung sieht,
dann ist O
1=GEFALLEND=4, UND O
2=INTERESSIERT=3,
und dann ist die Präferenzwertung
des Zustands Komödie_Serie
(mit c
1=0,9, c
2=1, λ(2)=0,03):
-
In
diesem Fall wurde die ältere
Stimme um 10 % gesenkt, da eine lange Zeit zwischen den Programmsehvorgängen verstrichen
ist. Da allerdings dasselbe Genre zweimal gesehen wurde, erhielt
die Wertung eine Erhöhung
um 3 %. Derselbe Präferenzwertungs-Algorithmus
gilt für
jeden Zustandstyp.
-
Für jedes
gesehene Programm leitet die PBMA eine Kandidaten-Zustandspräferenzbewertung
an den ProfAgenten weiter, um das VM entsprechend den vorgegebenen
Algorithmen anzupassen. Die PBMA weist die VGM an, alle Nutzer-Trainingsdaten
zu verarbeiten, als würden
sie von einem Nutzer stammen, so dass ein einziges VM erzeugt wird,
das Verhaltensinformationen für
alle Klassenmitglieder enthält.
-
Die
Stimmausgabe des ProfAgenten wird in einer Stimmgeschichtsdatenbank
(STIMMdbank) gespeichert, die der ProfAgent wie hier beschrieben
benutzt, um die am stärksten
bevorzugten Zustände
zu bestimmen, die in der VMdbank behalten werden sollen. Der VorhersAgent
benutzt die STIMMdbank ebenfalls, wenn er Anfragen durch den Präferenz-Bestimmungsagenten
PräfAgent
zum Bewerten von Inhaltsparameterpräferenzen beantwortet. Der PräfAgent und
seine Funktion sind in der gemeinschaftlich erteilten, parallelen
Patentanmeldung [Docket Nr. 155785-0006/P01862, basierend auf den vorläufigen Anmeldungen
60/215,450 und 60/226,437] näher
beschrieben. Die Offenbarung der parallelen Anmeldung wird hiermit
durch Querverweis zitiert.
-
Ein
Aufzeichnungsmanager veranlasst die Aufzeichnung von Programmen,
indem periodisch eine Aufzeichnungssequenz eingeleitet wird. Zu
diesem Zweck sendet der Aufzeichnungsmanager eine Anfrage an den
Präferenzagenten
PräfAgent
zu Wertungen aller Programme zu einem bestimmten Zeitpunkt (X),
oder alternativ zu Wertungen aller Programme innerhalb einer bestimmten
Zeitperiode (X). In einigen Ausführungsformen
kann die Häufigkeit,
mit der die Schritte durchgeführt
werden, durch den Nutzer veränderbar
sein. Der Präferenzagent
antwortet durch Bereitstellen von Bewertungen aus einer Präferenzdatenbank,
für jedes
Programm, das von dem Aufzeichnungsmanager empfangen wird. Der Aufzeichnungsmanager
veranlasst dann das Aufzeichnen der Programme zum Zeitpunkt X, oder
innerhalb der Zeitperiode X, gemäß den Wertungen, die
von dem Präferenzagenten
empfangen wurden.
-
Der
Präferenzagent überwacht
die Sehauswahl der verschiedenen Zuschauer mit Hilfe des Steuersystems
und erzeugt Sehprofile jedes Zuschauers, die in der Präferenzdatenbank
gespeichert werden. Basierend auf diesen Profilen geht der Präferenzagent
durch den eingehenden Programminhalt, wie er in der EPG-Information
beschrieben ist, um Listen wie die „Top 10"-Liste der Sehmöglichkeiten zu erstellen, die
dem Nutzer zu einem jeweiligen Zeitpunkt zur Verfügung stehen,
und weist den Aufzeichnungsmanager an, die am höchsten positionierten Programme,
die zu einem bestimmten Zeitpunkt ausgestrahlt werden (einschließlich aller
vom Zuschauer zum Aufnehmen ausgewählten Programme), aufzunehmen,
und in einer Speichervorrichtung für gespeicherte Programme zu
speichern. Der Präferenzagent
enthält
ferner Software, die es ermöglicht,
ein demographisches Profil für
jeden Nutzer zu erstellen, basierend auf dem Sehprofil des Zuschauers
und auf bestimmten Algorithmen oder zuordnenden Regeln. Diese Algorithmen
können
im Laufe der Zeit angepasst werden, während das Modell, das von dem
System angewandt wird, verstärkt
wird, und sich seine Genauigkeit verbessert. Zu diesem Zweck kann
der Systemaktualisierungs-Informationskanal, der in dem Ausstrahlungssignal
enthalten ist, periodische Softwareaktualisierungen beinhalten,
einschließlich
neuer Präferenzdatenbank-Parameter,
die auf Wunsch der Werbeschalter miteinbezogen werden müssen. So
kann das Steuersystem in einer Ausführungsform entfernt aktualisiert
werden, um neue Anforderungen zu erfüllen, die entstehen können, wenn
die Anbieter von Werbeinhalten sich mit dem System und dem Prozess
der Maßanfertigung
eng fokussierter, zielgerecht ausgerichteter Werbung vertraut gemacht
haben. Das demographische Profil, das für jeden Zuschauer erzeugt wird,
wird in einer demographischen Datenbank gespeichert, die in dem
Steuersystem angeordnet ist und so die Privatsphäre des Nutzers sicherstellt.
-
Der
Präferenzagent
geht außerdem
durch den Werbeinhalt, der durch mehrere Werbekanäle einströmt, die
in dem Sendesignal enthalten sind, und, basierend auf den demographischen
Profilen der Zuschauer und den Metadaten, die in jeder Werbung zum
Beschreiben des Zielpublikums für
eine bestimmte Werbung enthalten sind, speichert und/oder veranlasst
die Anzeige von bestimmter Werbung. Das Steuersystem kann jedes
der verschiedenen Verfahren zum Manipulieren des Werbeinhalts benutzen,
die unten beschrieben sind.
-
Der
VorhersAgent kombiniert Information zur Präferenzstimmgeschichte mit kontextabhängigen VM-Präferenzen,
um eine Bewertung zu erzeugen, die der ZUSAgent oder andere Systemmodule
benutzen, um präferenzbezogene
Entscheidungen zu treffen.
-
Der
VorhersAgent summiert historische Stimmen, um eine Gesamtwertung
für den
modellierten Zustand zu erzeugen. Der VorhersAgent weist dieselbe
Lernarchitektur auf wie der ProfAgent. Anders als der ProfAgent
allerdings, der lernt, beitragende Messwerte aufzuweisen, lernt
der VorhersAgent die optimalen statistischen Moment-für-Moment-Parameter.
Anstelle von PMF-Eingaben
gibt es drei statistische Eingaben zur Stimmgeschichte: Stichprobenzahl,
Stichprobenmaximum, und Stichprobenminimum, und ihre folgenden jeweiligen
Stimmgewichtungen:
- – CntPctKoef, Gewichtung der
Häufigkeit,
mit der der Zustand besucht wurde
- – MaxPctKoef,
Gewichtung der beobachteten Maximalstimme
- - MinPctKoef, Gewichtung der beobachteten Minimalstimme
-
Folgendes
ist der Pseudocode für
die Berechnung der Präferenzwertung
im beispielhaften Titelzustandsfall:
gültigeZustände=finde(cntLTitelStimme);
TeffMinStimme=mittlLTitleVote-sdvLTitelStimme;
maxTcnt=max(cntLTitelStimme(gültigeZustände));
maxTmax=max(maxLTitelStimme(gültigeZustände));
TcntAdj=log(cntLTitelStimme(gültigeZustände))/log(maxTcnt) – log(mittl(cntLTitelStimme(gültigeZustände)))/log(maxTcnt);
TmaxAdj=log(maxLTitelStimme(gültigeZustände))/log(maxTmax) – log(mittl(maxLTitelStimme(gültigeZustände)))/log(maxTmax);
TminAdj=(minLTitelStimme(gültigeZustände) – mean(minLTitelStimme(gültigeZustände)))/MAxTITEISTIMME;
TeffStimm=TeffMinStimme
+ TeffMinStimme.·(TcntAdj·cntPctKoef
+ TmaxAdj·maxPctKoef
+ TminAd j·minPctKoef);
-
Für die Stimmen
wird eine Gaußsche
Verteilung angenommen, und eine konservative Bewertung ist wünschenswert.
Dies ist eine Stimmgruppenklassifikationsgrenze. MaxTcnt, und maxTmax
sind normierende Maxima für
alle Zustandsbesuchszähler,
und die höchste
maximale Stimme. Gelernte Anpassungsfaktoren stellen TeffMinStimme
gemäß den erlernten
Anpassungen TcntAdj, TmaxAdj, und TminAdj ein. Diese Stimmanpassungsparameter
reichen von null bis eins, und wachsen logarithmisch durch Stimulation
an, und werden weiter durch ihren jeweiligen Mittelwert normiert.
Eine solche Wertungsrichtlinie zieht fortlaufend hohe beobachtete
Wertungen instabilen Präferenzwertungen
vor, auch wenn diese ein mittleres Hoch aufweisen. Der Zustandszähler-Anpassungsfaktor
stellt eine positive (negative) Tendenz zu mehr (weniger) häufig gesehenen Zuständen her.
So könnte
eine hohe Präferenzstimme
für einen
Actionfilm eines einmaligen Vorgangs eine niedrigere Bewertung erhalten
als ein täglicher
Stimmmittelwert für
eine Komödienserie.
Dieser Gleichungsausdruck trägt
dazu bei, Fälle
zu überwinden,
in denen die Präferenzwertung
aus irgendeinem Grund ungenau niedrig ist, obwohl das wiederholte
Nutzerverhalten eine höhere
Stimme rechtfertigt. Der Ausdruck TmaxAdj trägt dazu bei, der Präferenzwertung
im Verhältnis
zu Präferenzspanne
der Nutzer Bedeutung zu verleihen. Das heißt, wenn ein Nutzer niemals
eine sehr hohe Wertung gezeigt hat, und zwar möglicherweise aufgrund schlechter
Systemleistung, sollten Wertungen, die sich dem persönlichen
Maximum des Nutzers annähern, nach
oben verschoben werden, um eine relativ hohe Wertung für diesen
Benutzer anzuzeigen. Dies ist insbesondere dann nützlich,
wenn z.B. Wertungen zwischen Nutzern im Fall einer Multi-Nutzer-ID
verglichen werden. Der Verschiebungsausdruck TminAdj für das Stimmaktivierungsniveau
bevorzugt Zustandsstimmen, die im Verhältnis zu allen verwandten Zuständen signifikant
von der mittleren Minimalstimme abweichen. Dies ist eine weiche
gierige Stimmversatzstrategie, die die niedrigsten Antworten des
Nutzers als Referenzpunkt benutzt, um eine hohe Sicherheit für verhältnismäßig höhere Wertungen
abzuleiten.
-
Die
PBMA benutzt die global angepassten Präferenzwertungen des VorhersAgent,
um die Zustände zu
ermitteln, die gegen stärker
bevorzugte Zustände
auszutauschen sind, wenn aufgrund von Speicherbeschränkungen
ein maximaler Zustandszählwert
erreicht ist. Dabei wird das VM ständig aktualisiert, um die relevantesten
Zustände
zu enthalten (potenziell alle besuchten Zustände, wenn der Speicher dies
zulässt).
-
Der
nächste
Schritt des Prozesses zum Aufbau des Werbekategorieprototyps ist
es, das VM in einen pseudo-euklidischen Raum zu parametrisieren.
Da die Modellierungsdatenstrukturen im VM nicht eindimensionale
Gaußsche
Verteilungen sind, ist das Bestimmen der Distanz zwischen zwei VMs
ein schwieriger und ungenauer Prozess, wenn Verfahren des Stands
der Technik benutzt werden. Verfahren des Stands der Technik nehmen
an, dass Stichprobendaten eine glockenförmige Verteilung aufweisen,
und modellieren die Daten auf Gaußsche Art und Weise, definiert
durch ein Mittel μ und
Varianz σ.
Wie jedoch in 11, 13 und 14 gezeigt,
sind Stichproben in verschiedenen modellierten Kategorien nicht
normal verteilt, sondern exponentiell, beta, gleichmäßig, delta,
oder multimodal. Es ist wichtig, dass Übergangsmatrizen sich nicht
für die
Standarddistanzmetrik eignen, die zum Bestimmen einer Gruppenzugehörigkeit
benötigt
wird. Bekannte Klassifizierungsverfahren definieren einen euklidischen
Merkmalsraum, der aus Gruppennachbarschaften besteht, die um das
Gruppenmittel μ herum
angeordnet sind, und dessen Gruppengrenzen sich von σ nach μ erstrecken. Üblicherweise
wird die Mahaloanobis-Distanz
benutzt, um Gruppenzugehörigkeit
zu unterscheiden. Die Mahaloanobis-Distanz ist schlicht die euklidische
Distanz, geteilt durch das dimensionale σ jeder Gruppe, oder, (μ1 – μ2)TΣ – 1(μ1 – μ2),
wobei Σ die
gegenseitige Kovarianzmatrix ist
-
Dieses
Verfahren ist sehr ungenau, und bei TV-Systemen unpraktisch. Es
ist aus zwei Hauptgründen ungenau:
Es geht fälschlicherweise
von Gaußschen
Stichprobendaten aus, und die Umkehrung der Kovarianzmatrix führt zu signifikanten
Abrundungsfehlern des Gleitkommas, welche die Matrix oft singulär machen. In
hochdimensionalem Raum, z.B. über
100, kann das Berechnen und Umkehren einer Kovarianzmatrix aufgrund
von CPU-Zeit- und Speicherverbrauch ausgeschlossen werden. Bei einer üblichen
sparsamen Stichprobenmatrix müssen
viele unnötige
Kreuzkorrelationsausdrücke
manipuliert werden. Standardverfahren sind in ähnlicher Weise nicht anwendbar,
um die Distanz zwischen entsprechenden SSMs zu bestimmen. Es besteht also
Bedarf nach einer neuartigen Strategie zum Darstellen multimodaler
Gruppen und der Distanzen zwischen ihnen.
-
Das
VM ist in drei allgemeine Klassen von Verhaltensdimensions-Datenarten
parametrisiert: Histogramm, skalar, diskret. Um SSMs in einem Klassifizierungsraum
darzustellen, werden allgemeine, momentunabhängige Verhaltensmuster identifiziert,
und als dimensionale Klassifizierungsparameter extrahiert. Jeder Matrixparameter
ist ein pseudo-euklidischer Klassifizierungsraum.
-
Einige
typische SSM-Parameterkategorien sind:
- 1. Übergangstendenz-Histogramm
- 2. Selbstübergangstendenz-Histogramm
- 3. Einschalt(Ausschalt)-Zustandstyptendenz-Histogramm
- 4. Übergangsumkehrfendenz-Histogramm
- 5. Einzelübergangsverhältnis
- 6. SSM-Matrix-Stichprobensicherheit
- 7. Tendenz zu oberen n Zuständen
- 8. Obere n Zustände
-
Punkte
1 bis 4 sind Verteilungen der beobachteten Tendenz für die entsprechenden
Verhaltensmuster. Punkt 1 stellt die Stärke der Tendenz für zufällig auftretende Übergänge dar.
-
Eine
andere wichtige Verhaltenskategorie, Punkt 2, ist, wie wahrscheinlich Übergänge zurück zum ursprünglichen
Zustand sind, d.h. von einer Komödie
zu einer Komödie.
Punkt 3 erfasst den erwarteten Sitzungsstart oder das erwartete
Sitzungsende eines Nutzers, für
alle Zustandstypen. Punkt 4 stellt eine Verteilung von Tendenzstärken zum Übergang
eher in die eine Richtung als in die andere dar. Einige skalare
Parameter umfassen das Verhältnis
einzelner zu allen Übergängen, Punkt
5, nicht-zufällige
Matrixtendenzen, Punkt 6, und die Tendenz, in die oberen SSM-Zustände überzugehen.
-
Das
Zustandssequenzmodell für
alle Zustandstypen weist allgemeine Parametrisierungen auf, darunter:
Sequenzlängen-Histogramm.
Verhältnis
der individuellen Sequenzzustände
zu allen besuchten Zuständen.
Anteil gefallender Zustände
an allen besuchten Zuständen.
Sequenzzustandsfokus. Maximale Sequenzlänge. Verhältnis der Sequenzübergänge zu allen
Einzelübergängen.
-
Klassifizierungsdimensionen
bezüglich
des Sprung-Verhaltens sind vorzugsweise wie folgt parametrisiert:
Tw/Ta-Histogramm, Δt/Ta, Histogramm für Programmteilzeiten zwischen
den Sprüngen. Δt, Histogramm von
Zeiten zwischen Sprüngen,
und ein Histogramm der Anzahl von Sprüngen pro Programm.
-
Schließlich benutzt
das System verschiedene programmbezogene Merkmaldimensionen. Diese
Dimensionen umfassen: Tw/trans, Sehzeit
pro Übergangshistogramm.
Tw/prog, Sehzeit pro Programmhistogramm.
Werbe-Tw/Ta, Histogramm
zur gesehenen Werbezeit pro verfügbare
Zeit. Tw/sitzung, Histogramm zur Sehzeit
pro Fernsehsitzung. Starttageszeit des gesehenen Programms. Histogramme
Tm/Ta, Tw/Ta, Tl/Ta. Und Anzahl individueller Zustände, die
pro Periode besucht wurden.
-
Eine
genaue Auflistung parametrisierter Dimensionen, die in der VGM benutzt
werden, brauchen nicht im Rahmen dieser Beschreibung bereitgestellt
zu werden. Fachleute auf dem entsprechenden Gebiet sind leicht dazu
in der Lage, die nötigen
Parameterdimensionen aufzustellen, einschließlich Variationen, Parametrisierungen,
und Extrapolationen.
-
Der
neuartige Algorithmus zum Berechnen der Tendenz bestimmt die qualitative
Beweislage für
einen nicht-gleichmäßig zufälligen Auswahlprozess;
und daher die Wahrscheinlichkeit bedeutsamer Verhaltensinformation.
Die erwartete Bin-Abdeckung einer gleichmäßig zufälligen Matrix wird mit Hilfe
der Binomialverteilung berechnet. Jede Nutzerhandlung wird als ein
Bestehen/Nichtbestehen-Vorgang betrachtet, um einen bestimmten Bin
zu füllen.
Die Anzahl der Versuche in den binomialen Experimenten, oder Zustandsübergängen, ist
die Anzahl der Übergänge in der
Matrix. Die Wahrscheinlichkeit eines Vorgangserfolgs, oder das Füllen eines
bestimmten Matrix-Bins, ist die gleichmäßig zufällige Wahrscheinlichkeit, dass
ein Bin ausgewählt
wird. Die binomiale Wahrscheinlichkeit, dass ein bestimmter Bin
nach einer bestimmten Anzahl von Versuchen gefüllt wird, ergibt die Anzahl
von Bins in der Matrix, von denen erwartet wird, dass sie durch
einen Zufallsprozess gefüllt werden.
So zeigt das Verhältnis
der Anzahl von Bins, die durch einen gleichmäßig zufälligen Prozess gefüllt würden, zu
der tatsächlichen
Anzahl gefüllter
Bins, einen tendenziellen, oder nicht-gleichmäßig zufälligen Prozess hinter der Zustandsübergangsauswahl.
Der Tendenzmesswert ist zusätzlich
ein quantitativer Indikator einer statistisch signifikanten Stichprobengröße. Wenn
nicht genug Stichproben in der Matrix vorliegen, um einen nicht-zufälligen SSM-Übergangsprozess
herzuleiten, ist der Tendenzmesswert weniger als oder gleich eins.
Verfahren des Stands der Technik verlangen im Allgemeinen n2 Stichproben in einer n mal n Matrix, um zu
bestimmen, ob erwartet wird, dass die Kovarianzmatrix statistisch
signifikant ist. Diese Anforderung ist nicht erfüllbar, wenn n größer wird.
Für eine
30 × 30
Matrix verlangen übliche
Verfahren 30 × 30,
oder 900 Stichproben, was in einem kurzen Zeitraum der Nutzer-TV-Nutzung
unmöglich
zu erzielen ist. Der Grund, warum der Stand der Technik diese Beschränkung aufweist,
ist, dass ausreichend Information benötigt wird, um Sicherheit für alle Kreuzkorrelationsausdrücke in der
Kovarianzmatrix zu erlangen, da es kein a-priori-Verfahren gibt, um
vorherzusagen, welcher signifikant ist, auch wenn die große Mehrheit
dieser Ausdrücke
null ist. Das vorliegende Verfahren zum Ermitteln einer Matrixtendenz
bestimmt die statistische Signifikanz fortlaufend, und läuft oft
in Stichproben des Umfangs n zusammen.
-
Es
folgt eine genaue Berechnungsbeschreibung des Verfahrens zur Tendenzschätzung, in
seiner Anwendung auf die Übergangsmatrix
Gefallende_Kanäle.
-
Die
Pseudocode-Funktionsdefinitionen umfassen:
sum(X) – summiert
die Spalten von Matrix X, wenn X eine Arraysumme ist, Elemente zu
einem skalaren Ergebnis
länge(X) – liefert
die größte Matrixdimensionslänge von
X
finde(X) – ergibt
alle Nicht-Null-Elemente von X
X(1:5,1:5) – ergibt eine Submatrix X', die aus Zeilen
1 bis 5 und Spalten 1 bis 5 von X aufgebaut ist
Y=binocdf(X,N,P)
ergibt die binomiale kumulative Verteilungsfunktion mit den Parametern
N und
P an den Werfen in X.
union(A,B) – wenn A
und B Vektoren sind, ergibt dies die kombinierten Werfe von A und
B, aber ohne Wiederholungen.
sqrt(X) – Quadratwurzel der Elemente
von X
sort(X) – ordnet
die Elemente von X in absteigender Reihenfolge.
-
Die
folgenden Regeln gelten für
gleichmäßig zufällige Matrixberechnungen:
- 1. gleichmäßige Wahrscheinlichkeit
des Übergangs
in einen bestimmten Zustand aus einem bestimmten Zustand:
Ptrans_zuf=
1/NUM_GEFALLENDE_KANAL_ZUSTÄNDE-1);
- 2. gleichmäßige Wahrscheinlichkeit,
einen möglichen Übergang
zu wählen
(ohne den Zustand Fernsehgerät
AUS zu zählen):
zustand
Prob= 1/sum(sum(GefallendKanalTransMtx(1:NUM_GEFALLENDE_KANAL_ZUSTÄNDE,2:NUM_GEF
ALLENDE_KANAL_ZUSTÄNDE)));
- 3. gleichmäßige Wahrscheinlichkeit,
eine Nutzersitzung in einem bestimmten Zustand zu beginnen oder
zu beenden:
PonAUSRand=1/(NUM_GEFALLENDE_KANAL_ZUSTÄNDE-1);
- 4. Tendenzvektor zum Beginnen in einem bestimmten Zustand (zustandAUStendenz ähnlich):
zustandEINtendenz=
(GefallendKanalTransMtx(SEHBEGINN,1:NUM_GEFALLENDE_KANAL_ZUSTÄNDE)/EIN_SITZ
UNGEN)/PonAusZuf;
- 5. Tendenz über
Zufall des Surfbeginns
ZuschrLchEinSurfTendenz(Zuschauer_idx)=
zustandEINtendenz(SURFEN);
- 6. Tendenz über
Zufall des Beginns in einem nicht gefallenden Zustand:
ViewrChanOnUnlikeBias(viewer_idx)=
stateONbias(UNLIKED)
-
Die
Berechnung der Matrixstichproben-Konzentrationstendenz folgt diesen
Regeln:
- 1. Tendenz als multipel über gleichmäßig zufällig für Nicht-Beginn-Endzustandsübergänge:
tendenz_mtx=(GefallendKanalTransMtx(2:NUM_GEFALLENDE_KANAL_ZUSTÄNDE, 2:NUM_GEFALLENDE_KANAL_ZUSTÄNDE)/Num_trans)/Ptrans_zuf;
- 2. Anzahl individueller Übergänge zwischen
Nicht-Beginn-Endzuständen,
die von dem Nutzer besucht werden:
numGefüllteBins=Länge(finde(tendenz_mtx(:)));
- 3. Anzahl individueller Übergänge zwischen
möglichen
Nicht-Beginn-Endzuständen:
numBins2Füll=länge(tendenz_mtx)^2;
- 4. Anteil möglicher
Bins, die tatsächlich
gefüllt
sind:
mtxFüllRatio=numGefüllteBins/numBins2Füll;
- 5. Binomiale Bin-Auswahlerwartung bezüglich der Anzahl von Stichproben
und gleichmäßig zufälligem Erfolgsverhältnis:
ExpAbdeckung=1-binocdf(minHitsPbin-1,Num_trans,1/numBins2Füll);
- 6. Tatsächlich
beobachtetes Bin-Füllerfolgsverhältnis:
AktAbdeckung=numGefüllteBins/numBins2Füll
- 7. ZuschrLchMtxSich(zuschauer_idx)=ExpAbdeckunglAktAbdeckung
-
Das
Matrix-Sicherheitsverhältnis
(MtxSich) zeigt die Wahrscheinlichkeit einer nicht zufälligen Prozesstendenz
an. So tendiert sie dazu, Sicherheit darüber zu geben, dass eine Stichprobengruppe
groß genug
ist, um herzuleiten, dass sie einen nicht-gleichmäßig zufälligen Ursprung
hat. Durch Erhöhen
der minimalen Trefferzahl oder Erfolgszahl pro Bin (minHitsPbin)
wird die Sicherheit einer adäquaten
minimalen Stichproben-Gruppengröße erhöht (üblicherweise
ist minHitsPbin=1 praktisch). Im Weibekategorie-Prototypbildungsprozess
folgt auf den VM-parametrisierten
Schritt die Interprototyp- oder lokale Verfeinerung. Dimensionen
mit hoher Varianz oder, ebenso, niedriger Tendenz werden entfernt.
Die repräsentativsten
Klassifizierungsmerkmale sind die, die eine enge Stichproben-Verteilung
aufweisen. Merkmale mit gleichmäßigeren
Verteilungsdaten nähern
sich einer gleichmäßig zufälligen Verteilung
an, und sind bei der Unterscheidung von Gruppen nicht so nützlich.
Eine typische Verfeinerungsabscheidung ist eine Standardabweichung
für auf
Gaußsche
Art und Weise modellierte skalare Merkmale (σcut),
und anderenfalls eine Tendenz (βcut) von weniger als oder gleich einer gleichmäßig zufälligen erwarteten
Stichprobenverteilung. Der Systemdesigner erzielt ein zunehmend striktes
Verfeinerungskriterium durch Senken von σcut und
Erhöhen
von βcut. Ein zu striktes Verfeinern führt dazu,
dass wertvolle Gruppenseparationsinformation verloren geht, und
könnte
zu einem leeren Prototyp führen, indem
alle Dimensionen entfernt werden. Ein zu lockerer Schwellenwert
führt zu
einem Verlust der Klassifizierungsleistung, indem zu viele nicht
prädiktive
Merkmale einbezogen werden. Das Produkt der Interprototyp-Verfeinerungsphase
ist ein vorläufiger
Werbekategorievorlagen-Prototyp. Die vorangegangenen Algorithmen
werden auf jede Trainingsgruppe angewandt, was für jede ein lokal verfeinertes,
möglicherweise
leeres Referenzprofil erzeugt.
-
Nach
der lokalen Prototypverfeinerung entfernt globales oder Intraprototyp-Verfeinern
weiter überflüssige Information.
Auf dieser Verfeinerungsstufe wird jeder Werbekategorie-Prototyp
mit jedem anderen verglichen, und Dimensionen, die keine der Gruppen
separieren, werden entfernt. Um Gruppendistanzen mit nichtskalaren,
nicht-Gaußschen
Dimensionen zu messen, ist jedoch ein neuartiges Verfahren notwendig.
Allerdings korreliert, oder bewahrt, das VM die Merkmalwerte für jede Beobachtung
nicht. Stattdessen halten alle Stichprobendaten-Dimensionen die beobachteten Merkmalwerte
in ihren jeweiligen Verteilungsmodellier-Histogrammen fest, wenn sie unabhängig von
Zeit und anderen Dimensionen auftreten. So ist es nicht möglich, Gruppen
als Stichprobenpunkte des VM in einem n-dimensionalen euklidischen
Raum zu definieren. Es ist wichtig, dass dieser übliche klassifizierende Gruppierungsansatz
exponentiell mehr Speicherplatz zum Speichern jedes Stichprobenpunktes
und seiner Übergangsgeschichte
im Merkmalraum erfordert. Stattdessen ist der vorliegende Merkmalraum
ein n-dimensionaler pseudo-euklidischer Aufbau, der absolute Distanzen
durch relative Korrelationen zwischen Gruppen ersetzt. Da die Stichprobenpunkte
in jedem Dimensionshistogramm keine dimensionsübergreifende Korrelation aufweisen,
weist keine Gruppe eine räumliche
Nachbarschaftsdarstellung auf. In hochdimensionalen Merkmalräumen ist
eine Gruppennachbarschaft vor allem dann nützlich, wenn eine Gaußsche Verteilung
der Stichproben vorliegt, da die varianzangepassten Gruppenmittel
benutzt werden, um Distanzen zu berechnen. Bei multimodalen Verteilungen
allerdings, d.h., nicht glockenförmigen, wie
es hier der Fall ist, bietet diese Darstellung wenige Vorteile,
da die euklidische Distanz nicht länger im üblichen Sinn zutrifft. Diskrete
Merkmalvariablen, wie z.B. Programmnamen, stellen im euklidischen Raum
eine zusätzliche
Komplikation dar, indem sie keine numerischen Entsprechungen der
Merkmaldimensionen sind, sondern Gruppentheoriedarstellungen. Um
die Beschränkung
des Stands der Technik zu überwinden,
bestimmt eine neue Distanzmetrik, ob eine ausreichende Klassifizierungsdistanz
zwischen zwei multimodalen Gruppen im Merkmalraum besteht. Die vorliegende
Klassifizierungsarchitektur ersetzt die Mahalanobis-Distanz, oder
die varianzangepasste euklidische Distanz, des Stands der Technik,
mit einer dimensionalen Stimmarchitektur, die die Gruppennachbarschaftsüberlagerung
als einen Prozentsatz von Dimensionen schätzt, die dafür stimmen,
dass die Überlagerung
existiert. Dies allein ist keine große Abweichung vom Stand der Technik,
allerdings ist die Metrik zur Bestimmung der Überlagerung zwischen nichtskalaren
und nicht-Gaußschen
verteilten Gruppen neuartig. Wieder liegen drei grundsätzliche
Datentypen vor, von denen jeder unterschiedlich behandelt wird;
das heißt,
skalar, Histogramm, und diskret, wie hier definiert. Skalare Merkmaldimensionen
werden in Gaußscher
Weise modelliert, und im Standardverfahren der μ, σcut-Nachbarschaftsunterscheidung
behandelt. Klassifizierungsdistanzen zwischen entsprechenden Histogramm-Merkmaldimensionen
werden allerdings als Verteilungskorrelationen berechnet.
-
Die
Pseudo-Korrelation der Verteilung ist als eins minus dem Verhältnis der
Distanz zwischen bestimmten Histogramm-Bins zu der Distanz des schlimmsten
Falls definiert. Dies simuliert das wünschenswerte Korrelationsverhalten
von:
- 1. Ausgabewerten zwischen 0 und 1
- 2. Ausgabe steigt (sinkt) linear, je (un)ähnlicher die Verteilungsformen
und -amplituden sind.
-
Der
folgende kommentierte prozedurale Pseudocode (in MatLag-Codierung)
bestimmt, ob zwei Histogramme in einer Merkmaldimension derselben
Klasse angehören
(als beispielhafte Werte sind beliebige Werfe angegeben):
- 1. Um die Distanz des schlimmsten Falls zu
ermitteln, wird jedes Histogramm-Bin als ein orthogonaler euklidischer
Merkmalvektor behandelt, und es wird die Distanz des schlimmsten
Falls zwischen diesen berechnet, indem alle Stichproben eines jeden
in unterschiedlichen Bins angeordnet werden.
schlechteste_diff(:)=0;
schlechteste_dift(1)=hist1_alle_stichproben;
schlechteste_diff(NUM_HIST_BINS)=hist2_alle_stichproben;
schlechteste_distanz=sqrf(schlechteste_diff·schlechteste_diff);
- 2. Berechnen der effektiven euklidischen Distanz zwischen den
zwei Histogrammen
hist2hist_diff=hist1 – hist2;
histDiff_sqr=hist2hist_diff·hist2hist_diff;
nutzer_dist=sqrt(sum(histDiff_sqr))/schlechteste_distanz;
- 3. Bestimmen der Wahrscheinlichkeitsdichtefunktionen (wdf) für jedes
Histogramm
hist1_pdf=hist1/hist1_alle_stichproben;
hist2_pdf=hist2/hist2_alle_stichproben;
- 4. Auffinden der Bins mit der höchsten Verteilungsdichte, und
Ordnen nach Dichte
[hist1_mass hist1_mass_bins]=sort(hist1_wdf);
[hist2_mass
hist2_mass_bins]=sort(hist2_wdf);
- 5. Für
hist1 und hist2 Auffinden der dichtesten Bins mit einer Standardabweichung
an Stichprobenpunkten
bin1_1sdv=NUM_HIST_BINS-min(find(cumsum(fliplr(hist1_mass))>68)) + 1;
bin2_1sdv=NUM_HIST_BINS-min(find(cumsum(fliplr(hist2_mass))>68)) + 1;
bins_1sdv=union([hist1_mass_bins(bin1_1sdv:NUM_HIST_BINS)],
[hist2_mass_bins(bin2_1sdv:NUM_HIST_BINS)]);
- 6. Modellieren der Varianz zwischen Histogrammen als die Variation
der Bin-zu-Bin-Distanzen. Bestimmen der mittleren Bin-zu-Bin-Distanz
zwischen 1 Sigma Bins in hist1 und hist2. Dies ist die geschätzte Distanzvariation
zwischen entsprechenden Stichprobenpunkten; je konsistenter die
Distanz zwischen Bins, desto sicherer ist die Separation zwischen
Histogrammen.
mittl_diff=mittl(hist2hist_diff(bins_1sdv));
abweichung=hist2hist_diff(bins_1sdv)-mittl_diff;
variant_dist=sqrt(mittl(abweichung·abweichung'))/schlechteste_distance;
- 7. Definieren der Histogrammkorrelation als das Verhältnis der
Bin-weisen euklidischen Distanz zu der Distanz des schlechtesten
Falls. Definieren der Histogrammkorrelation als das Verhältnis der
einen Bin-weisen euklidischen Distanz der Standardabweichung zu
der Distanz des schlechtesten Falls.
nutzer1sdvDist=sqrt(sum(histDiff_sqr(bins_1_sdv)))/schlechteste_distanz;
- 8. Dimensionenweises Berechnen von separierten Gruppen, wenn
die sigma-reduzierte Gruppendistanz positiv ist, für alle Dimensionstypen
KlasseKürzenDims(idx)=nutzer1sdvDist-varianz_dist;
%für idx
= 1 zu NUM_DIMS
-
Der
globale Dimensionen-Reduzierungsprozess entfernt eine Dimension,
wenn KlasseKürzenDims für eine jeweilige
Klassifizierungsdimension negativ für im Wesentlichen alle Werbeprototypen
ist, da dieses Merkmal weniger oder keinen prädiktiven Wert für das System
besitzt. Das Resultat dieser lokalen und globalen Prototypverfeinerung
ist eine minimale Beschreibung wichtiger Merkmalwerte, die jede
Werbekategorie identifizieren und separieren.
-
Die
VGM versorgt den Zielrichtungsserver (ZielServer – 6)
mit der optimierten Gruppe von Werbekategorieprototypen zum Herunterladen
auf den MitgliedAgenten im Fernsehgerät. Der letzte Schritt des Werbezielrichtungssystems
ist es, einen TV-Nutzer in seiner wahrscheinlichsten Werbekategorie
zu klassifizieren. Der MitgliedAgent wendet dann genau dieselbe
-
Gruppendistanz
auf das identische VM an, wie auf der Serverseite, unter Hinzufügung der
folgenden Klassifizierungsschritte:
- 1. Für alle Dimensionstypen,
Berechnen der separierten Gruppenzugehörigkeit, wenn die sigmareduzierte Gruppendistanz
positiv ist, dann Berechnen des Anteils separierender Dimensionen
KlasseKürzenDims(idx)=nutzer1sdvDist-variant_dist;
%für idx=1
zo NUM_DIMS
gutDimVek=finde(KlasseKürzenDims>0); %finde alle separierten Dimensionen
NUM_GUTE_DIMS=länge(gutDimVec);
gutDims(gutDimVec)=1;
%gute Dimensionen gutDims zunächst
auf 0 einstellen WerbeGruppeKlassifRatio=NUM GUTE_DIMS/NUM_DIMS;
- 2. Bestimmen der Bestehen/Nichtbestehen-Werbekategorie-Zugehörigkeit
für die
Systemmodulinformation KLASSE_STIMME_KÜRZEN=4; % Anteil der Dimensionen,
die richtig separiert sein müssen,
um die Gruppe als klassifiziert zu zählen
Bestimmen von separierten
Gruppen, wenn Anteil der Klassifizierungsstimme ist KLASSE_STIMME_KÜRZEN
wenn
WerbeGruppeKlassifRatio>KLASSE_STIMME_KÜRZEN
WerbeGruppeGruppierungStimme=1;
sonst
WerbeGruppeGruppierungStimme=0;
Ende
-
Jede
Werbekategoriegruppe weist eine WerbeGruppeKlassifRatio auf, die
der Anteil der Gesamtdimensionen ist, die adäquat separiert wurden. Es ist
ein proportionaler Messwert dessen, wie ähnlich Verhaltensgruppen sind.
Das heißt,
je (un)ähnlicher
das Verhalten eines Nutzers zu dem Werbekategorie-Prototyp ist,
desto mehr (weniger) Dimensionen überlagern sich, daher die höhere (niedrigere)
WerbeGruppeKlassifRatio. So weist jeder Werbekategorie-Prototyp
eine WerbeGruppeKlassifRatio, oder einen Zielrichtungswert, auf, der
darstellt, inwieweit ein Nutzer zu der Zielwerbegruppe gehört. Der
ZielServer stellt diese Information für jede Werbekategorie als eine
Verteilung von relativen Zugehörigkeitswahrscheinlichkeiten
bereit. Der ZielServer bestimmt zusätzlich einen Bestehen/Nichtbestehen-Wert
für die
Werbekategorie-Zugehörigkeit
für Systemmodule,
die eine binäre
Vorhersage benötigen.
WerbeGruppeGruppierungStimme ist ein binärer Zugehörigkeitswert, der gleich eins
ist, wenn ausreichend Dimensionen vorhanden waren, die den Nutzer
von dem betreffenden Werbekategorie-Prototyp separierten, und der
ansonsten null ist.
-
Der
MitgliedAgent berechnet regelmäßig oder
nach Bedarf die Wahrscheinlichkeiten der Werbekategorie-Zugehörigkeit
eines Nutzers zur Benutzung durch die Systemmodule. Der ZUSAgent
benutzt Werbekategorie-Zugehörigkeitsinformation,
um Inhalt zu speichern, der besser zu den Interessen eines Nutzers
oder zu den Vermarktungszielen eines werbenden Kunden passt. Gemäß einer
Ausführungsform
speichert und löscht
der ZUSAgent Programme, um den gesamten Zielwert des archivierten
Inhalts statistisch zu maximieren.
-
Als
ein einfaches Beispiel soll der Fall betrachtet werden, wobei der
ZielServer drei Vorlagen an den MitgliedAgenten bereitstellt – Männlich,
Weiblich und Teenager, und die Zugehörigkeitszielwerte der TV-Nutzer als
0,2, 0,8 und 0,4 berechnet. Dann speichert der ZUSAgent nur Werbung
mit Metadaten, die zu diesen Kategorien passen, und proportional
zu den Zielwerten. Wenn die Zielwerte auf eins summierend normiert
werden, könnten
sie als die Wahrscheinlichkeiten von Männlich = 0,14, Weiblich = 0,29,
und Teenager = 0,57 gelesen werden. Daher würde der ZUSAgent Werbung speichern
und löschen,
um dieselbe anteilmäßige Verteilung
im lokalen Speicher zu erreichen, und würde gespeicherte Werbung aufweisen,
von der 14 % für
Männer, 29
% für Frauen,
und 57 % für
Teenager wäre.
Der VertAgent verteilt Werbepräsentationen ähnlich,
um eine Anpassung an Werbekategorie-Zugehörigkeitsverteilungen zu erreichen.
Eine breite Spanne von alternativen und weiter verfeinerten Optimierungsstrategien
zur zielgerichteten Ausrichtung sind möglich, die dieser Philosophie
entsprechen oder von ihr ausgehen.
-
Es
versteht sich, dass das Herleiten einer Werbekategorie anhand des
TV-Nutzungsverhaltens dem Identifizieren mehrerer Personen in einem
Haushalt sehr ähnlich
ist. Der Hauptunterschied ist der, dass die Nutzerprototypen mit
unmarkierten Realzeit-TV-Klickablauf-Daten wahrscheinlichkeitstheoretisch
hergeleitet werden. Dieselbe Methodologie und Architektur gilt für beide
Probleme; allerdings verlangt das Problem der Identifikation mehrerer
Nutzer zusätzliche
Verfahren, um TV-Nutzungsbeobachtungen auf effektive Weise dem korrekten
Nutzerprofil zuzuordnen.
-
Zusätzlich,
oder als eine Alternative zu der vorangegangenen Beschreibung des
Systems zur engen Eingrenzung von Werbezielen, ist das System der
Erfindung auch geeignet, um bevorzugte Programmgestaltungsmodelle
zu erstellen. Hier interagiert der Präsentationsagent PräsAgent mit
dem Verhaltensmodell VM, um lokale Programmführer zu erstellen. Der PräsAgent ermittelt
Nutzerpräsentationspräferenzen
durch Anfragen an den VMA-Agenten. Um diese Notwendigkeit zu motivieren,
geht den Interaktionsdetails der VMA-Maschine mit dem PräsAgenten
eine gekürzte
Zusammenfassung auf Systemebene voraus. Kurz gesagt ist es das Ziel
des PräsAgenten,
einen Programmführer
für einen
virtuellen Kanal zu erstellen, dessen Programmgestaltung aus Programmen
stammt, die lokal von dem ZUSAgenten gespeichert sind. Die Programmgestaltung
kann Unterhaltung oder Werbung, Audio, Video, Graphiken, oder jeder Multimedia-Inhalt
sein. Der ZUSAgent speichert nur die am stärksten bevorzugten verfügbaren Programme,
und fügt
ständig
Programme hinzu oder löscht
diese, um den lokalen Speicher zu füllen, während dabei die Nutzerprogrammpräferenz-Gesamtwertung
maximiert wird. Dieser virtuelle Programmführer oder virtuelle Kanal kann
dasselbe Erscheinungsbild aufweisen und denselben Eindruck erwecken
wie ein normaler TV-Kanal. Es sollte sehr natürlich wirken, ihn als nur eine
weitere Leitung in einen Live-TV-Programmführer einzufügen. Allerdings weist der virtuelle
Kanal den Vorteil auf, dass er an die Präferenzen des Nutzers angepasst
ist und als Kanal „auf
Abruf" erscheint,
mit Inhalten und Sendezeiten, die den persönlichen Erwartungen des Zuschauers
im Wesentlichen entsprechen. Um dieses Ziel zu erreichen, analysiert
der PräsAgent
die Metadaten der gespeicherten Programmpräsentation und die Nutzerpräferenzen,
um die optimale zeitliche Programmanordnung in dem EPG des virtuellen
Kanals (VEPG) zu bestimmen.
-
Die
Metadaten zur Zielrichtung des Programms enthalten, insbesondere
für Werbung,
Präsentationsinformation.
Werbepräsentationsmetadaten
von dem Kopfende weisen den PräsAgenten
an, entweder diesen Regeln genau zu folgen, oder lokale Präferenzinformation
zu benutzen, um den Werbeinhalt auf intelligentere Weise zu sequenzieren.
-
Für gespeicherte
Programme, die keine Einnahmen erzeugen, hat der Nutzer eine ähnliche
Option, die Programmanordnung des virtuellen Kanals vorzugeben.
Mehrere VEPG-Aufbaumodelle sind möglich, angefangen von trivialen
bis zu hoch kontextabhängigen.
-
Eine
triviale Implementierung zeigt einfach die lokalen Speicherinhalte
in der Reihenfolge an, in der sie aufgezeichnet wurden, und ordnet
Zahlungsprogramminhalte genau wie von ihren Präsentationsmetadaten angegeben
an. Dies hat den Vorteil der Einfachheit, belastet den Nutzer jedoch
mit dem Durchsuchen vieler unerwünschter
Programme, und neigt dazu, bei jedem gesehenen Programm ein Herumspringen
im Führer zu
erzwingen. Dies ist einen Schritt höher als analoge Videoaufzeichnungen,
indem beliebiger Zugriff und eine Inhaltsauflistung vorliegen.
-
Ein
weiter verfeinerter Ansatz nutzt nicht-zeitliche Programmpräferenz-Information,
um Programme mit ähnlicher
Wertung zu gruppieren. Sofern die Präferenzwertungen genau sind,
weist dieses Verfahren den Vorteil auf, dass es für den Nutzer
leichter ist, weniger gefallende Programme zu überspringen, und unter wesentlich
geringerem Suchaufwand stets gefallende Programme zu sehen. Allerdings
herrscht immer noch der Eindruck einer sortierten Auflistung gespeicherter
Medieninhalte vor.
-
Eine
signifikante Verbesserung gegenüber
dem Sortierverfahren von Inhaltspräferenzen nutzt zeitliche und
sequenzielle Präferenzen,
um ein VEPG zu erzeugen, das gemäß dem Realzeit-Sehkontext und der Präferenzgeschichte
des Nutzers geordnet ist. Um dies zu erreichen, stellt der PräsAgent,
wenn der Nutzer den Fernseher einschaltet, oder regelmäßig bevor
der Fernseher eingeschaltet wird, eine Anfrage an die VMA-Maschine
mit jedem gespeicherten Programmpräsentationskontext, und erstellt
dynamisch einen VEPG, der am besten zu den Verhaltenspräferenzen
des Nutzers zum jeweiligen Zeitpunkt unter den jeweiligen Bedingungen
passt.
-
Die
folgenden allgemeinen algorithmischen Schritte erstellen einen VEPG
für einen
typischen Fall:
- 1. Finde alle unerwünschten
Sehzeiten, und lasse diese leer.
- 2. Ordne die höchstwahrscheinlich
bevorzugten Programme beim Einschalten in dem aktuellen Zeitfenster an.
- 3. Finde alle lokalen Programmübergangskombinationen und zeitliche
Präferenz
und sequenziere die Programme entsprechend.
-
Als
ein einführendes
Beispiel kann angenommen werden, dass die folgenden 9 als bevorzugt
angenommenen Programme lokal gespeichert sind:
-
Während das
Fernsehgerät
ausgeschaltet ist, oder bei seinem Einschalten, bestimmt der PräsAgent den
Kontext der aktuellen Sitzung. Der aktuelle Kontext enthält Information
wie z.B. Wochentag, Tageszeit, Zeit seit letzter Sitzung, und letzter
Titel/Genre/Kanal.
-
Die
ersten zu bestimmenden Punkte sind die Zeitintervalle ohne Fernsehen.
Diese löschen
die VEPG-Zeitintervalle, während
derer historisch betrachtet meist nicht ferngesehen wird. Die Anfrage
sieht folgendermaßen
aus:
,AnfrageFunktion = Zeit_Summe, ZustandTyp = GefallendeKanäle, vonZustandID
= null, zuZustandID null, ZeitTyp = TZ, ZeitWert = null".
-
Hier
wird GefallendeKanäle
als Aktivitätsindikator
für TZ
benutzt. Jede andere „gefallende" Zustandskategorie
wäre ebenso
geeignet.
-
Eine
typische Antwort auf die Anfrage des ZUSAgenten könnte lauten:
[(SPÄT_ABENDS,
SEHR_OFT); (NACHTS, NIE); (FRÜH_MORGENS;
NIE); (MORGENS, MEISTENS); (VORMITTAGS; SELTEN); (NACHMITTAGS; SELTEN);
(SPÄTNACHMITTAGS;
MANCHMAL); (ABENDS; FAST_IMMER); (NACHTS, NORMALERWEISE)]
-
Der
ZUSAgent durchsucht die Resultatsmatrix nach den am wenigsten wahrscheinlichen
TZ-Intervallen,
insbesondere
[(NACHTS, NIE),); (FRÜH_MORGENS; NIE), (VORMITTAGS;
SELTEN); (NACHMITTAGS; SELTEN)].
-
Die
entsprechenden Zeitintervalle würden
in der VEPG leer gelassen. Wenn allerdings die aktuelle Fernsehperiode
ein leer gelassener Intervall ist, werden die aktuellen VEPG-Zeitintervalle wenigstens
für die übliche TV-Sitzungslänge des
Nutzers verfügbar
gemacht. Das heißt,
beim Einschalten des Fernsehgeräts
ist immer Programminhalt in dem aktuellen VEPG-Zeitindex aufgelistet, und wenigstens
so lang, wie der Nutzer normalerweise für diese Periode fernsieht.
-
Die
verfügbaren
Zeitintervalle werden nach bevorzugter Programmanordnung durchsucht.
-
Der
PräsAgent
fährt fort,
nach Programmen zu suchen, die der Nutzer bevorzugt, wenn er die
TV-Sitzung startet. Jedes Programm wird nach der Startreferenz für Kanal/Genre/Titel/Schauspieler
usw. durchsucht. Jeder modellierte Verhaltenszustand (d.h. gefallender
Kanal, gefallendes Genre, gefallender Titel usw.) wird abgefragt,
und die Ergebnisse werden in einer Sfarfwerfungsmatrix akkumuliert.
Eine typische Anfrage zur Suche nach Start-Genrepräferenz ist:
Anfrage( [AnfrageFunktion
= obere_n=5, ZustandTyp = Genre, vonZustandID=aus, zuZustandID=null,
ZeitTyp = TZ, ZeitWert = Nachts)].
-
Derselbe
Anfragestil wird für
jeden Zustandstyp wiederholt, und die Ergebnisse werden mit den
verfügbaren
Programmen abgeglichen.
-
Der
PräsAgent
berücksichtigt
ferner kontextabhängige
Präferenzen
hinsichtlich des zuletzt gesehenen Programms, indem er jede Kombination
von zeitlichen und ZustandTyp-Übergängen durchsucht.
Angenommen, dass für
die Sitzung WT = Montag, TZ = Nacht (22.00), letzter_Titel = „Glücksrad"@Montag abends 19.00,
letztes_Genre = Spielshow, und letzter_Kanal = NBC ist.
-
Eine
typische Anfrage umfasst eine Suche nach wahrscheinlichen Übergängen, die
in der Zeit seit dem letzten gesehenen Titel, Genre, und Kanal auftraten,
in diesem Beispiel drei Stunden (22.00-19.00). Eine Suche der 3
am stärksten
bevorzugten Titelübergänge drei
Stunden nach dem Sehen von „Glücksrad" ist:
Anfrage:
[AnfrageFunktion = obere_n=3, ZustandTyp = Titel, vonZustandID=Glücksrad,
zuZustandID=null, ZeitTyp = TIP, ZeitWert = 3std]
-
Eine ähnliche
Suche wird für
Genre und Kanal wiederholt.
-
Der
PräsAgent
vergleicht die Tendenz aller Startwertungen und der letzten programmbasierten
Präferenzen
mit dem übrigen
Programm hinsichtlich der besten Zuordnung. Wenn in diesem Beispiel
ein wahrscheinliches Startgenre „Komödie Serie" war, und der wahrscheinlichste Startkanal „NBC", würde ein
passendes Programm mit der höchsten
Präferenzwertung,
z.B. Seinfeld, als das Programm in dem aktuellen Zeitfenster angeordnet,
wenn kein anderer Übergang
drei Stunden nach dem Sehen von „Glücksrad", Spielshow, oder NBC bevorzugt wird.
-
Das
System führt
eine Tabelle mit Sitzungszeiten für jeden Zeitintervall, an jedem
Tag der Woche. Wenn eine typische Sitzung für diesen Nutzer zu diesem Zeitpunkt
1,5 Stunden beträgt,
dann ist dies der zu füllende
Zeitblock. Der PräsAgent
prüft jedes
gespeicherte Programm auf Übergangstendenzen
zum Folgen auf Seinfeld. Wieder werden alle gefallenden Zustandstypen
nach dem wahrscheinlichsten Übergang
von dem Zustand durchsucht, der Seinfeld zugeordnet ist. Eine typische
erste Anfrage der Übergangsgesamtpräferenz-Suche
könnte
lauten:
[AnfrageFunktion = höchstwahrscheinlich, ZustandTyp
= Titel, vonZustandID="Seinfeld", zuZustandID=null, ZeitTyp
= TZ, ZeitWert = nachts]
-
Der
PräsAgent
findet die passendste Zuordnung und ordnet sie nach Seinfeld an.
Der Nutzer kann z.B. am stärksten
bevorzugen, nach einer kurzen Komödie zeitunabhängig eine
wissenschaftliche Dokumentation zu sehen, so dass NOVA folgen sollte.
Nachdem zwei Programme verbunden sind, fragt der PräsAgent auch nach
etwaigen Zustandssequenzpräferenzen;
d.h. Titel, Genre, Kanal usw. Für
die Beispielsequenz ist die Ausgangsanfrage:
„AnfrageFunktion
= höchstwahrscheinlich,
ZustandTyp = TitelSequ, vonZustandIDs = ["Seinfeld", „NOVA"], LängenWert
= null"
„AnfrageFunktion
= höchstwahrscheinlich,
ZustandTyp = GenreSequ, vonZustandIDs = ["serie:komödie", „serie:wissenschaft"], LängenWert
= null"
-
Der
PräsAgent
fügt das
wahrscheinlichste und spezifischste Resultat an die vorherige Sequenz.
Dieser Prozess setzt sich für
jedes Programm am Ende der wachsenden Sequenz fort, bis der Zeitblock
der üblichen
Sitzungszeit gefüllt
ist. Der PräsAgent
geht dazu über,
alle anderen verfügbaren
VEPG-Zeitblöcke
zu füllen.
Jeder Zeitblock beginnt mit einem Sequenzsamen, von dem das Wachstum
ausgeht.
-
Der
PräsAgent
prüft jedes
verbleibende Programm für
alle verfügbaren
Zeitfenster, und ordnet hoch wahrscheinliche zeitliche (nicht-zeitliche,
WT, TD, TIP) Zuordnungen entsprechend an. Beispielsweise könnte eine
typische Anfrage zum Prüfen
der Anordnungspräferenz
des Programms „Football" an einem verfügbaren Sonntagszeitfenster
starten:
Anfrage: [AnfrageFunktion = höchstwahrscheinlich, ZustandTyp
= gefallendesGenre, vonZustandID="Sport", zuZustandID=null, ZeitTyp = WT, ZeitWert
= Sonntag]
und
Anfrage: [AnfrageFunktion = höchstwahrscheinlich,
ZustandTyp = gefallendesGenre, vonZustandID="Sport", zuZustandID=null, ZeitTyp = TZ, ZeitWert
= Nachmittags]
-
Wenn
das Sehen von Sport am Sonntagnachmittag wahrscheinlicher ist als
jedes andere Programm und jede andere alternative zeitliche Anordnung,
würde Football
diesen Zeitblock beginnen, und das hier beschriebene Sequenzaufbauverfahren
würde den
verbleibenden Sitzungsblock füllen.
-
Der
erste Teil des VEPG-Anordnungsalgorithmus befasst sich nur mit stark
bevorzugten Programmen in jedem Kontext. Wenn Programme für den VEPG-Eintrag übrig bleiben,
ordnen nachfolgende Wiederholungen die wahrscheinlichsten Programme
an. Wenn keine ausreichende historische Beweislage zur Herleitung vorliegt,
nimmt der PräsAgent
als letztes Mittel beliebige Anordnungen vor.
-
Es
ist wichtig, dass der PräsAgent
jedes Mal, wenn ein Zuschauer den Fernseher einschaltet, oder ein neuer
Nutzer ermittelt wird, einen potentiell unterschiedlichen VEPG erzeugt,
der auf die Präferenzen
des Nutzers zugeschnitten ist, und auf den Kontext dieser Sitzung.
Mehrere andere Verfeinerungen, Optimierungen und Erweiterungen des
grundlegenden VEPG-Aufbauverfahrens sind möglich und vorgesehen. Einige
hier beschriebene zusätzliche
kontextabhängige
Auflösungsverfahren
erweitern den genannten Algorithmus. Die VMA-Maschine versorgt den
PräsAgenten
mit vielen anderen kontextabhängigen
und Verhaltenstendenz-Anfragen. Einige umfassen:
- 1.
Zuletzt gesehenes Programm
- 2. Verhaltenspsychometrie
- 3. Aufmerksamkeitsspanne
- 4. Beendigungsneigung
-
Diese
Messwerte führen
zu folgenden sequenziellen Programm-Anordnungspräferenzen.
-
Punkt
1 ist ein Verfahren zum erneuten Berechnen künftiger VEPG-Einträge, basierend
auf dem zuletzt von dem Nutzer gesehenen Programm. Ähnlich wie
beim Bestimmen der Start-Programmpräferenzen,
die hier erläutert
wurden, stellt der PräsAgent
eine Anfrage für
alle zeitlichen und ZusfandTyp-Übergangspräferenzen
von den Programmen, die der Nutzer gewählt hat. Der VEPG wird umgestellt,
wie zuvor beschrieben, mit den wahrscheinlichsten passenden Programmen
des Anfrageergebnisses als neuem Samen.
-
Der
PräsAgent
benutzt Psychometrik, Punkt 2, wie z.B. Diversität, Neugier, Fokus, und Aufmerksamkeitsspanne,
um die Programmsequenzierung näher
an die Präferenzen
des Zuschauers anzupassen. Wenn der Nutzer z.B. sehr hohe (niedrige)
Messwerte für
Genrediversität
oder Fokus aufweist, vermeidet (bevorzugt) der PräsAgent proportional
Sequenzen, die dasselbe Genre wiederholen. Ebenso lässt ein
hoher (niedriger) Neugiermesswert den PräsAgenten proportional verwandte,
aber weniger häufig
besuchte Sequenzkandidaten vorziehen (vermeiden). Ein hoher (niedriger)
Neugiermesswert kann bei einem Nutzer entstehen, der eine niedrige
(hohe) Aufmerksamkeitsspanne aufweist, und der oft erfolglos (erfolgreich)
beim Auffinden gefallender Programme ist. Eine andere Möglichkeit
ist, dass der Nutzer eine kleine Kerngruppe gefallender Programmtypen
aufweist, aber oft außerhalb dieser
Gruppe nach neuen interessanten Programmen sucht. Der Neugiermesswert
sucht so nach der Tendenz eines Nutzers, außerhalb zuvor gefallener Typen
zu suchen, ohne viel Information zu den Gründen hierfür.
-
Aufmerksamkeitsspanne,
Punkt 3, ermittelt die Menge und die Qualität der Zeit, die ein Nutzer
normalerweise auf verschiedene Programmaspekte verwendet. Ein Histogramm
modelliert die Aufmerksamkeitsverteilung für jeden modellierten Parameter.
Verfolgte Parameter umfassen jeden EPG-Kategorieeintrag, wie z.B. Genretyp,
einen Titel, einen Kanal, oder Fernsehstatistiken einschließlich Sitzungszeiten.
Alle Parameter der Aufmerksamkeitsspanne sind kontextsensibel, wie
durch das VM unterstützt.
Der PräsAgent
benutzt die Aufmerksamkeitsspanne, um die Programmlänge zu bestimmen,
die in einem gegebenen Kontext von dem Zuschauer am meisten bevorzugt
wird. Beispielsweise kann ein Nutzer allgemein einen langen dramatischen Film
mögen,
jedoch nicht morgens, bevor er zur Arbeit geht, oder nach einer
Spielshow, sondern bevorzugt ihn an Abenden am Wochenende. Dieses
Präsentationsfilter
vermeidet viele der offensichtlichen Präferenzkonflikte der Nutzer-Programmlänge, indem
vergangene Sehzeiten in einem gegebenen Kontext als eine Tendenz
benutzt werden, um zukünftige
Programme ähnlicher
Länge vorzuziehen.
-
Sobald
eine Fernsehsitzung, oder eine VEPG-Programmsequenz sich der typischen
Fernseh-Aufmerksamkeitsspanne
dieses Kontextes nähert,
weist der PräsAgent
eine Präferenz
auf, ein Programm anzuordnen, das am besten zu der Beendigungstendenz-Geschichte
des Nutzers passt.
-
Die
Beendigungstendenz, Punkt 4, ist die vergangene Tendenz, eine Fernsehsitzung
zu beenden, nachdem eine bestimmte VM-Kategorie gesehen wurde. Ein
Beispiel dafür,
wie der PräsAgent
eine neue Beendigungstendenz von der Programmwiedergabe-Auswahl
lernt, ist, wenn ein Nutzer, nachdem Late-Night-Talkshows wiedergegeben
wurden, wie z.B. die „Tonight
Show" während der
Woche am späten
Abend aufhört,
fernzusehen, und nicht nachts. Der PräsAgent lernt sowohl von Live-Programmen
als auch von wiedergegebenen Programmen. Die Fähigkeit, bevorzugte Wiedergabemuster
zu erlernen, erlaubt es dem PräsAgenten,
Programme adaptiv in dem am stärksten
bevorzugten VEPG-Kontext anzuordnen. Eine typische TZ- Beendigungsneigung-VMA-Agentenanfrage
für jeden
ZustandTyp, z.B. für
Talkshows, erscheint wie folgt:
Anfrage: [AnfrageFunktion =
höchstwahrscheinlich,
ZustandTyp = gefallendesGenre, vonZustandID=null, zuZustandID=Serie/Talk,
ZeitTyp = TZ, ZeitWert = später_abend].
-
Der
PräsAgent,
der eine ähnliche
Aufgabe hat wie die PBMA, erzeugt einen Programmführer, der
dazu neigt, die tägliche
Variation und Neuartigkeit anzupassen, die ein Nutzer bevorzugt.
-
Der
PräsAgent
ordnet VEPG-Werbung in einer ähnlichen
Art und Weise an wie nicht-gezahlte Programme, nur dass Anordnungsentscheidungen
Präsentationsmetadaten
und maschinengesteuerte erlernte Nutzer-Zielinformation enthält. Werbung
unterscheidet sich von Programmen in anderer entscheidender Hinsicht,
indem ihre anfängliche
VEPG-Anordnung nur eine voreingestellte Initialisierung ist, die
verändert
werden kann, abhängig
von der Programmauswahl des Nutzers, und der Rechte des Werbeunternehmens,
wie sie über
Steuerungsmetadaten übermittelt
werden. Obwohl als eine alternative Ausführungsform vorgesehen, ist es
ebenso möglich,
die VEPG-Programmgestaltung ständig
neu aufzubauen, basierend auf dem laufenden Sehverhalten des Nutzers;
allerdings gilt der Hauptvorteil auf die Zeitplanung für Werbung.
Die Werbung ist nicht notwendigerweise in dem VEPG sichtbar, sondern
ist als Werbepause zwischen den Programmen oder während des
Programms vorgesehen. Die Pausen werden entweder am Kopfende (während des
Programms) oder intern (zwischen den Programmen) erzeugt.
-
Der
PräsAgent
ist sich durch Programm-Metadaten oder andere Mittel im Voraus über die
genaue Zeitplanung für
Werbepausen im Programm im Klaren. In der vorliegenden Ausführungsform
füllt der
PräsAgent alle
Werbepausen mit optimal ausgewählten
vorgespeicherten Werbesendungen vor. In der Praxis weist dieses
Verfahren einen wesentlichen Vorteil auf. Oft gibt es, aufgrund
begrenzter Systemressourcen des Fernsehgeräts, nicht ausreichend Zeit,
die beste Werbezeitplanung für
eine Werbepause, die möglicherweise
in nur wenigen Minuten stattfindet, in Realzeit zu berechnen. Diese
Situation tritt normalerweise zu Beginn eines Programms auf, oder
wenn eine Person kurz vor der geplanten Werbepause zuschaltet. In
diesem Fall ist die voreingestellte PräsAgent-Sequenzierung der Werbung
eine beste Schätzung
der optimalen Anordnung. Wenn sausreichend Zeit für Berechnungen
ist, kann der PräsAgent
die VMA-Maschine nach Nutzer-Werbesequenzierungs-Präferenzen
befragen.
-
Das
Verfahren zum Sequenzieren der Werbung ist dasselbe wie das für die Programmgestaltung,
mit den folgenden werbungsspezifischen Definitionen:
- 1. Titel ist der UPC des Produkts oder der Name des Werbesponsors
- 2. Genre ist die Haupt-SIC des Sponsorunternehmens
- 3. Die Semaphore Werbung_null ersetzt null als Anfragejoker,
um nur Werbung zu durchsuchen.
-
Mehrere
beispielhafte Anfragen folgen, die eine Spanne von kontextabhängigen Anordnungsmöglichkeiten
zur Werbungssequenzierung demonstrieren.
-
Beispiel A:
-
Finde
die drei oberen Produkte (UPC), die nachts während Seinfeld gefallen haben:
Anfrage:
[AnfrageFunktion = obere_n=3, ZustandTyp = Titel, vonZustandID=Werbung_null,
zuZustandlD="Seinfeld", ZeitTyp = TZ, ZeitWert
= nachts]
-
Beispiel B:
-
Finde
die 5 oberen Programme, die Sonntag nach der Pepsi-Werbung gefallen
haben:
Anfrage: [AnfrageFunktion = obere_n=5, ZustandTyp =
Titel, vonZustandID=Pepsi_UPC, zuZustandID=null, ZeitTyp = WT, ZeitWert
= Sonntag]
-
Beispiel C:
-
Finde
das am meisten gefallende Genre zu jedem Zeitpunkt vor einer Fahrzeugteil-Werbung:
Anfrage:
[AnfrageFunktion = höchstwahrscheinlich,
ZustandTyp = GefallendesGenre, vonZustandID=null, zuZustandID=Fahrzeugteile_SKU,
ZeitTyp = nichtzeitlich, ZeitWert = null]
-
Beispiel D:
-
Von
den dem Nutzer gefallenden Werbeprogrammen, finde die oberen 3 Werbeproduktkategorien während einer
Sportsendung an Sonntagen:
Anfrage: [AnfrageFunktion = obere_n=3,
ZustandTyp = GefallendesGenre, vonZustandID=sport, zuZustandID=Werbung_null,
ZeitTyp = WT, ZeitWert = Sonntag]
-
Indem
so der allgemeine Hintergrund beschrieben wurde, vor dem ein virtueller
Kanal und/oder ein virtueller elektronischer Programmführer VEPG
erstellt werden kann, gehen wir über
zu einer spezifischen Implementierung eines beispielhaften VEPG.
Der PräsAgent
erstellt einen voreingestellten VEPG, kurz bevor der Nutzer den
Fernseher einschaltet, oder beim Einschalten, der den zeitlichen,
sequenzierten, und Programmpräferenzen
des Nutzers am besten entspricht, bevor eine neue Nutzereingabe
tatsächlicher
Auswahl empfangen wird. Der PräsAgent
hat die Option, und die Fähigkeit,
falls die Zeit dies zulässt,
basierend auf den Inhaltsauswahlmustern des Kunden den voreingestellten
VEPG in Realzeit wieder zu erstellen. Die Kombination einer voreingestellten
Inhaltsanordnung aufgrund „fundierter
Vermutung", und
einer Neuberechnung, die Realzeit-kontextabhängig ist, stellt eine robuste,
und optimale Einschätzung
der Nutzerpräferenz
bereit.
-
Ein
typischer grober VEPG, der von dem PräsAgent aus der Beispielgruppe
gespeicherter Programme erzeugt wird, erscheint wie folgt:
-
Diese
Programmanordnung könnte
sich aus dem folgenden Szenario systemermittelter, nutzerkontextabhängiger Präferenzen
ergeben. Das Programm „The
Terminator" erfordert
eine lange Aufmerksamkeitsspanne, und obwohl Nächte an Wochentagen genauso
wie Samstagnacht qualifiziert sind, tritt das Gefallen von Filmen
im Wesentlichen im letztgenannten Zeitfenster auf. Angenommen, der
Nutzer weist eine starke allgemeine Präferenz zum Sehen von CNBC auf,
und von Finanzprogrammen während
des späten
Nachmittags an Wochentagen, nachdem er von der Arbeit nach Hause
gekommen ist. Der PräsAgent
kann außerdem
ermitteln, dass, nachdem der ZUSAgent „Market Wrap" einige Male aufgezeichnet
hatte, der Nutzer dies während
dieser Zeitperiode gesehen hat, und ordnet es entsprechend an. Wenn
der PräsAgent
allerdings eine stärkere
Tendenz ermittelt, den „NFL
Football" von Montagabend
z.B. stattdessen am Spätnachmittag
dienstags zu sehen, wobei niemals Finanzprogramme gesehen werden,
nimmt das Football-Spiel das letztere, stärker bevorzugte Zeitfenster
ein. Der Nutzer kann ebenso eine Präferenz für „Saturday Night Live" zeigen, jedoch an
Sonntagabenden. Ein wiederholbares Muster könnte üblicherweise eine Nacht-Sitzung
wochentags mit „Seinfeld" beginnen, wobei
eine starke Tendenz besteht, danach „The Tonight Show" zu sehen und damit die
Sitzung zu beenden.
-
Wenn
der PräsAgent
eine niedrige (hohe) Zustandsdiversität für einen zeitlichen Kontext
ermittelt, wie z.B. ein tägliches
Zeitfenster, zieht er es vor, die Abwechslung der Programme in dieser
Periode zu senken (erhöhen).
Der Nutzer weist im vorliegenden Beispiel einen niedrigen Diversitätsmesswert
für die
Blöcke
spätnachmittags
und nachts auf, jedoch viel höhere
Messwerte während
der Periode abends. In Abwesenheit von einer sequenziellen oder
zeitlichen Tendenz kann der PräsAgent
Diversität,
oder Neugierinformation, benutzen, um bevorzugte Programme angemessener
zu verteilen. In diesem Fall bemerkt der PräsAgent, dass das Zeitfenster
abends beliebt ist, und dass der Nutzer eine ähnliche Präferenz für Science Fiction, Komödien, und Filme
aufweist. Wenn allerdings die Diversitätsmesswerte des Nutzers während dieser
Periode höher
sind, wird der PräsAgent
vermeiden, das tägliche
Zeitfenster nur mit den am stärksten
bevorzugten täglichen
Programmtypen, z.B. „Star
Trek" zu füllen, und
wird stattdessen die verfügbaren
Zeitfenster mit verschiedenen kurzen, gefallenden Programmen verteilen.
Wenn „NOVA" in der Vergangenheit
eine „wenig
gefallend"-Wertung
aufwies, würde
eine hohe Neugierwertung in den abends-Zeitfenster den PräsAgent dazu
motivieren, „NOVA" in die Aufreihung
einzubringen. Es ist wichtig, dass der Nutzer einen VEPG findet,
der seine „Hochzeit" nachts (21 bis 24
Uhr) und nicht, wie traditionell üblich, von 20 bis 22 Uhr widerspiegelt,
und der ein Sehmuster widerspiegelt, das die sich stark wiederholenden
Verhaltensweisen widerspiegelt, einschließlich der auftretenden regelmäßigen Ausnahmen,
und der seine stärker
forschenden Perioden, so diese existieren, mit dem Programmangebot
füllt,
das er mögen
könnte.
-
Im
Laufe der Zeit ermittelt das System sich stark wiederholende Präferenzmuster,
sowie wichtige Ausnahmen. Die Auswahl und das Lernen von gespeicherten
Programmnutzungsmustern lehrt das System fortwährend, wann und in welcher
Sequenz Programmkategorien bevorzugt werden. Eine parallele Beschreibung gilt
für die
optimale Anordnung von Werbung.