NL2016943A - Collect method for a user-oriented audience measurement, of hits transmitted to a node for site-targeted audience measurement, using hitregistraties created by the node. - Google Patents
Collect method for a user-oriented audience measurement, of hits transmitted to a node for site-targeted audience measurement, using hitregistraties created by the node. Download PDFInfo
- Publication number
- NL2016943A NL2016943A NL2016943A NL2016943A NL2016943A NL 2016943 A NL2016943 A NL 2016943A NL 2016943 A NL2016943 A NL 2016943A NL 2016943 A NL2016943 A NL 2016943A NL 2016943 A NL2016943 A NL 2016943A
- Authority
- NL
- Netherlands
- Prior art keywords
- terminal
- hit
- given
- session
- registrations
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
- H04N21/44213—Monitoring of end-user related data
- H04N21/44222—Analytics of user selections, e.g. selection of programs or purchase activity
- H04N21/44224—Monitoring of user activity on external systems, e.g. Internet browsing
- H04N21/44226—Monitoring of user activity on external systems, e.g. Internet browsing on social networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/658—Transmission by the client directed to the server
- H04N21/6582—Data stored in the client, e.g. viewing habits, hardware capabilities, credit card number
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/61—Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
- H04H60/66—Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 for using the result on distributors' side
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Social Psychology (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Databases & Information Systems (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Verzameltechniek voor een gebruikersgerichte publieksmeting van consumptieberichten, hits genaamd, die overgedragen worden naar een node voor sitegerichte publieksmeting (5) door markers die uitgevoerd worden door terminals (2) in panelhuishoudens (1). De werkwijze omvat de volgende stappen: verkrijging van een verzameling van eerste registraties, gecreëerd door tenminste één tussenelement waardoor de hits gaan, waarbij iedere eerste registratie een afzonderlijke hit betreft en een identificatie van de terminal omvat die de hit verzonden heeft; verkrijging van een verzameling van tweede registraties, gecreëerd door de node, waarbij iedere tweede registratie een afzonderlijke hit betreft en tenminste één hitparameter omvat; en toewijzing aan iedere tweede registratie van een terminalidentificatie, afgeleid ofwel uit een unieke eerste registratie ofwel uit meerdere eerste registraties die eenzelfde terminalidentificatie omvatten.Collection technique for a user-oriented audience measurement of consumer messages, called hits, that are transferred to a node for site-oriented audience measurement (5) by markers performed by terminals (2) in panel households (1). The method comprises the following steps: obtaining a collection of first registrations created by at least one intermediate element through which the hits pass, each first registration being a separate hit and including an identification of the terminal that sent the hit; obtaining a collection of second registrations created by the node, each second registration being a separate hit and including at least one hit parameter; and assignment to each second registration of a terminal identification, derived either from a unique first registration or from a plurality of first registrations comprising the same terminal identification.
Description
Titel: Verzamelwerkwijze voor een gebruikersgerichte publieksmeting, van hits overgedragen naar een node voor sitegerichte publieksmeting, met gebruikmaking van hitregistraties gecreëerd door de node.Title: Collection method for a user-oriented audience measurement, from hits transferred to a node for site-oriented audience measurement, using hit registrations created by the node.
1. GEBIED VAN DE UITVINDING1. FIELD OF THE INVENTION
Het gebied van de uitvinding is dat van technieken voor publieksmeting.The field of the invention is that of audience measurement techniques.
Meer precies heeft de uitvinding betrekking op een verzameltechniek voor een gebruikersgerichte publieksmeting van consumptieberichten, hits genaamd, die overgedragen worden naar een node voor sitegerichte publieksmeting door markers die uitgevoerd worden door terminals in panelhuishoudens. De marker bevindt zich bijvoorbeeld in een webpagina die uitgevoerd wordt door een browser, die zelf uitgevoerd wordt door de terminal. In een variant bevindt de marker zich in een derdenapplicatie, die zelf uitgevoerd wordt door de terminal.More precisely, the invention relates to a collection technique for a user-oriented audience measurement of consumption messages, called hits, that are transferred to a node for site-oriented audience measurement by markers performed by terminals in panel households. The marker is, for example, located in a web page that is executed by a browser, which is itself executed by the terminal. In a variant, the marker is in a third-party application, which itself is executed by the terminal.
De uitvinding is met name, maar niet exclusief, van toepassing op de gebruikersgerichte publieksmeting van gestreamde content (bijvoorbeeld een tv-programma) die overgedragen wordt via het Internet.In particular, but not exclusively, the invention applies to the user-oriented audience measurement of streamed content (e.g., a TV program) transmitted over the Internet.
Meer algemeen kan de voorgestelde techniek van toepassing zijn op: • ieder type informatienetwerk; • ieder type content (met name, maar niet exclusief, audio- en/of videocontent: gestreamde of gedownloade content, live content of uitgestelde content, gemiste tv (catch up TV’), video on demand (VOD), webradio, online beschikbare content (content beschikbaar op internetsites, dat wil zeggen verwijzingen in webpagina’s die raadpleegbaar zijn met een browser uitgevoerd door de terminal), content beschikbaar op derdenapplicaties uitgevoerd door de terminal, enz.); • ieder type terminal (vast of mobiel, persoonlijk of gedeeld): computer, smartphone, tablet, connected tv, enz.More generally, the proposed technique can apply to: • any type of information network; • any type of content (in particular but not exclusively, audio and / or video content: streamed or downloaded content, live content or deferred content, missed TV (catch up TV), video on demand (VOD), web radio, available online) content (content available on internet sites, ie references in web pages that can be consulted with a browser executed by the terminal), content available on third-party applications performed by the terminal, etc.); • any type of terminal (fixed or mobile, personal or shared): computer, smartphone, tablet, connected TV, etc.
2, TECHNISCHE ACHTERGROND2, TECHNICAL BACKGROUND
Tegenwoordig bestaan er twee hoofdmaatregelen (ook gereedschappen voor ‘Web Analytics’ genaamd) om een publieksmeting (in ruime zin) uit te voeren voor een website, op het Internet: sitegerichte publieksmeting (in het Engels ‘site-centric’) en gebruikersgerichte publieksmeting (in het Engels ‘user-centric’). 2.1 ‘Site-centric’ metingNowadays there are two main measures (also called 'Web Analytics' tools) to perform a public measurement (in a broad sense) for a website, on the Internet: site-oriented audience measurement (in English 'site-centric') and user-oriented audience measurement ( in English 'user-centric'). 2.1 Site-centric measurement
Dit is een door de website op verzoek bewerkstelligde meting die zelf de webpagina’s (HTML-pagina’s) markeert die men wil meten. Het hoofddoel van de ‘site-centric’ meting is het meten van de verkeersvolumes. Daardoor kan fijn en nauwkeurig gevolgd worden: het gedrag van de internetgebruiker op de site, de meest geraadpleegde content, de meest gebruikte diensten en de internetherkomst van de bezoeken. De ‘site-centric’ meting is eveneens van toepassing op het meten van de doelmatigheid van de online marketingactiviteiten: clicks, omzettingsratio’s, omzetten, rendement op investering, enz.This is a measurement produced by the website on request that itself marks the web pages (HTML pages) that one wants to measure. The main purpose of the site-centric measurement is to measure the traffic volumes. This allows fine and precise monitoring: the behavior of the internet user on the site, the most consulted content, the most frequently used services and the internet return of the visits. The site-centric measurement also applies to measuring the effectiveness of online marketing activities: clicks, conversion rates, sales, return on investment, etc.
De werking van de ‘site-centric’ meting berust op het markeren van elke pagina van een site met een marker (ook ‘markeringsblok’ of ‘tag’ genaamd), bijvoorbeeld een Javascript-code. Zodra een pagina opgevraagd wordt door een webbrowser via een met het Internet verbonden terminal (computer, smartphones, tablets, connected tv’s, enz.), dan verzendt de op de pagina geplaatste marker een verzoek (ook ‘hit’ of ‘consumptiebericht’ genaamd) naar de meetserver. Zo wordt het verkeer op de pagina’s bijgehouden. De ‘site-centric’ meting maakt het mogelijk om het aantal terminals te analyseren (geïdentificeerd door hun internetbrowsers) die een site gedurende een bepaalde periode geraadpleegd hebben. De browsers worden geïdentificeerd met behulp van cookies of met het koppel IP-adres/User Agent wanneer meting met een cookie niet mogelijk is. Voor een gegeven browser en terminal wordt een cookie geplaatst op de terminal door de server van het publieksmetingbedrijf (Web Analytics systeem) wanneer voor de eerste keer een marker wordt gedownload van de server van het publieksmetingbedrijf. Deze cookie is gemeenschappelijk voor alle door het publieksmetingbedrijf gemarkeerde sites, omdat het een ‘derdencookie’ (in het Engels ‘third party cookie’) betreft dat door dit bedrijf beheerd wordt.The operation of the "site-centric" measurement is based on marking each page of a site with a marker (also called "marker block" or "tag"), for example a Javascript code. As soon as a page is requested by a web browser via a terminal connected to the Internet (computer, smartphones, tablets, connected TVs, etc.), the marker placed on the page sends a request (also called 'hit' or 'consumption message') to the measurement server. This way the traffic on the pages is tracked. The site-centric measurement makes it possible to analyze the number of terminals (identified by their internet browsers) that have consulted a site during a certain period. The browsers are identified using cookies or with the pairing IP address / user agent when measurement with a cookie is not possible. For a given browser and terminal, a cookie is placed on the terminal by the server of the audience measurement company (Web Analytics system) when a marker is downloaded from the server of the audience measurement company for the first time. This cookie is common to all sites marked by the public measurement company, because it is a "third-party cookie" (in English "third party cookie") that is managed by this company.
De markeertechniek voor webpagina’s (oorspronkelijk bedacht voor het meten van het bezoek van websites, zoals hierboven uiteengezet) is vervolgens uitgebreid naar derdenapplicaties (ook ‘mobiele applicaties’ of ‘uitgeversapplicaties’ genaamd), die gedownload kunnen worden uit online applicatiewinkels (bijvoorbeeld markers voor iOS, Android of Windows). Zo is het voorgesteld om een marker (‘tag’) in te voegen in de mobiele applicatie. Voor dit doel bestaan er markeringsbibliotheken voor de verschillende platformen voor mobiele applicaties. Mobiele applicaties zijn hulpmiddelen die het zoeken en raadplegen van alle typen content vergemakkelijken voor de gebruikers. Een mobiele applicatie die verbinding heeft, gedraagt zich in hoofdzaak als een browser, omdat voor elke bewerking of gegevenstoegang informatie gelezen wordt op het Internet. In tegenstelling tot een browser kan een mobiele applicatie in het algemeen rekening houden met de functionaliteit van de terminal waarop zij wordt uitgevoerd, waardoor de gebruiker meer doelmatigheid geboden wordt.Web site marking technology (originally designed to measure website visits, as set out above) has subsequently been extended to third-party applications (also known as 'mobile applications' or 'publisher applications') that can be downloaded from online application stores (eg markers for iOS , Android or Windows). For example, it is suggested to insert a marker ("tag") in the mobile application. For this purpose, there are marker libraries for the various platforms for mobile applications. Mobile applications are tools that facilitate the search and consultation of all types of content for users. A mobile application that is connected essentially behaves like a browser, because information is read on the Internet for each operation or data access. Unlike a browser, a mobile application can generally take into account the functionality of the terminal on which it is running, thereby offering the user more efficiency.
De markeertechniek voor webpagina’s en applicaties kan als volgt samengevat worden. Wanneer een uitgever zijn website markeert om een internetpublieksmetingbedrijf het publiek ervan te kunnen laten meten, dan integreert hij een marker in zijn HTML-pagina’s (de marker bestaat dan uit een aanroep naar een Javascript-routine die zich op de server van het publieksmetingbedrijf bevindt) of in zijn derdenapplicaties (de marker bestaat dan uit een in native code geschreven bibliotheek en is geïntegreerd in de derdenapplicatie). Bij het laden van elke pagina of van de derdenapplicatie wordt een markeringsidentificatie (uniek en persistent) gegenereerd (als dat niet eerder al gebeurd is). In het geval van een pagina (van een site van een uitgever) die raadpleegbaar is met de webbrowser van de terminal, dan wordt de markeringsidentificatie door de server van het publieksmetingbedrijf geplaatst in de vorm van een cookie op de terminal (de cookie is in het algemeen gemeenschappelijk voor alle sites die door het publieksmetingbedrijf gemarkeerd zijn). In het geval van een derdenapplicatie voorgesteld door een uitgever in een winkel voor derdenapplicaties, dan wordt de markeringsidentificatie gegenereerd door de marker en opgeslagen in een opslagruimte van de terminal, eigen aan elke applicatie, indien het niet mogelijk is om de unieke identificatie van de terminal te gebruiken. Deze is in het algemeen per applicatie verschillend.The marking technique for web pages and applications can be summarized as follows. When a publisher marks his website to allow an internet audience measurement company to measure its audience, he integrates a marker into his HTML pages (the marker then consists of a call to a Javascript routine that is on the server of the audience measurement company) or in its third-party applications (the marker then consists of a library written in native code and is integrated in the third-party application). When loading each page or third-party application, a marker identification (unique and persistent) is generated (if that has not been done before). In the case of a page (from a site of a publisher) that can be consulted with the web browser of the terminal, then the marking identification is placed by the server of the public measurement company in the form of a cookie on the terminal (the cookie is in the generally common to all sites marked by the public measurement company). In the case of a third-party application proposed by a publisher in a store for third-party applications, the marker identification is generated by the marker and stored in a storage space of the terminal specific to each application, if it is not possible to uniquely identify the terminal to use. This is generally different per application.
Buiten het meten van het bezoek aan HTML-pagina’s en derdenapplicaties kunnen bepaalde markers ook het publiek meten van audio- en/of videocontent die weergegeven wordt door afspeelinrichtingen voor content (ook ‘spelers’ of‘players’ genaamd). Daarvoor zijn deze markers gekoppeld met de contentspelers om hun werkingsstatus te kennen. Tijdens het presenteren van content (inclusief tijdens de start) verzendt de marker periodieke verzoeken (ook ‘hits’ of ‘consumptieberichten’ genaamd) naar de server voor internetpublieksmeting om de werkingsstatus van de speler (player) over te dragen. Deze hits brengen verschillende parameters over: de identiteit van de content, de positie in de content (de tijdsindex van het afspelen), de status van de speler (pauze, afspelen...), de markeringsidentificatie (waarmee sessies van dezelfde terminal gedurende dezelfde dag ontdubbeld kunnen worden) evenals een tijdelijke sessie-identificatie die bij elke nieuwe start van de speler vernieuwd wordt. In nominale modus worden de hits iedere 60 seconden verzonden. De markeringstechniek voor webpagina’s en applicaties maakt het mogelijk om de consumptie (aantal en duur) van content te meten.In addition to measuring visits to HTML pages and third-party applications, certain markers can also measure the audience of audio and / or video content that is displayed by content playback devices (also known as "players" or "players"). For this purpose these markers are linked to the content players to know their operating status. During the presentation of content (including at the start) the marker sends periodic requests (also called "hits" or "consumption messages") to the internet audience measurement server to transfer the operating status of the player (player). These hits convey different parameters: the identity of the content, the position in the content (the time index of the playback), the status of the player (pause, playback ...), the marker identification (which allows sessions from the same terminal during the same day can be doubled) as well as a temporary session identification which is renewed with every new start of the player. In nominal mode, the hits are sent every 60 seconds. The marking technique for web pages and applications makes it possible to measure the consumption (number and duration) of content.
Een nadeel van de markeringstechniek is dat zij beperkt is tot ‘site-centric’ meting en geen rekening houdt met het concept van een panel (dit concept is eigen aan de ‘user-centric’ meting). Met de ‘site-centric’ meting is het niet mogelijk om de internetgebruikers afzonderlijk te identificeren die verbinding maken met de site (men weet niet wie zich achter de terminal bevindt die verbonden is met het Internet). Zij maakt het dus niet mogelijk om een gekwalificeerd publiek te hebben. Daarom vult de ‘user-centric’ meting (hierna verder uitgewerkt) de ‘site-centric’ meting aan. 2.2 ‘User-centric’ metingA disadvantage of the marking technique is that it is limited to "site-centric" measurement and does not take into account the concept of a panel (this concept is specific to the "user-centric" measurement). With the "site-centric" measurement it is not possible to identify the internet users separately who are connecting to the site (they do not know who is behind the terminal connected to the Internet). It therefore does not make it possible to have a qualified audience. That is why the "user-centric" measurement (detailed below) complements the "site-centric" measurement. 2.2 "User-centric" measurement
Deze meting berust op het volgen van de navigatie (surfen) op het Internet van een panel (steekproef van internetgebruikers) dat representatief is voor een populatie van internetgebruikers (bijvoorbeeld de Nederlandse internetgebruikers). De navigatie van het panel wordt gemeten en parallel daaraan wordt een oriënterend onderzoek uitgevoerd om hun navigatie te extrapoleren naar de onderzochte internetpopulatie. Door het panellid nauwkeurig te identificeren, kan met de ‘user-centric’ meting het aantal unieke bezoekers geanalyseerd worden dat binnen een bepaalde periode een site bezocht heeft. Een unieke bezoeker van het panel komt overeen met een gekwalificeerd en geïdentificeerd individu. Geëxtrapoleerd komt een panellid overeen met duizenden unieke bezoekers. De ‘user-centric’ meting geeft bureaus, uitgevers en marketingprofessionals nauwkeurige en betrouwbare rapporten over het publiek van internetsites en het internetgebruik. Deze informatie kan gebruikt worden voor strategische plannen, concurrentieonderzoeken of mediaplanning. De resultaten worden bijvoorbeeld iedere maand geactualiseerd.This measurement is based on following the navigation (surfing) on the Internet of a panel (sample of internet users) that is representative of a population of internet users (for example Dutch internet users). The navigation of the panel is measured and an exploratory study is conducted in parallel to extrapolate their navigation to the internet population studied. By accurately identifying the panel member, the "user-centric" measurement can be used to analyze the number of unique visitors who have visited a site within a certain period. A unique visitor to the panel corresponds to a qualified and identified individual. Extrapolated, a panel member corresponds to thousands of unique visitors. The "user-centric" measurement gives agencies, publishers and marketing professionals accurate and reliable reports about the audience of internet sites and internet use. This information can be used for strategic plans, competition investigations or media planning. For example, the results are updated every month.
Een eerste bekende techniek voor ‘user-centric’ publieksmeting berust op digitale tatoeage (in het Engels ‘audio watermarking’) van een audiokanaal (ook ‘audiocomponent’ genaamd) van uitgezonden content (bijvoorbeeld tv-zenders) of het vergelijken van hun audiovingerafdruk (in het Engels ‘audio fingerprinting’) met referentievingerafdrukken. Deze eerste bekende techniek ligt ten grondslag aan de audimeters die gebruikt worden voor het referentieonderzoek naar dagelijks tv-kijkgedrag. In het geval van een tv-toestel vangt de audimeter (vaak een mini-pc) het audiokanaal van de weergegeven zender op (op elektrische of akoestische wijze) teneinde de bewerking van het signaal te kunnen bewerkstelligen en de publieksgegevens te kunnen overdragen naar de server van het publieksmetingbedrijf. Een nadeel van deze eerste bekende techniek is dat in het geval van draagbare pc’s, smartphones of tablets het moeilijk voorstelbaar is om permanent een audimeter aan te sluiten (dat wil zeggen een extern apparaat) aan deze naar hun aard mobiele apparaten. Een ander nadeel van deze eerste bekende techniek is dat het op bepaalde typen terminals (vaak terminals van Apple (gedeponeerd handelsmerk)) het zeer moeilijk is om het audiokanaal in digitale indeling op te vangen, rechtstreeks op het niveau van de audiocircuits.A first known technique for 'user-centric' audience measurement is based on digital tattooing (in English 'audio watermarking') of an audio channel (also called 'audio component') of broadcast content (for example TV channels) or comparing their audio fingerprint ( in English 'audio fingerprinting') with reference fingerprints. This first known technique forms the basis for the audimeters that are used for reference research into daily TV viewing behavior. In the case of a TV set, the audimeter (often a mini-PC) captures the audio channel of the displayed channel (electrically or acoustically) in order to be able to process the signal and transfer the audience data to the server from the public measurement company. A disadvantage of this first known technique is that in the case of portable PCs, smartphones or tablets it is difficult to imagine permanently connecting an audimeter (i.e. an external device) to these by their nature mobile devices. Another disadvantage of this first known technique is that on certain types of terminals (often Apple terminals (registered trademark)) it is very difficult to capture the audio channel in digital format, directly at the level of the audio circuits.
Een tweede bekende techniek voor ‘user-centric’ publieksmeting berust op de analyse van het netwerkverkeer tussen de terminal en het Internet. Deze tweede bekende techniek bestaat uit het benutten van netwerktraces die achtergelaten worden op het niveau van een router die in de woning van de panelleden geïnstalleerd is of op het niveau van een HTTP-proxy waardoor de terminals van de panelleden moeten passeren. Bijvoorbeeld, in het kader van het meten van internetverkeer in een huishouden dat gerecruteerd is om deel te nemen aan een panel, bestaat een oplossing die ingezet wordt door het publieksmetingbedrijf uit het verbinden van een router aan de box (dat wil zeggen de routermodem, ook ‘netwerkaansluitapparatuur’ genaamd, geleverd door de internetprovider) en het huishouden te vragen om alle terminals hierop aan te sluiten om het internetverkeer dat er doorheen gaat te kunnen loggen. Het hoofdnadeel van deze tweede bekende techniek is dat het netwerkverkeer mogelijk totaal geen samenhang heeft met de content die daadwerkelijk op de terminal weergegeven wordt. Bijvoorbeeld, wanneer de gebruiker de speler (player) pauzeert, dan wordt de audiovisuele stream verder opgeslagen in buffergeheugen, zonder garantie dat hij later gedecodeerd en weergegeven zal worden. Er is dus een onnauwkeurigheid in de meting van gestreamde content die mogelijk gebufferd wordt in de terminals en nooit geconsumeerd wordt. Een ander nadeel is dat deze oplossing beperkt is tot de woning waar de router zich bevindt.A second known technique for "user-centric" audience measurement is based on the analysis of network traffic between the terminal and the Internet. This second known technique consists of utilizing network traces that are left at the level of a router installed in the home of the panel members or at the level of an HTTP proxy through which the terminals of the panel members must pass. For example, in the context of measuring internet traffic in a household recruited to participate in a panel, a solution that is used by the public measurement company is to connect a router to the box (ie the router modem, also called 'network connection equipment', supplied by the internet provider) and to ask the household to connect all terminals to it in order to be able to log the internet traffic that passes through it. The main disadvantage of this second known technique is that the network traffic may have no connection whatsoever with the content that is actually displayed on the terminal. For example, when the user pauses the player (player), the audiovisual stream is further stored in buffer memory, with no guarantee that it will later be decoded and displayed. So there is an inaccuracy in the measurement of streamed content that may be buffered in the terminals and never consumed. Another disadvantage is that this solution is limited to the home where the router is located.
Een derde bekende techniek voor ‘user-centric’ publieksmeting berust op een meetprogramma (ook ‘meetsoftware’ of ‘meetapplicatie’ genaamd) dat ingebouwd is in de terminal teneinde de verbindingsgegevens (surfgegevens) in realtime te kunnen overdragen en analyseren. De ‘meetapplicatie’ is ontwikkeld door het publieksmetingbedrijf en door het panellid geïnstalleerd op zijn terminal om het gebruik ervan te kunnen meten. De applicatie werkt als achtergrondtaak en installeert, in een bijzondere implementatie, een lokale proxy (ook ‘process proxy’ genaamd) op de terminal. Alle netwerkverbindingen (wifi, 3G/4G, ...) gaan door de lokale proxy en die kan tijdens het passeren alle HTTP-verzoeken registreren die naar de doelservers verzonden worden. Het hoofdnadeel van deze derde bekende techniek is dat zij een zeer consequente R&D-inspanning vergt om een meetprogramma op alle besturingssystemen (OS) en alle internetbrowsers van de terminals te handhaven, rekening houdend met de ontwikkelingen van de grote partijen op het web, en dat evengoed op een computer (pc), tablet, smartphone, enz. Anderzijds, wanneer audiovisuele content (stream) beveiligd is met een technische beveiligingsmaatregel (of DRM, ‘Digital Rights Management’ in het Engels), dan kan het meetprogramma in het algemeen niet de consumptie daarvan meten. 2.3 Gebruik van de hits van een ‘site-centric’ meting in het kader van een ‘user-centric’ metingA third known technique for "user-centric" audience measurement is based on a measurement program (also called "measurement software" or "measurement application") that is built into the terminal in order to be able to transfer and analyze the connection data (surf data) in real time. The "measurement application" was developed by the public measurement company and installed by the panel member on its terminal to be able to measure its use. The application works as a background task and, in a special implementation, installs a local proxy (also called "process proxy") on the terminal. All network connections (Wi-Fi, 3G / 4G, ...) go through the local proxy and can pass all HTTP requests sent to the target servers as they pass. The main disadvantage of this third known technique is that it requires a very consistent R & D effort to maintain a measurement program on all operating systems (OS) and all internet browsers at the terminals, taking into account the developments of the major parties on the web, and that equally well on a computer (PC), tablet, smartphone, etc. On the other hand, when audiovisual content (stream) is protected with a technical security measure (or DRM, "Digital Rights Management" in English), the measurement program can generally do not measure their consumption. 2.3 Use of the hits of a "site-centric" measurement in the context of a "user-centric" measurement
Zoals eerder uitgelegd berust de ‘site-centric’ meting op het verzenden van hits door de markers die in webpagina’s of derdenapplicaties geïntegreerd zijn. Het is voorgesteld om deze hits te benutten in het kader van een ‘user-centric’ meting. Bijvoorbeeld, zoals in de tweede bekende techniek voor ‘user-centric’ publieksmeting die hierboven gepresenteerd is, registreert (logt) een router die in het huishouden van panelleden geïnstalleerd is de hits die overgedragen worden door de terminals van dat huishouden. De aldus gelogde hits kunnen vervolgens door het publieksmetingbedrijf benut worden om te weten welke HTML-pagina of welk onderdeel van een derdenapplicatie door het panellid bezocht is. Maar bovenal, in het geval van hits die overgedragen worden door markers die samenwerken met spelers (players), dan kunnen ze benut worden teneinde een meting van de videoconsumptie te bewerkstelligen. De kennis van de internettraces (HTTP-verzoeken) alleen volstaat niet om nauwkeurig de consumptieduur van gestreamde content te weten te komen, omdat de content mogelijk in buffergeheugen geplaatst wordt en uitgesteld weergegeven wordt. De marker is daarentegen een middel om nauwkeurig te weten te komen welk deel van de content gedecodeerd en gepresenteerd is. In het kader van de meting van tv op internetbeeldschermen (pc, tablet, mobiel) kan men deze technologie benutten om het publiek te meten van televisiezenders (live, uitgesteld of gemist) in een panel van kijkers. De voorwaarde is natuurlijk dat de sites en de applicaties van de zenders deze markeringstechnologie gebruiken.As explained earlier, the "site-centric" measurement is based on the sending of hits by the markers that are integrated in web pages or third-party applications. It has been proposed to use these hits in the context of a "user-centric" measurement. For example, as in the second known "user-centric" audience measurement technique presented above, a router installed in the household of panel members records (hits) transmitted by the terminals of that household. The thus logged hits can then be used by the public measurement company to know which HTML page or which part of a third-party application has been visited by the panel member. But above all, in the case of hits transmitted by markers that interact with players, they can be utilized to effect a measurement of video consumption. The knowledge of internet traces (HTTP requests) alone is not sufficient to accurately know the duration of consumption of streamed content, because the content may be placed in buffer memory and may be delayed. The marker, on the other hand, is a means to accurately find out which part of the content has been decoded and presented. In the context of measuring TV on internet displays (PC, tablet, mobile), one can use this technology to measure the audience of television channels (live, delayed or missed) in a panel of viewers. The condition is of course that the sites and the applications of the channels use this marking technology.
Sinds enkele jaren wordt waargenomen dat internetpartijen hun servers steeds meer naar beveiligde verbindingen via het HTTPS-protocol migreren. Door dit type verbinding op te zetten, wordt de internetgebruiker er enerzijds van verzekerd dat hij verbinding maakt met de juiste site en niet met een gekaapte site (serverauthenticatie) en anderzijds dat de communicatie versleuteld is en niet onderschept kan worden (vertrouwelijkheid). Het HTTPS-protocol werd oorspronkelijk gebruikt door banken- of e-commercesites, maar wordt inmiddels grotendeels gebruikt door alle sites die behoren tot sociale netwerken en die persoonlijke, mogelijk gevoelige informatie opslaan of uitwisselen. Wanneer een HTML-pagina via HTTPS wordt geladen (dat wil zeggen via een beveiligde verbinding volgens het HTTPS-protocol), dan vereist de internetbrowser dat alle onderdelen van deze pagina (afbeeldingen, Javascript, ...) geladen worden via HTTPS vanuit het oogpunt van de veiligheid, teneinde geen kwaadaardige code te laten binnenkomen via een beveiligde website. Tegenwoordig accepteren de meeste browsers nog dat onderdelen geladen worden via het HTTP-protocol in een pagina die geladen wordt via het HTTPS-protocol. Er wordt dan slechts een waarschuwingspictogram weergegeven voor de adresbalk, maar het is waarschijnlijk dat het laden in toekomstige versies van de browsers geblokkeerd wordt. Zoals alle onderdelen moet ook een marker van een publieksmetingbedrijf geladen worden via HTTPS. Evenzo moeten de hits die door deze markers verzonden worden via HTTPS verzonden worden.For several years it has been observed that internet parties are increasingly migrating their servers to secure connections via the HTTPS protocol. By setting up this type of connection, the internet user is assured on the one hand that he connects to the correct site and not to a hijacked site (server authentication) and on the other hand that the communication is encrypted and cannot be intercepted (confidentiality). The HTTPS protocol was originally used by banking or e-commerce sites, but is now largely used by all sites that belong to social networks and that store or exchange personal, potentially sensitive information. When an HTML page is loaded via HTTPS (that is, via a secure connection according to the HTTPS protocol), the internet browser requires that all parts of this page (images, Javascript, ...) be loaded via HTTPS from the point of view security, in order to prevent malicious code from entering through a secure website. Nowadays, most browsers still accept that items are loaded via the HTTP protocol in a page that is loaded via the HTTPS protocol. Only a warning icon will be displayed for the address bar, but it is likely that loading will be blocked in future versions of the browsers. Like all components, a marker from a public measurement company must also be loaded via HTTPS. Likewise, the hits sent by these markers must be sent via HTTPS.
Terugkomend op de eerder genoemde oplossing voor ‘user-centric’ meting op basis van benutting van geregistreerde (gelogde) hits door een router die in een huishouden van panelleden aanwezig is (dat is de tweede bekende techniek die hierboven gepresenteerd is), wordt vastgesteld dat de router die voor iedere hit middenin een versleutelde HTTPS-verbinding (opgebouwd tussen een terminal in het huishouden en de server van het publieksmetingbedrijf) geplaatst is, uitsluitend de domeinnaam logt waarnaar de hit verzonden wordt, maar geen van de in deze hit opgenomen parameters registreert. Bijvoorbeeld, voor hits die overgedragen worden door markers die samenwerken met afspeelinrichtingen (players), registreert de router niet de status van de speler, de naam van de content en de tijdsindex van het afspelen. De logboeken (registraties van netwerktraces overeenkomend met hits) kunnen dus niet benut worden voor het bewerkstelligen van een ‘user-centric’ meting (van videoconsumptie in het eerdergenoemde voorbeeld).Returning to the aforementioned solution for 'user-centric' measurement based on the utilization of registered (logged) hits by a router present in a household of panel members (that is the second known technique presented above), it is determined that the router that is placed for every hit in the middle of an encrypted HTTPS connection (established between a terminal in the household and the server of the public measurement company), only logs the domain name to which the hit is sent, but does not register any of the parameters included in this hit . For example, for hits transmitted by markers that interact with playback devices (players), the router does not record the status of the player, the name of the content, and the time index of playback. The logs (recordings of network traces corresponding to hits) can therefore not be used to effect a "user-centric" measurement (of video consumption in the aforementioned example).
Evenzo is een nadeel van de derde bekende techniek dat, indien de ‘meetapplicatie’ en de in gebruik zijnde applicatie (waarvan men het internetverkeer wil meten) zich ieder in hun eigen sandbox bevinden, de lokale proxy van de ‘meetapplicatie’ nadat hij een HTTPS-verbinding opgezet heeft geen toegang meer heeft tot de details van de hits (zelfde probleem met een router of een externe proxy). De via HTTPS verzonden hits (bijvoorbeeld hits van het type ‘eStat streaming’) kunnen dus niet benut worden. Een sandbox is een mechanisme waarmee (een) programma(’s) met minder risico’s voor het besturingssystemen uitgevoerd kan (kunnen) worden.Similarly, a disadvantage of the third known technique is that, if the 'measurement application' and the application in use (of which one wants to measure internet traffic) are each in their own sandbox, the local proxy of the 'measurement application' after having an HTTPS -connection has no longer access to the details of the hits (same problem with a router or an external proxy). The hits sent via HTTPS (for example hits of the "eStat streaming" type) cannot be used. A sandbox is a mechanism with which (a) program (s) can be executed with fewer risks for the operating systems.
Met andere woorden, in het kader van een ‘user-centric’ meting is het momenteel mogelijk om de parameters te benutten in de hits die over een niet-beveiligde verbinding verzonden worden (bijvoorbeeld via het HTTP-protocol), maar niet de parameters in de hits die over een beveiligde verbinding verzonden worden (bijvoorbeeld via het HTTPS-protocol). Het is dus niet mogelijk om alle door de terminals in een huishouden van panelleden verzonden hits te benutten en het is dus niet mogelijk om in alle gevallen een publieksmeting te bewerkstelligen.In other words, in the context of a 'user-centric' measurement, it is currently possible to use the parameters in the hits that are sent over a non-secure connection (for example via the HTTP protocol), but not the parameters in the hits that are sent over a secure connection (for example via the HTTPS protocol). It is therefore not possible to use all hits sent by the terminals in a household of panel members and it is therefore not possible to achieve a public measurement in all cases.
3. DOELEN VAN DE UITVINDING3. OBJECTS OF THE INVENTION
De uitvinding heeft, in tenminste één uitvoeringsvorm, met name ten doel om deze verschillende nadelen van de stand van de techniek op te heffen.In at least one embodiment, the invention has the particular object of overcoming these various disadvantages of the prior art.
Meer nauwkeurig, in tenminste één uitvoeringsvorm van de uitvinding is een doel het leveren van een techniek waarmee het mogelijk is om in het kader van een ‘user-centric’ meting (gebruikersgerichte publieksmeting) alle parameters te verzamelen (en dus benutbaar te maken) die zich in de hits bevinden die verzonden worden door de terminal of de terminals van een panelhuishouden, hits die hetzij via een niet-beveiligde verbinding (bijvoorbeeld via het HTTP-protocol) of via een beveiligde verbinding (bijvoorbeeld via het HTTPS-protocol) overgedragen worden.More precisely, in at least one embodiment of the invention, it is an object to provide a technique with which it is possible to collect (and thus make usable) all parameters in the context of a 'user-centric' measurement (user-oriented audience measurement) are in the hits sent by the terminal or the terminals of a panel household, hits that are transmitted either via a non-secure connection (e.g. via the HTTP protocol) or via a secure connection (e.g. via the HTTPS protocol) .
Tenminste één uitvoeringsvorm van de uitvinding heeft eveneens als doel een dergelijke techniek te leveren die geen enkele modificatie van de bestaande markers noch van de bestaande terminals vereist.At least one embodiment of the invention also has the purpose of providing such a technique that requires no modification of the existing markers nor of the existing terminals.
Een ander doel van tenminste één uitvoeringsvorm van de uitvinding is het leveren van een dergelijke techniek die eenvoudig inzetbaar en niet duur is.Another object of at least one embodiment of the invention is to provide such a technique that is easy to use and inexpensive.
4. UITEENZETTING VAN DE UITVINDING4. EXPLANATION OF THE INVENTION
In een bijzondere uitvoeringsvorm van de uitvinding wordt een verzameltechniek voorgesteld, ter gebruikersgerichte publieksmeting, van consumptieberichten, hits genaamd, die overgedragen worden naar een node voor sitegerichte publieksmeting door markers die uitgevoerd worden door terminals in panelhuishoudens. De werkwijze omvat de volgende stappen: - verkrijging van een verzameling van eerste registraties, gecreëerd door tenminste één tussenelement waardoor de hits gaan, waarbij iedere eerste registratie een afzonderlijke hit betreft en een identificatie van de terminal omvat die de hit verzonden heeft; - verkrijging van een verzameling van tweede registraties, gecreëerd door de node, waarbij iedere tweede registratie een afzonderlijke hit betreft en tenminste één hitparameter omvat, en - toewijzing aan iedere tweede registratie van een terminalidentificatie, afgeleid ofwel uit een unieke eerste registratie ofwel uit meerdere eerste registraties die eenzelfde terminalidentificatie omvatten.In a particular embodiment of the invention, a collection technique is proposed, for user-oriented audience measurement, of consumption messages, called hits, that are transmitted to a node for site-oriented audience measurement by markers performed by terminals in panel households. The method comprises the following steps: - obtaining a collection of first registrations, created by at least one intermediate element through which the hits pass, each first registration being a separate hit and including an identification of the terminal that sent the hit; - obtaining a collection of second registrations created by the node, each second registration being a separate hit and comprising at least one hit parameter, and - allocation to each second registration of a terminal identification, derived either from a unique first registration or from several first registrations that include the same terminal identification.
Het principe van de voorgestelde oplossing bestaat dus uit het toewijzen van een terminalidentificatie aan elke tweede registratie (ook ‘tweede log’ genaamd) die gecreëerd is door de node voor sitegerichte publieksmeting (ook ‘sitegerichte meetnode’ genaamd). Dit maakt het mogelijk om een terminalidentificatie te associëren aan (de) bekende parameter(s) in iedere tweede registratie gecreëerd door de node. Deze terminalidentificatie (bijvoorbeeld het MAC-adres van de terminal) maakt het mogelijk om informatie te kennen die nodig is voor een gebruikersgerichte meting, zoals bijvoorbeeld de identiteit van de perso(o)n(en) die aangemeld is (zijn) op de terminal en/of het type terminal (bijvoorbeeld ‘gedeeld’ of ‘individueel’, ‘iOS tablet’ of ‘Android smartphone’The principle of the proposed solution therefore consists of assigning a terminal identification to every second registration (also called "second log") created by the site-oriented audience measurement node (also called "site-oriented measurement node"). This makes it possible to associate a terminal identification with (the) known parameter (s) in every second registration created by the node. This terminal identification (for example the MAC address of the terminal) makes it possible to know information that is required for a user-oriented measurement, such as, for example, the identity of the person (s) who are registered at the terminal and / or the type of terminal (for example 'shared' or 'individual', 'iOS tablet' or 'Android smartphone'
Aldus is het mogelijk om te verzamelen (en in het kader van een gebruikersgerichte publieksmeting benutbaar te maken) alle parameters in de hits die verzonden worden door de terminal(s) van een panelhuishouden, zelfs wanneer deze hits overgedragen worden via een beveiligde verbinding (en de netwerkapparatuur daardoor geen toegang heeft tot deze parameters). In het kader van een gebruikersgerichte publieksmeting wordt in het algemeen aan de gebruiker van de terminal gevraagd (aan het begin van een gebruikssessie) om zich aan te melden door zijn voornaam te selecteren uit een lijst van personen in het huishouden. Deze informatie (aanmelding) is gekoppeld aan de identificatie van de terminal (bijvoorbeeld het MAC-adres). Men kan dus de terminalidentificatie gebruiken als associatiesleutel tussen: • enerzijds de tweede hitregistraties van de terminal (tweede logs van hits gecreëerd door de node), waarbij een terminalidentificatie toegewezen is aan elk van deze tweede registraties, en • anderzijds de inhoud van de aanmelding (identiteit van de persoon), om het publiek te kwalificeren met sociaaldemografische gegevens.It is thus possible to collect (and make usable in the context of a user-oriented audience measurement) all parameters in the hits sent by the terminal (s) of a panel household, even when these hits are transmitted via a secure connection (and the network equipment therefore does not have access to these parameters). In the context of a user-oriented audience measurement, the user of the terminal is generally asked (at the start of a user session) to log in by selecting his first name from a list of persons in the household. This information (registration) is linked to the identification of the terminal (for example the MAC address). The terminal identification can therefore be used as an association key between: • on the one hand the second hit registrations of the terminal (second logs of hits created by the node), whereby a terminal identification is assigned to each of these second registrations, and • on the other hand the content of the notification ( identity of the person), to qualify the public with socio-demographic data.
Volgens een bijzonder kenmerk behoort de genoemde hitparameter tot de groep omvattende: informatie over de status van een contentspeler, een identificatie van de content, een tijdsindex van het afspelen van content en een identificatie van de visualisatiesessie.According to a special feature, said hit parameter belongs to the group comprising: information about the status of a content player, an identification of the content, a time index of playing content and an identification of the visualization session.
Op deze manier is de voorgestelde oplossing van toepassing op een verzameling voor een gebruikersgerichte publieksmeting van audio- en/of videocontent weergegeven door contentspelers (‘players’).In this way the proposed solution applies to a collection for a user-oriented audience measurement of audio and / or video content displayed by content players ("players").
In een eerste bijzondere implementatie omvat de verzameling van eerste registraties een veelvoud van subverzamelingen, elk omvattende de eerste registraties gecreëerd door een afzonderlijk tussenelement, dat is een in een panelhuishouden geïnstalleerde router, waarmee iedere terminal van het genoemde panelhuishouden verbonden is om toegang te krijgen tot een informatienetwerk.In a first particular implementation, the set of first registrations comprises a plurality of subsets, each comprising the first registrations created by a separate intermediate element, which is a router installed in a panel household, to which each terminal of said panel household is connected to access an information network.
Volgens een bijzonder kenmerk van deze eerste bijzondere implementatie omvat de toewijzingsstap de volgende stappen, voor een gegeven panelhuishouden omvattende een gegeven router: - verkrijging van een eerste subverzameling, omvattende de eerste registraties, gecreëerd door de gegeven router, met daarin een netwerkadres van het gegeven huishouden; - verkrijging van een tweede subverzameling, omvattende de tweede registraties, gecreëerd door de node, met daarin het genoemde netwerkadres van het gegeven huishouden; - vaststelling van de eerste sessies waarin gegroepeerd zijn, uitgaande van de eerste subverzameling en dankzij de in iedere eerste registratie opgenomen terminalidentificatie, eerste registraties behorend bij een consumptie van eenzelfde content door eenzelfde terminal; - vaststelling van de tweede sessies waarin gegroepeerd zijn, uitgaande van de tweede subverzameling en dankzij een in iedere tweede registratie opgenomen sessie-identificatie, tweede registraties behorend bij een consumptie van eenzelfde content door eenzelfde terminal; - verkrijging van koppels van eerste en tweede sessies, door toewijzing van een eerste sessie aan iedere tweede sessie, waarbij de begintijden van de tweede sessies vergeleken worden met de begintijden van de eerste sessies, en - voor ieder koppel van eerste en tweede sessies, toewijzing aan iedere tweede registratie van de tweede sessie van het genoemde koppel van de terminalidentificatie die gemeenschappelijk is voor alle eerste registraties van de eerste sessie van het genoemde koppel.According to a particular feature of this first particular implementation, the allocation step comprises the following steps, for a given panel household comprising a given router: - obtaining a first subset, comprising the first registrations created by the given router, containing a network address of the given household; - obtaining a second subset, comprising the second registrations created by the node, with said network address of the given household; - determining the first sessions in which groups are based, starting from the first subset and thanks to the terminal identification included in each first registration, first registrations associated with a consumption of the same content by the same terminal; - determining the second sessions in which groups are based, starting from the second subset and thanks to a session identification included in each second registration, second registrations associated with a consumption of the same content by the same terminal; - obtaining pairs of first and second sessions, by assigning a first session to every second session, comparing the start times of the second sessions with the start times of the first sessions, and - for each couple of first and second sessions, allocation to every second registration of the second session of said torque identification terminal common to all first registrations of the first session of said torque.
In een tweede bijzondere implementatie omvat de verzameling van eerste registraties een veelvoud van subverzamelingen ieder omvattende eerste registraties gecreëerd door een afzonderlijk tussenelement, dat is een interne proxy in één van de terminals.In a second particular implementation, the set of first registrations comprises a plurality of subsets, each comprising first registrations created by a separate intermediate element, which is an internal proxy in one of the terminals.
Volgens een bijzonder kenmerk van deze tweede bijzondere implementatie omvat de toewijzingsstap de volgende stappen, voor een gegeven terminal omvattende een gegeven interne proxy: - verkrijging van een eerste subverzameling, omvattende de eerste registraties, gecreëerd door de gegeven interne proxy, met daarin een netwerkadres van de gegeven terminal; - verkrijging van een tweede subverzameling, omvattende de tweede registraties, gecreëerd door de node, met daarin het genoemde netwerkadres van de gegeven terminal; - vaststelling van de eerste sessies waarin gegroepeerd zijn, uitgaande van de eerste subverzameling en dankzij de terminalidentificatie in iedere eerste registratie, eerste registraties behorend bij een consumptie van eenzelfde content door de gegeven terminal; - vaststelling van de tweede sessies waarin gegroepeerd zijn, uitgaande van de tweede subverzameling en dankzij een sessie-identificatie in iedere tweede registratie, tweede registraties behorend bij een consumptie van eenzelfde content door de gegeven terminal; - verkrijging van koppels van eerste en tweede sessies, door toewijzing van een eerste sessie aan iedere tweede sessie, waarbij de begintijden van de tweede sessies vergeleken worden met de begintijden van de eerste sessies, en - voor ieder koppel van eerste en tweede sessies, toewijzing, aan iedere tweede registratie van de tweede sessie van het genoemde koppel, van de terminalidentificatie die gemeenschappelijk is voor alle eerste registraties van de eerste sessie van het genoemde koppel.According to a particular feature of this second particular implementation, the assignment step comprises the following steps, for a given terminal comprising a given internal proxy: - obtaining a first subset, comprising the first registrations created by the given internal proxy, containing a network address of the given terminal; - obtaining a second subset, comprising the second registrations created by the node, with said network address of the given terminal; - determining the first sessions in which the groups are grouped, starting from the first subset and thanks to the terminal identification in each first registration, first registrations associated with a consumption of the same content by the given terminal; - determining the second sessions in which groups are based, starting from the second subset and thanks to a session identification in every second registration, second registrations associated with a consumption of the same content by the given terminal; - obtaining pairs of first and second sessions, by assigning a first session to every second session, comparing the start times of the second sessions with the start times of the first sessions, and - for each couple of first and second sessions, allocation , to every second registration of the second session of said couple, of the terminal identification common to all first registrations of the first session of said couple.
Volgens een bijzonder kenmerk van de eerste en/of de tweede bijzondere implementatie, wordt de verkrijging van de koppels van eerste en tweede sessies bewerkstelligd door vergelijking van eveneens de eindtijden van de tweede sessies met de eindtijden van de eerste sessies.According to a special feature of the first and / or the second particular implementation, the acquisition of the pairs of first and second sessions is accomplished by also comparing the end times of the second sessions with the end times of the first sessions.
Volgens een bijzonder kenmerk van de eerste en/of de tweede bijzondere implementatie, in dien, voor een gegeven eerste sessie, de vergelijking van de eindtijden aanduidt dat de eerste gegeven sessie toegewezen moet worden aan een andere tweede sessie dan de sessie die aangeduid wordt door de vergelijking van de begintijden, dan wordt de eerste gegeven sessie tegelijkertijd toegewezen aan de tweede sessie die aangeduid wordt door de vergelijking van de begintijden, aldus een eerste sessiekoppel vormend, en aan de genoemde tweede sessie aangeduid door de vergelijking van de eindtijden, aldus een tweede sessiekoppel vormend.According to a particular feature of the first and / or the second particular implementation, if, for a given first session, the comparison of the end times indicates that the first given session must be assigned to a different second session than the session indicated by the comparison of the start times, then the first given session is simultaneously assigned to the second session indicated by the comparison of the start times, thus forming a first session couple, and to said second session indicated by the comparison of the end times, thus a forming second session couple.
In een derde bijzondere implementatie is het tussenelement een externe proxy buiten de terminals, waardoor het netwerkverkeer van de terminals gaat, om toegang te krijgen tot een informatienetwerk.In a third particular implementation, the intermediate element is an external proxy outside the terminals, through which the network traffic passes from the terminals, to gain access to an information network.
Volgens een bijzonder kenmerk van deze derde bijzondere implementatie, voor een gegeven hit overgedragen door een gegeven terminal: - de eerste registratie betreffende de gegeven hit omvat informatie specifiek voor de gegeven terminal, tenminste ten tijde van de overdracht van de gegeven hit, ingevoegd door de proxy; - de tweede registratie betreffende de gegeven hit omvat de genoemde informatie specifiek voor de gegeven terminal, tenminste ten tijde van de overdracht van de gegeven hit, ingevoegd door de node, en - de terminalidentificatie opgenomen in de eerste registratie betreffende de gegeven hit wordt toegewezen aan de tweede registratie betreffende de gegeven hit, gebruikmakend van tenminste de genoemde, voor de gegeven terminal specifieke informatie als associatiesleutel.According to a special feature of this third particular implementation, for a given hit transmitted by a given terminal: - the first record concerning the given hit includes information specific to the given terminal, at least at the time of the transfer of the given hit, inserted by the proxy; - the second registration concerning the given hit comprises the information specified specifically for the given terminal, at least at the time of the transfer of the given hit, inserted by the node, and - the terminal identification included in the first registration regarding the given hit is assigned to the second registration concerning the given hit, using at least the said information specific to the given terminal as an association key.
Volgens een bijzonder kenmerk van deze derde bijzondere implementatie omvat de genoemde voor de gegeven terminal specifieke informatie een uitgaand poortnummer voor de proxy waardoor de hit gaat.According to a special feature of this third particular implementation, the said information specific to the given terminal comprises an outbound port number for the proxy through which the hit goes.
In een andere uitvoeringsvorm van de uitvinding wordt een computerprogrammaproduct voorgesteld dat de programmainstructiecode omvat voor het inzetten van de eerder genoemde werkwijze (in om het even welke van de verschillende uitvoeringsvormen), wanneer het genoemde programma uitgevoerd wordt op een computer.In another embodiment of the invention, a computer program product is proposed that includes the program instruction code for deploying the aforementioned method (in any of the various embodiments) when said program is run on a computer.
In een andere uitvoeringsvorm van de uitvinding wordt een opslagmedium voorgesteld dat computerleesbaar en niet-transiënt is, waarop een computerprogramma opgeslagen is dat een instructieset omvat die uitvoerbaar is door een computer voor het inzetten van de eerder genoemde werkwijze (in om het even welke van de verschillende uitvoeringsvormen).In another embodiment of the invention, a storage medium is proposed that is computer readable and non-transient, on which is stored a computer program that includes an instruction set executable by a computer for deploying the aforementioned method (in any of the different embodiments).
In een andere uitvoeringsvorm van de uitvinding wordt een verzamelinrichting voorgesteld, ter gebruikersgerichte publieksmeting, van consumptieberichten, hits genaamd, die overgedragen worden naar een node voor sitegerichte publieksmeting door markers die uitgevoerd worden door terminals in panelhuishoudens. De verzamelinrichting is geconfigureerd en aangepast voor het: - verkrijgen van een verzameling van eerste registraties, gecreëerd door tenminste één tussenelement waardoor de hits gaan, waarbij iedere eerste registratie een afzonderlijke hit betreft en een identificatie van de terminal omvat die de hit verzonden heeft; - verkrijgen van een verzameling van tweede registraties, gecreëerd door de node, waarbij iedere tweede registratie een afzonderlijke hit betreft en tenminste één hitparameter omvat, en - toewijzen aan iedere tweede registratie van een terminalidentificatie, afgeleid ofwel uit een unieke eerste registratie ofwel uit meerdere eerste registraties die eenzelfde terminalidentificatie omvatten.In another embodiment of the invention, a collection device is proposed, for user-oriented audience measurement, of consumption messages, called hits, that are transmitted to a node for site-oriented audience measurement by markers performed by terminals in panel households. The collection device is configured and adapted to: - obtain a collection of first registrations created by at least one intermediate element through which the hits pass, each first registration being a separate hit and including an identification of the terminal that sent the hit; - obtaining a collection of second registrations created by the node, each second registration being a separate hit and comprising at least one hit parameter, and - assigning to each second registration a terminal identification, derived either from a unique first registration or from several first registrations that include the same terminal identification.
De verzamelinrichting omvat voordeligerwijze middelen voor het inzetten van de stappen die zij bewerkstelligt in de verzamelwerkwijze zoals eerder beschreven, in om het even welke van de verschillende uitvoerin gs vormen.The collection device advantageously comprises means for inserting the steps it accomplishes in the collection method as previously described, in any of the various embodiments.
5. LIJST VAN FIGUREN5. LIST OF FIGURES
Andere kenmerken en voordelen van de uitvinding verschijnen bij het lezen van de volgende beschrijving, gegeven als indicatief en niet-limitatief voorbeeld, en de bij gevoegde tekeningen, waarin: - figuur 1 het algemene principe illustreert van een verzamelwerkwijze volgens een eerste bijzondere uitvoeringsvorm van de uitvinding; - figuur 2 een overzicht presenteert van een systeem dat het inzetten mogelijk maakt van een verzamelwerkwij ze volgens de eerste bijzondere uitvoeringsvorm van de uitvinding; - figuur 3 een organigram presenteert van een verzamelwerkwijze volgens de eerste bijzondere uitvoeringsvorm van de uitvinding; - de figuren 4 tot 7 de verkrijgingsstap illustreren van koppels van eerste en tweede sessies weergegeven in figuur 3; - figuur 8 een overzicht presenteert van een systeem dat het inzetten mogelijk maakt van een verzamelwerkwijze volgens een tweede bijzondere uitvoeringsvorm van de uitvinding; - figuur 9 een organigram presenteert van een verzamelwerkwijze volgens de tweede bijzondere uitvoeringsvorm van de uitvinding; - figuur 10 de structuur presenteert van een verzamel in rich ting volgens een bijzondere uitvoeringsvorm van de uitvinding, en - figuur 11 een overzicht presenteert van een systeem dat het inzetten mogelijk maakt van een verzamelwerkwijze volgens een derde bijzondere uitvoeringsvorm van de uitvinding;Other features and advantages of the invention appear upon reading the following description, given as an indicative and non-limitative example, and the accompanying drawings, in which: - Figure 1 illustrates the general principle of a collection method according to a first particular embodiment of the invention. invention; figure 2 presents an overview of a system that makes it possible to use a collection method according to the first special embodiment of the invention; figure 3 presents an organization chart of a collection method according to the first special embodiment of the invention; - figures 4 to 7 illustrate the acquisition step of couples of first and second sessions shown in figure 3; figure 8 presents an overview of a system that makes it possible to use a collecting method according to a second special embodiment of the invention; figure 9 presents an organization chart of a collection method according to the second special embodiment of the invention; - figure 10 presents the structure of a collection device according to a special embodiment of the invention, and - figure 11 presents an overview of a system that makes it possible to use a collection method according to a third special embodiment of the invention;
6. GEDETAILLEERDE BESCHRIJVING6. DETAILED DESCRIPTION
Opgemerkt zij dat de tweede en derde implementaties van de voorgaande paragraaf (‘Uiteenzetting van de uitvinding’) overeenkomen met respectievelijk de derde en tweede uitvoeringsvorm van deze paragraaf.It is to be noted that the second and third implementations of the preceding paragraph ("Explanation of the invention") correspond to the third and second embodiments of this paragraph, respectively.
In alle figuren van het onderhavige document worden identieke elementen en stappen aangeduid met eenzelfde referentienummer.In all figures of the present document identical elements and steps are indicated with the same reference number.
Nu wordt, in samenhang met de figuren 1 tot 7, een verzamelwerkwijze gepresenteerd volgens een eerste bijzondere uitvoeringsvorm van de uitvinding.Now, in conjunction with Figures 1 to 7, a collection method is presented according to a first particular embodiment of the invention.
Zoals geïllustreerd in de figuren 1 en 2, beschouwe men een panelhuishouden 1, omvattende tenminste een terminal 2, 2a, 2b (computer, smartphone, tablet, connected tv, enz.) verbonden met een informatienetwerk (vaak het Internet) via een box 4 (ook ‘routermodem’ of ‘netwerkaansluitapparatuur’ genaamd) geleverd door een internetprovider. Slechts vanuit het oogpunt van vereenvoudiging is de box niet weergegeven in figuur 2.As illustrated in Figures 1 and 2, a panel household 1 is considered, comprising at least one terminal 2, 2a, 2b (computer, smartphone, tablet, connected TV, etc.) connected to an information network (often the Internet) via a box 4 (also called 'router modem' or 'network connection equipment') supplied by an internet provider. Only from the point of view of simplification is the box not shown in Figure 2.
Verondersteld wordt dat elke terminal deelneemt aan het inzetten van een sitegerichte (‘site-centric’) meting. Daartoe voert hij markers uit (geïntegreerd in webpagina’s of derdenapplicaties) die hits (consumptieberichten) overdragen naar een node voor sitegerichte publieksmeting 5. In het geval dat ze overgedragen worden door markers die samen werken met spelers (players), dan zijn in deze hits doorgaans als parameters opgenomen de status van de speler, de naam van de content, de tijdsindex van het afspelen en een identificatie van de visualisatiesessie (waarvan de benutting hierna wordt uitgewerkt).It is assumed that each terminal participates in the deployment of a site-oriented ("site-centric") measurement. To this end, he executes markers (integrated in web pages or third-party applications) that transfer hits (consumption messages) to a node for site-oriented audience measurement 5. In the case that they are transferred by markers that work together with players, these hits usually include recorded as parameters are the status of the player, the name of the content, the time index of the playback and an identification of the visualization session (the exploitation of which will be worked out below).
Iedere marker bevindt zich bijvoorbeeld in een webpagina die uitgevoerd wordt door een browser, die zelf uitgevoerd wordt door de terminal. In een variant bevindt iedere marker zich in een derdenapplicatie, die zelf uitgevoerd wordt door de terminal.For example, each marker is located in a web page that is executed by a browser, which is itself executed by the terminal. In a variant, each marker is in a third-party application, which itself is executed by the terminal.
Eveneens wordt verondersteld dat men deze hits (hierin inbegrepen de parameters die erin zijn opgenomen) wil benutten om een gebruikersgerichte (‘user-centric’) meting in te zetten. Hiertoe is, in deze eerste bijzondere uitvoeringsvorm geïllustreerd in de figuren 1 en 2, het panelhuishouden 1 uitgerust met onder andere een router 3. Elke terminal van het huishouden is verbonden met de router 3, die zelf verbonden is met de box 4. De router 3 kan aldus het erdoor gaande internetverkeer loggen van elke terminal 2, 2a, 2b van het huishouden.It is also assumed that people want to use these hits (including the parameters included in this) to use a user-oriented ("user-centric") measurement. To this end, in this first particular embodiment illustrated in Figures 1 and 2, the panel household 1 is equipped with, inter alia, a router 3. Each terminal of the household is connected to the router 3, which itself is connected to the box 4. The router 3 can thus log the ongoing internet traffic from each terminal 2, 2a, 2b of the household.
In deze eerste bijzondere uitvoeringsvorm maakt de voorgestelde techniek het mogelijk om de hits en de parameters daarin te verzamelen, ongeacht de aard (beveiligd of niet) van de tussen de terminal 2 en de node 5 opgezette verbinding 6.In this first particular embodiment, the proposed technique makes it possible to collect the hits and the parameters therein, regardless of the nature (secured or not) of the connection 6 established between the terminal 2 and the node 5.
In het geval dat de verbinding tussen de terminal 2 en de node 5 beveiligd is (bijvoorbeeld volgens het HTTPS-communicatieprotocol), waarbij de router 3 voor iedere hit middenin deze HTTPS-verbinding geplaatst is, dan creëert de router een registratie (ook ‘log’ genaamd) die niet anders is dan een netwerktrace omvattende de domeinnaam waarnaar de hit verzonden is en een identificatie van de terminal die de hit verzonden heeft. Elke terminal die verbonden is met de router wordt vaak geïdentificeerd door een unieke verbindingsidentificatie (bijvoorbeeld zijn MAC-adres of zijn lokale IP-adres op het lokale netwerk (LAN) van het huishouden), waardoor de router het internetverkeer van elke terminal afzonderlijk kan loggen. In figuur 2 zijn de logs behorend bij de door de terminal A (referentie 2a) overgedragen hits aangeduid met 21a en de logs behorend bij de door terminal B (referentie 2b) overgedragen hits aangeduid met 21b.In the event that the connection between the terminal 2 and the node 5 is secured (for example according to the HTTPS communication protocol), where the router 3 is placed in the middle of this HTTPS connection for each hit, then the router creates a log (also log) ') that is no different than a network trace comprising the domain name to which the hit was sent and an identification of the terminal that sent the hit. Each terminal connected to the router is often identified by a unique connection identifier (for example, its MAC address or its local IP address on the local network (LAN) of the household), allowing the router to log the internet traffic of each terminal separately . In Figure 2, the logs associated with the hits transmitted by the terminal A (reference 2a) are designated 21a and the logs associated with the hits transmitted through the terminal B (reference 2b) are designated 21b.
Maar ieder door de router gecreëerd hitlog omvat geen van de in de hit opgenomen parameters. Bijvoorbeeld, voor hits die overgedragen worden door markers die samenwerken met afspeelinrichtingen (players), registreert de router niet de volgende parameters: de status van de speler, de naam van de content, de tijdsindex van het afspelen en de identificatie van de visualisatiesessie. De door de router gecreëerde hitlogs 21a, 21b zijn dus op zichzelf niet benutbaar voor het bewerkstelligen van een ‘user-centric’ meting.But every hitlog created by the router does not include any of the parameters included in the hit. For example, for hits transmitted by markers that interact with playback devices (players), the router does not record the following parameters: the status of the player, the name of the content, the time index of playback, and the identification of the visualization session. The hit logs 21a, 21b created by the router are therefore not in themselves usable for effecting a "user-centric" measurement.
Het algemene principe van de verzamelwerkwijze volgens de eerste uitvoeringsvorm bestaat uit het opzoeken van de hitparameters rechtstreeks in de registraties (logs) 22 van de site-centric meetnode 5. Hiertoe is het mogelijk om het publieke IP-adres (netwerkadres) van het huishouden te gebruiken als associatiesleutel, omdat de meetnode het (publieke) bron-IP-adres van de hits logt. Met andere woorden, het door de node 5 gecreëerde log en het door de router 3 gecreëerde log omvatten voor iedere hit elk het publieke IP-adres van de router die deze hit verzonden heeft.The general principle of the collection method according to the first embodiment consists of looking up the hit parameters directly in the records (logs) 22 of the site-centric measurement node 5. To this end, it is possible to determine the public IP address (network address) of the household as an association key, because the measurement node logs the (public) source IP address of the hits. In other words, the log created by the node 5 and the log created by the router 3 each include the public IP address of the router that sent this hit for each hit.
De router 3 kan bijvoorbeeld een webservice 8 zoals ‘http://www.whatismyip.com/’ raadplegen om zijn publieke IP-adres te kennen, dat is het adres van de box 4 van het huishouden 1 (ook ‘IP-adres van het huishouden’ genaamd). Deze raadpleging wordt gesymboliseerd door de pijl met referentie 9 in figuur 2.For example, the router 3 can consult a web service 8 such as "http://www.whatismyip.com/" to know its public IP address, that is the address of the box 4 of the household 1 (also "IP address of called the household). This consultation is symbolized by the arrow with reference 9 in figure 2.
Zodra het IP-adres bekend is en door de router 3 geregistreerd is, dan verzendt de router het adres naar een verzamelinrichting 20 (deze overdracht wordt gesymboliseerd door de pijl met referentie 10 in figuur 2). Aldus kan de verzamelinrichting 20 achteraf de logs 22 van de meetnode 5 ophalen die betrekking hebben op de hits (met hun parameters) verzonden vanaf dit IP-adres. Dit ophalen is in figuur 1 gesymboliseerd met de pijl met referentie 7. Overigens ontvangt de verzamelinrichting 20 de hitlogs 21a, 21b gecreëerd door de router 3.As soon as the IP address is known and registered by the router 3, the router sends the address to a collection device 20 (this transfer is symbolized by the arrow with reference 10 in Figure 2). Thus, the collecting device 20 can afterwards retrieve the logs 22 of the measuring node 5 relating to the hits (with their parameters) sent from this IP address. This retrieval is symbolized in Figure 1 with the arrow with reference 7. Incidentally, the collecting device 20 receives the hit logs 21a, 21b created by the router 3.
Maar alle terminals in een huishouden hebben hetzelfde publieke IP-adres (dat van de box 4 van het huishouden), waardoor de verzamelinrichting 20 de hitlogs 21a, 21b gecreëerd door de router 3 niet direct kan toewijzen aan de hitlogs 22 gecreëerd door de meetnode 5. Met andere woorden, het gebruik van het publieke IP-adres van het huishouden als associatiesleutel volstaat niet. Het maakt het wel mogelijk om een subverzameling van hitlogs gecreëerd door de router 3 en een subverzameling van hitlogs gecreëerd door de meetnode 5 te verkrijgen.But all terminals in a household have the same public IP address (that of the box 4 of the household), as a result of which the collecting device 20 cannot directly assign the hit logs 21a, 21b created by the router 3 to the hit logs 22 created by the measurement node 5 In other words, the use of the public IP address of the household as an association key is not sufficient. It does, however, make it possible to obtain a subset of hit logs created by the router 3 and a subset of hit logs created by the measurement node 5.
Maar het maakt het niet mogelijk om een hitlog gecreëerd door de router 3 (dit log omvattende een identificatie van de terminal die de hit verzonden heeft, bijvoorbeeld zijn MAC-adres) toe te wijzen aan ieder hitlog gecreëerd door de meetnode 5.But it does not make it possible to assign a hitlog created by the router 3 (this log comprising an identification of the terminal that sent the hit, for example its MAC address) to every hitlog created by the measurement node 5.
Anders gezegd maakt het het de verzamelinrichting 20 niet mogelijk om aan iedere hitlog gecreëerd door de meetnode 5 de identificatie te associëren van de terminal die deze hit verzonden heeft. Echter, dit is in het kader van een gebruikersgerichte publieksmeting noodzakelijk, enerzijds om de identiteit van de op deze terminal aangemelde perso(o)n(en) te kennen en anderzijds om het type terminal te kennen. In het kader van een gebruikersgerichte publieksmeting wordt in het algemeen aan de gebruiker van de terminal gevraagd om zich aan te melden door zijn voornaam te selecteren uit een lijst van personen in het huishouden. Deze informatie (aanmelding) wordt dan gekoppeld aan het verkeer van de terminal (ofwel in de router, ofwel op het niveau van de backoffice), teneinde het publiek te kwalificeren met sociaaldemografische gegevens.In other words, it does not allow the collecting device 20 to associate to every hit log created by the measurement node 5 the identification of the terminal that sent this hit. However, this is necessary in the context of a user-oriented audience measurement, on the one hand to know the identity of the person (s) registered at this terminal and on the other hand to know the type of terminal. In the context of a user-oriented audience measurement, the user of the terminal is generally asked to log in by selecting his first name from a list of persons in the household. This information (registration) is then linked to the traffic of the terminal (either in the router or at the back office level), in order to qualify the public with socio-demographic data.
Teneinde het de verzamelinrichting 20 mogelijk te maken om met elke hitlog gecreëerd door de meetnode 5 de identificatie van de terminal die de hit verzonden heeft te associëren, bestaat een oplossing voorgesteld in de eerste bijzondere uitvoeringsvorm van de uitvinding uit het reconstitueren van visualisatiesessies van de kant van de router 3 en ze nader tot berekende visualisatiesessies van de kant van de meetnode 5 te brengen. Deze nadering tussen visualisatiesessies (ook comsumptiesessies genaamd) wordt bijvoorbeeld bewerkstelligd op basis van de de meest nabije begin- en eindtijden van sessies.In order to enable the collecting device 20 to associate with each hit log created by the measurement node 5 the identification of the terminal that sent the hit, a solution proposed in the first particular embodiment of the invention consists of reconstituting visualization sessions from the side of the router 3 and bring them closer to calculated visualization sessions on the part of the measuring node 5. This approach between visualization sessions (also called comsumption sessions) is achieved, for example, on the basis of the closest start and end times of sessions.
Figuur 3 presenteert een organigram van de verzamel werkwijze volgens de eerste bijzondere uitvoeringsvorm van de uitvinding, inclusief de eerder genoemde oplossing met nadering van visualisatiesessies (verder simpelweg ook ‘sessies’ genaamd). De verzamelinrichting 20 bewerkstelligt deze werkwijze voor ieder panelhuishouden uitgerust met een router.Figure 3 presents an organization chart of the collection method according to the first particular embodiment of the invention, including the aforementioned solution with the approach of visualization sessions (hereinafter also simply referred to as "sessions"). The collecting device 20 accomplishes this method for each panel household equipped with a router.
In een stap 31 verkrijgt de verzamelinrichting 20 de eerste hitlogs, gecreëerd door de router 3 met daarin het IP-adres van het huishouden.In a step 31, the collection device 20 obtains the first hit logs created by the router 3 containing the IP address of the household.
In een stap 32 verkrijgt de verzamelinrichting 20 de tweede hitlogs, gecreëerd door de meetnode 5 met eveneens daarin het IP-adres van het huishouden.In a step 32, the collecting device 20 obtains the second hit logs created by the measuring node 5, which also contains the IP address of the household.
In een stap 33 stelt de verzamelinrichting 20 de eerste sessies vast, waarin gegroepeerd zijn, uitgaande van het resultaat van stap 31 en dankzij de in iedere eerste hitlog opgenomen terminalidentificatie, eerste hitlogs behorend bij een consumptie van eenzelfde content door eenzelfde terminal;In a step 33, the collecting device 20 determines the first sessions in which are grouped, starting from the result of step 31 and, thanks to the terminal identification included in each first hit log, first hit logs associated with a consumption of the same content by the same terminal;
In een stap 34 stelt de verzamelinrichting 20 de tweede sessies vast, waarin gegroepeerd zijn, uitgaande van het resultaat van stap 32 en dankzij een in iedere tweede hitlog opgenomen sessie-identificatie, tweede hitlogs behorend bij een consumptie van eenzelfde content door eenzelfde terminal;In a step 34, the collecting device 20 determines the second sessions in which are grouped, starting from the result of step 32 and thanks to a session identification included in each second hit log, second hit logs associated with a consumption of the same content by the same terminal;
In een stap 35 verkrijgt de verzamelinrichting 20 koppels van eerste en tweede sessies, door toewijzing van een eerste sessie aan iedere tweede sessie, door de begintijden van de tweede sessies met de begintijden van de eerste sessies te vergelijken, evenals (in een bijzondere inzet) de eindtijden van de tweede sessies met de eindtijden van de eerste sessies.In a step 35, the collecting device 20 obtains pairs of first and second sessions, by assigning a first session to every second session, by comparing the start times of the second sessions with the start times of the first sessions, as well as (in a special bet) the end times of the second sessions with the end times of the first sessions.
In een stap 36 wijst de verzamelinrichting 20, voor ieder koppel van eerste en tweede sessies, aan iedere tweede hitlog van de tweede sessie van het koppel de terminalidentificatie toe die gemeenschappelijk is voor alle eerste hitlogs van de eerste sessie van het koppel.In a step 36, for each pair of first and second sessions, the collecting device 20 assigns to each second hit log of the second session of the pair the terminal identification that is common to all first hit logs of the first session of the pair.
Daardoor kan het beoogde doel bereikt worden: de identiteit kennen van de gebruiker(s) en het type terminal die/dat de content geconsumeerd heeft waarop betrekking hebben het koppel omvattende deze tweede sessie en de eerste sessie die daaraan is toegewezen.Thereby the intended goal can be achieved: knowing the identity of the user (s) and the type of terminal that has consumed the content to which the couple comprising this second session and the first session assigned to it relate.
De figuren 4 tot 7 illustreren de eerder genoemde verkrijgingsstap van koppels van eerste en tweede sessies, weergegeven met 35 in figuur 3.Figures 4 to 7 illustrate the aforementioned acquisition step of couples of first and second sessions, represented by 35 in Figure 3.
Hoewel er meerdere afzonderlijke technologieën van Web Analytics bestaan, gebruikt iedere technologie doorgaans een concept van een unieke sessie-identificatie om alle hits te groeperen (en dus alle overeenkomstige hitlogs) in een enkele en unieke visualisatiesessie.Although there are several separate technologies of Web Analytics, each technology generally uses a concept of unique session identification to group all hits (and therefore all corresponding hit logs) in a single and unique visualization session.
Voor de hitlogs gecreëerd door de meetnode 5 kan men dus een visualisatiesessie identificeren dankzij de unieke sessie-identificatie meegevoerd door de gelogde hitparameters. Aldus kent met met zekerheid de begintijd en de duur van de sessie dankzij de tijden van de eerste en de laatste hit.For the hit logs created by the measurement node 5, one can therefore identify a visualization session thanks to the unique session identification carried by the logged hit parameters. Thus knows with certainty the start time and the duration of the session thanks to the times of the first and the last hit.
Voor de hitlogs gecreëerd door de router 3 is de informatie voor iedere HTTPS-hit beperkt tot het tijdstip van verzending, omdat geen van de door de hit meegevoerde parameters leesbaar is door de router. Toch heeft de router, dankzij de unieke identificatie van de verbinding (bijvoorbeeld het MAC-adres), de mogelijkheid om afzonderlijk de HTTPS-hits te loggen die door iedere terminal verzonden zijn. Aldus leidt de gelijktijdige consumptie van eenzelfde videocontent door twee terminals in het huishouden tot twee afzonderlijke verzamelingen van hitlogs. Hoewel er meerdere afzonderlijke technologieën van Web Analytics bestaan, verzendt het merendeel van de overeenkomstige markers periodiek hits (bijvoorbeeld iedere 60 seconden in nominale modus voor de technologie ‘eStat streaming’ van Médiamétrie) om aan te duiden dat de speler (player) nog steeds aan het afspelen is. Ook kunnen hits verzonden worden om acties (bijvoorbeeld pauze/afspelen/stop/overslaan/...) op de videostream aan te duiden. Onder deze omstandigheden kan men het waarschijnlijke einde van een sessie detecteren door het ontbreken van een hit tijdens de nominale periode (60 s in het geval van de ‘eStat streaming’ marker).For the hit logs created by the router 3, the information for each HTTPS hit is limited to the time of transmission, because none of the parameters carried by the hit can be read by the router. However, thanks to the unique identification of the connection (for example the MAC address), the router has the option of separately logging the HTTPS hits sent by each terminal. Thus, the simultaneous consumption of the same video content by two terminals in the household leads to two separate sets of hit logs. Although there are several separate Web Analytics technologies, the majority of corresponding markers periodically send hits (for example, every 60 seconds in nominal mode for Médiamétrie's eStat streaming technology) to indicate that the player (player) is still on is playing. Hits can also be sent to indicate actions (for example pause / play / stop / skip / ...) on the video stream. Under these circumstances, the likely end of a session can be detected by the absence of a hit during the nominal period (60 s in the case of the "eStat streaming" marker).
Voor een gegeven huishouden met een bekend IP-adres illustreert figuur 4 de nadering van tweede sessies (de tweede hitlogs gecreëerd door de meetnode 5 groeperend) tot de eerste sessies (de eerste hitlogs gecreëerd door de router 3 groeperend). In dit voorbeeld zijn de eerste sessies met referenties Sr/A,i en Sr/A,2 (elk groeperend de eerste hitlogs overgedragen door de terminal A) toegewezen aan respectievelijk de tweede sessie met referentie Sn,3 en de tweede sessie met referentie Sn,3. De eerste sessie met referentie Sr/B,i (elk groeperend de eerste hitlogs overgedragen door de terminal B) wordt toegewezen aan de tweede sessie met referentie Sn,2.For a given household with a known IP address, Figure 4 illustrates the approach of second sessions (grouping the second hit logs created by the measurement node 5) to the first sessions (grouping the first hit logs created by the router 3). In this example, the first sessions with references Sr / A, i and Sr / A, 2 (each grouping the first hit logs transmitted by the terminal A) are assigned to the second session with reference Sn, 3 and the second session with reference Sn, respectively , 3. The first session with reference Sr / B1 (each grouping the first hit logs transmitted by the terminal B) is assigned to the second session with reference Sn1.
Meer nauwkeurig, zoals geïllustreerd in figuur 5, voor een eerste sessie die de eerste hitlogs gecreëerd door de router groepeert (in dit voorbeeld met de referentie Sr/B,i), berekent de verzamelinrichting 20 de tijdsafstand tussen de begintijd van deze eerste sessie en de begintijd van ieder van de nabijgelegen tweede sessies (de tweede hitlogs gecreëerd door de meetnode groeperend) en behoudt de tweede sessie waarvoor de tijdsafstand het kleinst is. In het geïllustreerde voorbeeld is van de tijdsafstanden Dl, D2 en D3 de kleinste D2, dus wordt de eerste sessie met referentie Sr/B,i toegewezen aan de tweede sessie met referentie Sn,2.More accurately, as illustrated in Figure 5, for a first session that groups the first hit logs created by the router (in this example with the reference Sr / B, i), the collector 20 calculates the time distance between the start time of this first session and the start time of each of the nearby second sessions (grouping the second hit logs created by the measurement node) and retaining the second session for which the time distance is smallest. In the illustrated example, of the time distances D1, D2 and D3, the smallest is D2, so the first session with reference Sr / B1 is assigned to the second session with reference Sn1.
Zoals geïllustreerd in figuur 6 wordt dezelfde vergelijking bewerkstelligd met de eindtijd om te verifiëren dat de eindtijd van de tweede behouden sessie (Sn,2 in dit voorbeeld) eveneens overeenkomt met de kortste van de tijdsafstanden tussen de eindtijd van de eerste sessie en de eindtijden van de nabijgelegen tweede sessies. In het geïllustreerde voorbeeld is het geverifieerd omdat van de tijdsafstanden Dl’, D2’ en D3’ de kleinste D2’ is.As illustrated in Figure 6, the same comparison is made with the end time to verify that the end time of the second session preserved (Sn, 2 in this example) also corresponds to the shortest of the time distances between the end time of the first session and the end times of the nearby second sessions. In the illustrated example, it is verified because of the time distances D1 ", D2" and D3 "is the smallest D2".
Figuur 7 illustreert het geval waarin een terminal (in dit voorbeeld terminal A) twee visualisatiesessies aaneensluit in een zeer korte tijd, korter dan de periode van verzending van hits door de marker. De twee eerste sessies met referentie Sr/A,i en Sr/A,2 in de figuren 4 tot 6 worden geaggregeerd in een enkele eerste sessie met referentie S’r/A,i in figuur 7. Dit creëert een incoherentie voor de toewijzing: door de vergelijking van de begintijden van de sessie, zal de eerste sessie met referentie S’r/A,i toegewezen worden aan de tweede sessie met referentie Sn,i; maar de vergelijking van de eindtijden van de sessie zal leiden tot toewijzing aan de tweede sessie met referentie Sn,3. De voorgestelde oplossing in dit geval bestaat uit toewijzen van de eerste sessie met referentie S’r/A,i (en dus terminal A) aan twee tweede sessies met referenties Sn,i en Sn,3. Met andere woorden worden aldus twee sessiekoppels gevormd: (S’r/A,i, Sn,i) en (S’r/A,i,Figure 7 illustrates the case where a terminal (in this example terminal A) connects two visualization sessions in a very short time, shorter than the period of transmission of hits by the marker. The two first sessions with reference Sr / A, i and Sr / A, 2 in figures 4 to 6 are aggregated into a single first session with reference Sr / A, i in figure 7. This creates an inconsistency for the allocation : by comparing the start times of the session, the first session with reference S'r / A, i will be assigned to the second session with reference Sn, i; but the comparison of the end times of the session will lead to assignment to the second session with reference Sn, 3. The proposed solution in this case consists of assigning the first session with reference S'r / A, i (and therefore terminal A) to two second sessions with references Sn, i and Sn, 3. In other words, two session couples are thus formed: (S'r / A, i, Sn, i) and (S’r / A, i,
Sn,3). Aldus, na afloop van stap 36 gebruikmakend van elk van deze koppels, bereikt men het beoogde doel: de identiteit van de gebruiker(s) en het type terminal kennen die/dat de tweede sessies met referentie Sn,i en Sn,3 geconsumeerd hebben, gelogd door de meetnode.Sn, 3). Thus, after the completion of step 36 using each of these couples, one achieves the intended purpose: to know the identity of the user (s) and the type of terminal who have consumed the second sessions with reference Sn, i and Sn, 3 , logged by the measurement node.
Nu wordt, in samenhang met de figuren 8 en 9, een verzamel werkwijze gepresenteerd volgens een tweede bijzondere uitvoeringsvorm van de uitvinding.Now, in conjunction with Figures 8 and 9, a collection method is presented according to a second particular embodiment of the invention.
Zoals geïllustreerd in figuur 8 onderscheidt deze tweede uitvoeringsvorm zich van de eerste (hierboven beschreven) doordat de netwerkapparatuur waarmee de eerste hitlogs verkregen kan worden (dat wil zeggen loggen van het internetverkeer van terminals van huishoudens van panelleden) niet een router (voor ieder huishouden) is, maar een proxy 82.As illustrated in Figure 8, this second embodiment differs from the first (described above) in that the network equipment with which the first hit logs can be obtained (i.e. logging the internet traffic from terminals of households of panel members) is not a router (for every household) is but a proxy 82.
In figuur 8 zijn van de logs gecreëerd door de proxy 82, de logs behorend bij de door de terminal A (referentie 2a) overgedragen hits aangeduid met 81a en de logs behorend bij de door terminal B (referentie 2B) overgedragen hits aangeduid met 81b.In Figure 8, of the logs created by the proxy 82, the logs associated with the hits transmitted by the terminal A (reference 2a) are designated 81a and the logs associated with the hits transmitted through the terminal B (reference 2B) are designated 81b.
De terminals van eenzelfde huishouden gaan door dezelfde proxy, hetzij gebruikmakend van afzonderlijke ingaande poorten, individueel aan iedere terminal toegewezen, hetzij gebruikmakend van een gemeenschappelijke poort voor alle terminals van het huishouden (of het panel), maar met afzonderlijke login en wachtwoord om ze te onderscheiden (in het geval van een proxy met authenticatie). In alle gevallen is de proxy dus in staat om de terminals van een huishouden gescheiden te loggen. Met andere woorden omvat iedere hitlog gecreëerd door de proxy 82 een identificatie van de terminal die de hit verzonden heeft.The terminals of the same household go through the same proxy, either using separate input ports, individually assigned to each terminal, or using a common port for all household terminals (or the panel), but with a separate login and password to enable them. distinguished (in the case of a proxy with authentication). In all cases, the proxy is therefore able to log the terminals of a household separately. In other words, each hit log created by the proxy 82 includes an identification of the terminal that sent the hit.
In het geval dat de verbinding tussen de terminal 2 en de node 5 beveiligd is (bijvoorbeeld volgens het HTTPS-communicatieprotocol), waarbij de proxy 82 voor iedere hit middenin deze HTTPS-verbinding geplaatst is, dan creëert de proxy een hitlog die niet anders is dan een netwerktrace omvattende de domeinnaam waarnaar de hit verzonden is en een identificatie van de terminal die de hit verzonden heeft. Maar dit door de proxy gecreëerde hitlog omvat geen van de in de hit opgenomen parameters.In case the connection between the terminal 2 and the node 5 is secured (for example according to the HTTPS communication protocol), where the proxy 82 is placed in the middle of this HTTPS connection for each hit, the proxy creates a hitlog that is no different then a network trace comprising the domain name to which the hit was sent and an identification of the terminal that sent the hit. But this hitlog created by the proxy does not include any of the parameters included in the hit.
Het bron-IP-adres van de gelogde hits op de meetnode is altijd dat van de proxy 82. Er moet een andere associatiesleutel gebruikt worden, zoals bijvoorbeeld de uitgaande proxypoort van de verbinding naar de meetnode (ook ‘bronpoort’ genaamd), waardoor de verschillende terminals die uit de proxy komen onderscheiden kunnen worden.The source IP address of the logged hits on the measurement node is always that of the proxy 82. A different association key must be used, such as, for example, the outgoing proxy port from the connection to the measurement node (also called 'source port'), which means different terminals that come out of the proxy can be distinguished.
Opgemerkt zij dat om op de proxy 82 hetzelfde toewijzingsmechanisme toe te passen als op de router 3 (in de eerste uitvoeringsvorm), bedacht moet worden dat de proxy alle terminals achter hetzelfde proxy-IP-adres maskeert, net zoals alle terminals van een huishouden gemaskeerd worden achter hetzelfde IP-adres van het huishouden. Het grootste verschil is dat achter de proxy duizenden terminals schuilgaan, terwijl er achter de router slechts enkele schuilgaan. Aldus heeft de toewijzing op basis van waarschijnlijk begin/einde van de sessies weinig kans om doelmatig te functioneren indien er sprake is van duizenden terminals.It is to be noted that in order to apply the same allocation mechanism to the proxy 82 as to the router 3 (in the first embodiment), it must be borne in mind that the proxy masks all terminals behind the same proxy IP address, just as all the terminals of a household are masked after the same IP address of the household. The biggest difference is that thousands of terminals are hidden behind the proxy, while only a few are hidden behind the router. Thus, the allocation based on the probable start / end of the sessions has little chance of functioning effectively if there are thousands of terminals.
De uitgaande poort van de proxy is een voor de terminal specifieke informatie, tenminste tijdens overdracht van de hit. Meer nauwkeurig is, in een eerste implementatie, de informatie slechts op tijdelijke wijze specifiek voor de terminal. Met andere woorden, de uitgaande poorten van de proxy worden dynamisch opnieuw toegekend. Een uitgaande poort van de proxy wordt slechts toegewezen (en is dus slechts specifiek) voor een gegeven terminal gedurende een beperkte tijdsperiode. In een variant is de specifieke informatie invariabel in de tijd (alle door een gegeven terminal verzonden hits gebruiken dezelfde uitgaande poort van de proxy, die specifiek is voor de gegeven terminal). Voor deze variant is het noodzakelijk om te beschikken over een groter aantal uitgaande poorten van de proxy en/of om een kleiner aantal terminals af te handelen.The outbound port of the proxy is information specific to the terminal, at least during the transfer of the hit. More accurately, in a first implementation, the information is only specific to the terminal in a temporary manner. In other words, the outgoing ports of the proxy are dynamically reassigned. An outbound port of the proxy is only assigned (and therefore only specific) for a given terminal for a limited period of time. In a variant, the specific information is invariable in time (all hits sent by a given terminal use the same outbound port of the proxy, which is specific to the given terminal). For this variant it is necessary to have a larger number of outgoing ports of the proxy and / or to handle a smaller number of terminals.
In de tweede uitvoeringsvorm moet de proxy 82, voor iedere hit, het uitgaande poortnummer van de proxy ophalen en loggen. Met andere woorden, voor iedere hit omvat het eerste log van deze hit gecreëerd door de proxy 82 het uitgaande poortnummer van de proxy waardoor de hit gaat om de meetnode te bereiken.In the second embodiment, for each hit, the proxy 82 must retrieve and log the proxy's outbound port number. In other words, for each hit, the first log of this hit created by the proxy 82 includes the outbound port number of the proxy through which the hit goes to reach the measurement node.
De meetnode doet hetzelfde. Hij moet het uitgaande poortnummer van de proxy ophalen en loggen. Met andere woorden, voor iedere hit omvat het tweede log van de hit gecreëerd door de meetnode 5 het uitgaande poortnummer van de proxy waardoor de hit gaat om de meetnode te bereiken.The measurement node does the same. He must retrieve and log the proxy outbound port number. In other words, for each hit, the second log of the hit created by the measurement node 5 includes the outbound port number of the proxy through which the hit goes to reach the measurement node.
Aldus kan de verzamelinrichting 20 de eerste hitlogs 81a, 81b gecreëerd door de proxy en de tweede hitlogs 22 gecreëerd door de meetnode nader tot elkaar brengen. In het geval dat de uitgaande poorten van de proxy dynamisch opnieuw toegekend worden, is deze nadering niet alleen gebaseerd op het uitgaande poortnummer van de proxy (inbegrepen in zowel de eerste als de tweede hitlogs), maar eveneens op het moment van overdracht van iedere hit (zowel de eerste als de tweede hitlogs zijn getij dstempeld).Thus, the collecting device 20 can bring the first hit logs 81a, 81b created by the proxy and the second hit logs 22 created by the measurement node closer together. In the event that the outbound ports of the proxy are dynamically reassigned, this approach is not only based on the outbound port number of the proxy (included in both the first and second hit logs), but also at the time of transfer of each hit (both the first and the second hit logs are time stamped).
Figuur 9 presenteert een organigram van een verzamelwerkwijze volgens de tweede bijzondere uitvoeringsvorm van de uitvinding.Figure 9 presents an organization chart of a collection method according to the second particular embodiment of the invention.
In een stap 91 verkrijgt de verzamelinrichting 80 de eerste hitlogs, gecreëerd door de proxy 82 met daarin telkens een uitgaand poortnummer van de proxy (informatie ingevoegd door de proxy en specifiek voor de terminal die de hit overgedragen heeft) en tijdstempelinformatie (in hoofdzaak overeenkomend met het moment van overdracht van de hit tussen de proxy en de node).In a step 91, the gatherer 80 obtains the first hit logs created by the proxy 82 with in each case an outbound port number of the proxy (information inserted by the proxy and specifically for the terminal that transmitted the hit) and time stamp information (substantially corresponding to the time of transfer of the hit between the proxy and the node).
In een stap 92 verkrijgt de verzamelinrichting 80 de tweede hitlogs, gecreëerd door de meetnode 5 met daarin eveneens telkens een uitgaand poortnummer van de proxy (informatie ingevoegd door de meetnode en specifiek voor de terminal die de hit overgedragen heeft) en tijdstempelinformatie (in hoofdzaak overeenkomend met het moment van overdracht van de hit tussen de proxy en de node).In a step 92, the collecting device 80 obtains the second hit logs, created by the measurement node 5, which also contains in each case an outbound port number of the proxy (information inserted by the measurement node and specifically for the terminal that transmitted the hit) and time stamp information (substantially corresponding with the moment of transfer of the hit between the proxy and the node).
In een stap 93 wijst de verzamelinrichting 80 een eerste hitlog (en dus de terminalidentificatie daarin) toe aan iedere tweede hitlog, gebruikmakend van het uitgaande poortnummer van de proxy als associatiesleutel (in combinatie met de tijdstempelinformatie in de hitlogs, in het geval van een dynamische hernieuwde toekenning van uitgaande poorten van de proxy). Daardoor kan het beoogde doel bereikt worden: associëren van de parameters opgenomen in het tweede hitlog met de terminal die de hit overgedragen heeft, waardoor de identiteit van de gebruiker(s) en het type terminal dat de content geconsumeerd heeft gekend kan worden.In a step 93, the gatherer 80 assigns a first hit log (and thus the terminal identification therein) to every second hit log, using the outbound port number of the proxy as an association key (in combination with the timestamp information in the hit logs, in the case of a dynamic reassignment of outbound ports of the proxy). Thereby the intended goal can be achieved: associating the parameters included in the second hit log with the terminal that transmitted the hit, whereby the identity of the user (s) and the type of terminal that consumed the content can be known.
Nu wordt, in samenhang met figuur 11, een verzamelwerkwijze gepresenteerd volgens een derde bijzondere uitvoeringsvorm van de uitvinding.Now, in conjunction with Figure 11, a collection method according to a third particular embodiment of the invention is presented.
Deze derde uitvoeringsvorm onderscheidt zich van de eerste (hierboven beschreven met de figuren 1 tot 7) doordat het tussenelement dat het mogelijk maakt om de eerste hitlogs te verkrijgen (dat wil zeggen het internetverkeer loggen van de terminals van huishoudens van panelleden) niet de router 3 van het huishouden is, maar een interne proxy binnen iedere terminal, in het vervolg ‘lokale proxy’ genaamd.This third embodiment differs from the first (described above with figures 1 to 7) in that the intermediate element that makes it possible to obtain the first hit logs (i.e. log the internet traffic from the terminals of households of panel members) is not the router 3 of the household, but an internal proxy within each terminal, hereafter called 'local proxy'.
Meer nauwkeurig omvat iedere terminal 2a’, 2b’ van het huishouden: • een applicatie 2aA, 2aB waarvan men het internetverkeer wil meten. Deze applicatie is bijvoorbeeld een internetbrowser die webpagina’s uitvoert met markers daarin of een derdenapplicatie met markers daarin.More precisely, each terminal 2a ", 2b" of the household comprises: • an application 2aA, 2aB whose internet traffic is to be measured. This application is, for example, an internet browser that executes web pages with markers therein or a third-party application with markers therein.
De markers dragen, wanneer ze uitgevoerd worden, hits (consumptieberichten) over naar de node voor sitegerichte publieksmeting 5; • een ‘meetapplicatie’ 2bA, 2bB (zie definitie hierboven), die als achtergrondtaak functioneert en een lokale proxy 2ca, 2cb installeert (ook ‘procesproxy’ genaamd) op de terminal.The markers, when executed, transfer hits (consumption messages) to the node for site-oriented audience measurement 5; • a "measurement application" 2bA, 2bB (see definition above), which functions as a background task and installs a local proxy 2ca, 2cb (also called "process proxy") on the terminal.
In het geval dat de verbinding tussen een terminal 2a’, 2b’ (meer nauwkeurig een applicatie 2aA, 2aB waarvan men het verkeer wil meten) en de node 5 beveiligd is (bijvoorbeeld volgens het HTTPS-communicatieprotocol), waarbij de lokale proxy 2ca, 2cb voor iedere hit middenin deze HTTPS-verbinding geplaatst is, dan creëert de proxy een registratie (ook ‘log’ genaamd) die niet anders is dan een netwerktrace omvattende de domeinnaam waarnaar de hit verzonden is en een identificatie van de terminal die de hit verzonden heeft (bijvoorbeeld zijn MAC-adres). In figuur 11 zijn de logs behorend bij de door de terminal A (referentie 2a’) overgedragen hits aangeduid met 21a’ en de logs behorend bij de door terminal B (referentie 2 b’) overgedragen hits aangeduid met 21b’.In the case that the connection between a terminal 2a ', 2b' (more precisely an application 2aA, 2aB whose traffic is to be measured) and the node 5 is secured (for example according to the HTTPS communication protocol), wherein the local proxy 2ca, 2cb for every hit placed in the middle of this HTTPS connection, the proxy creates a registration (also called 'log') that is no different than a network trace including the domain name to which the hit was sent and an identification of the terminal that sent the hit has (for example his MAC address). In Fig. 11, the logs associated with the hits transmitted by the terminal A (reference 2a ") are indicated by 21a" and the logs associated with the hits transmitted by terminal B (reference 2b ") are indicated by 21b".
Maar elk door de lokale proxy 2ca, 2cb gecreëerde hitlog omvat geen van de in de hit opgenomen parameters. Bijvoorbeeld, voor hits die overgedragen worden door markers die samenwerken met afspeelinrichtingen (players), registreert de lokale proxy niet de volgende parameters: de status van de speler, de naam van de content, de tijdsindex van het afspelen en de identificatie van de visualisatiesessie. De door de lokale proxy’s 2ca, 2cb gecreëerde hitlogs 21a, 21b zijn dus op zichzelf niet benutbaar voor het bewerkstelligen van een ‘user-centric’ meting.But each hitlog created by the local proxy 2ca, 2cb does not include any of the parameters included in the hit. For example, for hits transmitted by markers that interact with playback devices (players), the local proxy does not record the following parameters: the status of the player, the name of the content, the time index of the playback, and the identification of the visualization session. The hit logs 21a, 21b created by the local proxies 2ca, 2cb are therefore not in themselves usable for effecting a "user-centric" measurement.
Evenals in de eerste uitvoeringsvorm bestaat de voorgestelde oplossing uit het opzoeken van de hitparameters rechtstreeks in de registraties (logs) 22 van de site-centric meetnode 5. Maar hiertoe worden in de derde uitvoeringsvorm de publieke IP-adressen (netwerkadressen) van de terminals gebruikt als associatiesleutel, omdat de meetnode het (publieke) bron-IP-adres van de hits logt. Met andere woorden, het door de node 5 gecreëerde log en het door de lokale proxy 2ca, 2cb gecreëerde log omvatten voor iedere hit elk het publieke IP-adres van de terminal die deze hit verzonden heeft.As in the first embodiment, the proposed solution consists of looking up the hit parameters directly in the records (logs) 22 of the site-centric measurement node 5. But in the third embodiment the public IP addresses (network addresses) of the terminals are used for this as an association key, because the measurement node logs the (public) source IP address of the hits. In other words, the log created by the node 5 and the log created by the local proxy 2ca, 2cb each include the public IP address of the terminal that sent that hit for each hit.
De ‘meetapplicatie’ 2bA, 2bB van iedere terminal 2a’, 2b’ kan bijvoorbeeld een webservice 8 zoals ‘http://www.whatismyip.com/’ raadplegen teneinde het publieke IP-adres van deze terminal te kennen. Deze raadpleging wordt gesymboliseerd door de pijlen met referenties 9a’ en 9b’ in figuur 11. Het publieke IP-adres van een terminal resulteert uit een adrestranslatie, uitgaande van een privé IP-adres in het privénetwerk 110 waartoe de terminal behoort (lokaal netwerk achter de box 4 van het huishouden 1, mobiel netwerk...).For example, the "measurement application" 2bA, 2bB of each terminal 2a ", 2b" can consult a web service 8 such as "http://www.whatismyip.com/" in order to know the public IP address of this terminal. This consultation is symbolized by the arrows with references 9a 'and 9b' in Figure 11. The public IP address of a terminal results from an address translation, starting from a private IP address in the private network 110 to which the terminal belongs (local network behind) the box 4 of the household 1, mobile network ...).
Zodra het publieke IP-adres van de terminal bekend is en geregistreerd is door de ‘meetapplicatie’ 2bA, 2bB, draagt deze laatste het adres over naar de verzamelinrichting 20’ (deze overdracht wordt gesymboliseerd door de pijlen met referenties 10a’ en 10b’ in de figuur 11). Aldus kan de verzamelinrichting 20 achteraf de logs 22 van de meetnode 5 ophalen die betrekking hebben op de hits (met hun parameters) verzonden vanaf dit IP-adres. Overigens ontvangt de verzamelinrichting 20’ de hitlogs 21a’, 21b’ gecreëerd door de lokale proxy’s 2ca, 2cb.As soon as the public IP address of the terminal is known and registered by the 'measurement application' 2bA, 2bB, the latter transfers the address to the collecting device 20 '(this transfer is symbolized by the arrows with references 10a' and 10b 'in the figure 11). Thus, the collecting device 20 can afterwards retrieve the logs 22 of the measuring node 5 relating to the hits (with their parameters) sent from this IP address. Incidentally, the collecting device 20 "receives the hit logs 21a", 21b "created by the local proxies 2ca, 2cb.
Maar meerdere terminals in eenzelfde privénetwerk 110 kunnen hetzelfde publieke IP-adres hebben, waardoor de verzamelinrichting de hitlogs 21a’, 21b’ gecreëerd door de lokale proxy’s 2ca, 2cb niet direct kan toewijzen aan de hitlogs 22 gecreëerd door de meetnode 5. Met andere woorden, het gebruik van het publieke IP-adres van de terminal als associatiesleutel volstaat niet. Het maakt het wel mogelijk om een subverzameling van hitlogs gecreëerd door de lokale proxy’s 2ca, 2cb en een subverzameling van hitlogs gecreëerd door de meetnode 5 te verkrijgen.However, multiple terminals in the same private network 110 may have the same public IP address, as a result of which the collection device cannot directly assign the hit logs 21a ', 21b' created by the local proxies 2ca, 2cb to the hit logs 22 created by the measurement node 5. In other words , the use of the public IP address of the terminal as an association key is not sufficient. It does make it possible to obtain a subset of hit logs created by the local proxies 2ca, 2cb and a subset of hit logs created by the measurement node 5.
Maar het maakt het niet mogelijk om een hitlog gecreëerd door de lokale proxy’s 2ca, 2cb (dit log omvattende een identificatie van de terminal die de hit verzonden heeft, bijvoorbeeld zijn MAC-adres) toe te wijzen aan ieder hitlog gecreëerd door de meetnode 5.But it does not make it possible to assign a hitlog created by the local proxies 2ca, 2cb (this log comprising an identification of the terminal that sent the hit, for example its MAC address) to every hitlog created by the measurement node 5.
Anders gezegd maakt het het de verzamelinrichting 20’ niet mogelijk om aan iedere hitlog gecreëerd door de meetnode 5 de identificatie te associëren van de terminal die deze hit verzonden heeft. Maar, zoals hierboven uitgelegd, dit is in het kader van een gebruikersgerichte publieksmeting noodzakelijk, enerzijds om de identiteit van de op deze terminal aangemelde perso(o)n(en) te kennen en anderzijds om het type terminal te kennen.In other words, it does not make it possible for the collecting device 20 'to associate to every hit log created by the measurement node 5 the identification of the terminal that sent this hit. But, as explained above, this is necessary in the context of a user-oriented audience measurement, on the one hand to know the identity of the person (s) registered at this terminal and on the other hand to know the type of terminal.
Teneinde het de verzamelinrichting 20’ mogelijk te maken om met elke hitlog gecreëerd door de meetnode 5 de identificatie van de terminal die de hit verzonden heeft te associëren, bestaat een oplossing voorgesteld in de derde bijzondere uitvoeringsvorm van de uitvinding uit het reconstitueren van visualisatiesessies van de kant van de lokale proxy’s 2ca, 2cb en ze nader tot berekende visualisatiesessies van de kant van de meetnode 5 te brengen. Deze nadering tussen visualisatiesessies (ook comsumptiesessies genaamd) wordt bijvoorbeeld bewerkstelligd op basis van de de meest nabije begin- en eindtijden van sessies (zoals hierboven uitgelegd met de figuren 4 tot 7).In order to allow the collecting device 20 'to associate with each hit log created by the measurement node 5 the identification of the terminal that sent the hit, a solution proposed in the third particular embodiment of the invention is to reconstitute visualization sessions of the the local proxies 2ca, 2cb and to bring them closer to calculated visualization sessions on the part of the measurement node 5. This approach between visualization sessions (also called comsumption sessions) is achieved, for example, on the basis of the closest start and end times of sessions (as explained above with figures 4 to 7).
Onderstreept moet worden dat hoe groter het aantal terminals in het privénetwerk (en dus hoe groter de waarschijnlijkheid dat meerdere terminals van dit privénetwerk hetzelfde publieke IP-adres hebben), des te groter het risico op toewijzingsfouten (fouten in het nader tot elkaar brengen van visualisatiesessies) is.It must be underlined that the greater the number of terminals in the private network (and thus the greater the likelihood that multiple terminals of this private network have the same public IP address), the greater the risk of assignment errors (errors in bringing visualization sessions closer together) ) is.
Figuur 10 presenteert de structuur van een verzamelinrichting 100 volgens een bijzondere uitvoeringsvorm van de uitvinding. Deze verzamelinrichting heeft ook de referentie 20 in figuur 2 (eerste uitvoeringsvorm beschreven met de figuren 1 tot 7), 80 in figuur 8 (tweede uitvoeringsvorm beschreven met de figuren 8 en 9) en 20’ in figuur 11 (derde uitvoeringsvorm beschreven met figuur 11).Figure 10 presents the structure of a collection device 100 according to a special embodiment of the invention. This collecting device also has the reference 20 in Figure 2 (first embodiment described with Figures 1 to 7), 80 in Figure 8 (second embodiment described with Figures 8 and 9) and 20 'in Figure 11 (third embodiment described with Figure 11 ).
Zij omvat een direct toegankelijk geheugen 103 (bijvoorbeeld een RAM-geheugen), een verwerkingseenheid 102, uitgerust met bijvoorbeeld een processor en aangestuurd door een computerprogramma opgeslagen in een uitleesgeheugen 101 (bijvoorbeeld een ROM-geheugen of een harde schijf). Bij de initialisatie wordt de instructiecode van het computerprogramma bijvoorbeeld geladen in het direct toegankelijk geheugen 103 voordat hij uitgevoerd wordt door de processor van de verwerkingseenheid 102.It comprises a directly accessible memory 103 (for example a RAM memory), a processing unit 102, equipped with for example a processor and controlled by a computer program stored in a read-out memory 101 (for example a ROM memory or a hard disk). For example, during the initialization, the instruction code of the computer program is loaded into the directly accessible memory 103 before it is executed by the processor of the processing unit 102.
Deze figuur 10 illustreert enkel een bijzondere uit meerdere mogelijke vormen, waardoor de verzamelinrichting de verschillende geïllustreerde stappen realiseert van de eerste of de tweede uitvoeringsvorm. De voorgestelde techniek kan gerealiseerd worden op om het even een herprogrammeerbare rekenmachine (een computer, een DSP-processor of een microcontroller) die een programma uitvoert dat een instructiereeks omvat, of op een functiegebonden rekenmachine (bijvoorbeeld een verzameling logische poorten zoals een FPGA of een ASIC, of iedere andere hardwaremodule). In het geval van een implementatie op een herprogrammeerbare rekenmachine kan het overeenkomstige programma (dat wil zeggen de instructiereeks) opgeslagen worden op een al dan niet verwijderbaar opslagmedium (zoals bijvoorbeeld een diskette, een cd-rom of een dvd-rom), waarbij het opslagmedium geheel of gedeeltelijk leesbaar is door een computer of een processor.This figure 10 only illustrates a particular one of several possible forms, whereby the collecting device realizes the various illustrated steps of the first or the second embodiment. The proposed technique can be realized on any reprogrammable calculator (a computer, a DSP processor or a microcontroller) that executes a program that includes an instruction sequence, or on a function-related calculator (e.g., a set of logical ports such as an FPGA or a ASIC, or any other hardware module). In the case of an implementation on a reprogrammable calculator, the corresponding program (i.e., the instruction set) can be stored on a removable or non-removable storage medium (such as, for example, a floppy disk, a CD-ROM, or a DVD-ROM), the storage medium can be read in whole or in part by a computer or a processor.
Claims (14)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1555403A FR3037459B1 (en) | 2015-06-12 | 2015-06-12 | METHOD OF COLLECTING, FOR CENTERED-USER AUDIENCE MEASUREMENT, HITS TRANSMITTED TO A CENTERED-SITE AUDIENCE MEASUREMENT NODE, USING NODE-CREATED HIT RECORDINGS. |
Publications (2)
Publication Number | Publication Date |
---|---|
NL2016943A true NL2016943A (en) | 2016-12-12 |
NL2016943B1 NL2016943B1 (en) | 2019-10-04 |
Family
ID=54608621
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
NL2016943A NL2016943B1 (en) | 2015-06-12 | 2016-06-10 | Collection method for a user-oriented audience measurement, from hits transferred to a node for site-oriented audience measurement, using hit registrations created by the node. |
Country Status (2)
Country | Link |
---|---|
FR (1) | FR3037459B1 (en) |
NL (1) | NL2016943B1 (en) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020062223A1 (en) * | 2000-11-21 | 2002-05-23 | Netiq Corporation | System and method for adding network traffic data to a database of network traffic data |
US20120084349A1 (en) * | 2009-12-30 | 2012-04-05 | Wei-Yeh Lee | User interface for user management and control of unsolicited server operations |
FR3013540B1 (en) * | 2013-11-18 | 2017-04-07 | Mediametrie | METHOD FOR MEASURING THE HEADING OF CONTENT ON TERMINALS, BY DIGITAL TATTOO EXTRACTION AND / OR DIGITAL FINGERPRINTS ON THE AUDIO COMPONENT OF THE CONTENT. |
-
2015
- 2015-06-12 FR FR1555403A patent/FR3037459B1/en active Active
-
2016
- 2016-06-10 NL NL2016943A patent/NL2016943B1/en not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
FR3037459A1 (en) | 2016-12-16 |
FR3037459B1 (en) | 2018-07-06 |
NL2016943B1 (en) | 2019-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6694018B2 (en) | Method and apparatus for collecting distributed user information for media impressions and search terms | |
US11197125B2 (en) | Methods and apparatus to associate geographic locations with user devices | |
US8972612B2 (en) | Collecting asymmetric data and proxy data on a communication network | |
US9979614B2 (en) | Methods and apparatus to determine media impressions using distributed demographic information | |
US8938534B2 (en) | Automatic provisioning of new users of interest for capture on a communication network | |
EP2901653B1 (en) | Systems and methods for audience measurement | |
EP2891074B1 (en) | Methods and apparatus to collect distributed user information for media impressions and search terms | |
CN108206972B (en) | Direct broadcasting room popularity processing method, device, server and storage medium | |
US20160048868A1 (en) | Systems and methods for obfuscated audience measurement | |
CA2943356A1 (en) | System and method for identifying users on a network | |
CN104488277A (en) | Methods and apparatus to monitor media presentations | |
CN102710770A (en) | Identification method for network access equipment and implementation system for identification method | |
US9059987B1 (en) | Methods and systems of using single sign-on for identification for a web server not integrated with an enterprise network | |
US20130191493A1 (en) | System for accessing a set of communication and transaction data associated with a user of interest sourced from multiple different network carriers and for enabling multiple analysts to independently and confidentially access the set of communication and transaction data | |
US11115483B2 (en) | Methods and apparatus for census and panel matching using session identifiers positioned in an HTTP header | |
TW201520948A (en) | Method and system for processing message of social network | |
US20170228795A1 (en) | Methods and apparatus to associate panelist data with census data | |
US10298622B2 (en) | System and method for passive decoding of social network activity using replica database | |
US9723017B1 (en) | Method, apparatus and computer program product for detecting risky communications | |
US11290359B2 (en) | Relaying internet census information | |
NL2016943B1 (en) | Collection method for a user-oriented audience measurement, from hits transferred to a node for site-oriented audience measurement, using hit registrations created by the node. | |
Mohiddin et al. | Role of cloud forensics in cloud computing | |
US20210044665A1 (en) | Correlation Of Usage To Corresponding Users Through Device And DNS Agents | |
JP6984751B2 (en) | Information gathering system, information gathering method, and control program | |
Gu et al. | Fingerprinting Network Entities Based on Traffic Analysis in High‐Speed Network Environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM | Lapsed because of non-payment of the annual fee |
Effective date: 20200701 |