Aktualisierung von Unique Usern

[Hauptautor: Kantar]

Beim erstmaligen Aufsetzen des Virtuellen Panels wurden zunächst Unique User gebildet, denen synthetische Client-Platzhalter zugewiesen wurden. Bei der initialen Nutzerbildung wurden diese Platzhalter durch passende echte Clients ersetzt, deren Anreicherung um Soziodemografie und verwendete Geräte zur Internet-Nutzung mit den Anforderungen des Platzhalters korrespondierten. Bei einer Aktualisierung des CATI-Datensatzes kommt es wie bei der ursprünglichen Initialisierung zur Bildung neuer Unique User nach dem Konzept der Platzhalter. Die Zahl der Unique User im Technischen Panel erhöht sich hierdurch, falls keine bestehenden Unique User disqualifiziert werden.

Die Aktualisierung des Technischen Panels erfolgt wöchentlich in folgenden Schritten:

Abruf der zur Verarbeitung benötigten Daten

Zu Beginn werden wöchentlich folgende Daten abgerufen:

Anreicherung der Random-Clients

Anschließend kommt es kommt es zur Anreicherung der Random-Clients um soziodemografische und Internet-Nutzungs-Merkmale mit Hilfe von OnSite-Clients. Die angereicherten Random-Clients werden in einem Reserve-Pool vorgehalten und stehen ab dem Zeitpunkt der erstmaligen Anreicherung als potentielle Eintausch-Clients für die wöchentliche Aktualisierung des Technischen Panels zur Verfügung.

Überprüfung und Austausch von Clients

Jedem Unique User des Technischen Panels ist eine seiner Geräteausstattung entsprechenden Zahl an Clients zugeordnet. Diese Zuordnung wird im Rahmen der wöchentlichen Verarbeitung überprüft. Im Rahmen dieser Überprüfung kommt es regelmäßig zum Austausch einzelner Clients. Die Notwendigkeit des Austauschs wird anhand mehrerer Kriterien überprüft und ist notwendig, um technisch induzierte oder nutzerbedingte Änderungen abzubilden. Der Austausch eines Clients verändert die Struktur des Unique Users. Daher ist der Austausch nur in inhaltlich zwingenden Fällen geboten.

Austauschgründe

Gelöschter Cookie

Der Zeitpunkt der Cookie-Löschung kann technisch nicht erfasst werden. Vielmehr ist ab diesem Zeitpunkt lediglich keine weitere Internet-Nutzung beobachtbar. Dies kann aufgrund von Cookie-Löschung auftreten, könnte aber ebenfalls nur unregelmäßige Internet-Nutzung oder längere Abwesenheiten des Internet-Nutzers abbilden. Statistisch gesprochen entspricht dies rechtszensierten Daten, da die künftige Internet-Nutzung bzw. -Nichtnutzung eines Clients zum Zeitpunkt der Entscheidung nicht feststeht. Dies ist wegen der zeitlich fortlaufenden Struktur unvermeidbar.

Der verwendete Ansatz berücksichtigt als Heuristik zur Identifikation nicht wiederkehrender, dauerhaft gelöschter Cookies:

  1. die bereits verstrichene Zeit seit dem letzten Auftreten und
  2. die bisher übliche Nutzungsfrequenz ("Herzschlag")

Der Herzschlag eines Clients definiert sich als Quotient der Zahl von Tagen mit Nutzung auf einem Client und der bisher beobachteten Lebensdauer (Differenz aus bisher letztem und erstem Auftreten eines Clients). Der Herzschlag ist folglich ein Maß für die Nutzungshäufigkeit eines Clients. Je größer der Herzschlag, desto häufiger nutzt ein Client. Ein Client, der jeden Tag seiner Lebensdauer Nutzung aufweist, hat einen Herzschlag von 1. Ein Client, der im Durchschnitt jeden zweiten Tag seiner Lebensdauer Nutzung aufweist, hat einen Herzschlag von 0,5 , etc.

Tritt ein Client mit regelmäßiger Nutzung unerwartet zwei Wochen nicht auf, so spricht dies eher für die Löschung eines Cookies als bei ohnehin nur sporadisch nutzenden Clients. Je häufiger ein Client in der Vergangenheit genutzt hat, desto unerwarteter ist eine längere Nutzungspause in der Zukunft.

Die Identifikation von Cookie-Löschern erfolgt unter Verwendung folgender Konvention: Ein Client wird wegen vermuteter Cookie-Löschung dauerhaft aus der Nutzer-Client-Zuordnung entfernt und durch einen anderen Client ersetzt, wenn er

  • bei einem bisher beobachteten Herzschlag > 0,5 mehr als 21 Tage (3 Wochen) keine Nutzung aufweist bzw.
  • bei einem bisher beobachteten Herzschlag < 0,5 mehr als 35 Tage (5 Wochen) keine Nutzungsvorgänge aufweist.

Die Anwendung dieser Konventionen zeigte in der Simulationsumgebung, dass weniger als 5% aller Clients irrtümlich als inaktiv klassifiziert wurden, obwohl sie nach dieser langen Nutzungspause wieder Nutzung aufgewiesen hätten.

Geändertes Internet-Nutzungsmuster

Die soziodemografische Anreicherung der Random-Clients erfolgt unter Berücksichtigung der bisher aufgetreteten Internet-Nutzungsmuster. Denkbar ist jedoch, dass das Nutzungsmuster ab einem bestimmten Zeitpunkt nicht mehr zur soziodemografischen Profilierung passt. Dies kann

  1. wegen tatsächlichem Wechsel der Soziodemografie des Nutzers des Clients (z.B. Umzug, Wechsel der Haushaltsgröße, Weitergeben des Geräts an einen anderen Nutzer) oder
  2. durch Fehlklassifikation zum Zeitpunkt der erstmaligen soziodemografischen Anreicherung

geschehen. Die fehlerhafte Klassifikation eines Clients soll durch Anwendung geeigneter mathematisch-statistischer Verfahren vermieden werden, ist jedoch wegen der gegebenen Qualifikationskriterien nicht immer vermeidbar.

Ziel des Austauschs wegen unpassender Nutzungsmuster ist es, Random-Clients mit Nutzungsmustern, die der dem Client zugeordneten Soziodemografie augenscheinlich widersprechen, auszutauschen. Dies erhöht die soziodemografische Trennschärfe.

Identifikation eines Clients als Proxy-Client

Auf Basis der gültigen Unique User-Client-Zuordnung erfolgt täglich eine Datenextraktion aus dem Datawarehouse. Dabei wird die Internet-Nutzung von Clients entfernt, die als Proxies kenntlich gemacht wurden. Internet-Nutzungsdaten von bekannten Proxy-Clients sind damit zu keinem Zeitpunkt im extrahierten Datenbestand enthalten. Ein Client kann grundsätzlich zu jedem Zeitpunkt erstmalig als Proxy-Client identifiziert werden.

INFOnline stellt Kantar wöchentlich eine Liste der Clients zur Verfügung, die in der bisher verwendeten Unique User-Client-Zuordnung als bisher unauffällige Clients enthalten waren und im Lauf der Verarbeitungswoche erstmalig als Proxy-Clients entfernt wurden. Kantar entfernt dann diese Proxy-Clients im Rahmen der Wochenverarbeitung aus der Nutzer-Client-Zuordnung. Ein Proxy-Client kann also bis zu einer Woche im Technischen Panel enthalten sein und keine Internet-Nutzung mehr aufweisen.

Vorliegen gegenteiliger Befragungsinformationen

Für die Teilnahme an der OnSite- & InApp-Befragung werden regelmäßig Client-Stichproben gezogen. Diese Client-Stichproben sind abgesehen von spezifischen Qualifikationskriterien zufällig. Diese Zufälligkeit führt dazu, dass auch die Nutzer von bereits verarbeiteten und einem Unique User zugeordneten Clients regelmäßig befragt werden. Damit erhalten diese Clients neben der bereits angereichterten Soziodemografie nachträglich auch eine Soziodemografie durch Befragungsdaten. Diese Soziodemografie passt in den meisten Fällen zu der der angereicherten Clients, kann sich aber an manchen Stellen von dieser unterscheiden. Da die Soziodemografie der Unique User grundsätzlich unveränderlich ist, führt eine OnSite- & InApp-Befragung daher in der Regel zum Austausch dieses befragten Clients.

Durch die Nachbefragung in der OnSite- & InApp-Befragung und die damit verbundene Erfassung weiterer Clients von Befragungsteilnehmern kommt es regelmäßig zur Verknüpfung mehrerer Clients. In wenigen Fällen werden dabei Teilnehmer nachbefragt, deren Client bereits Teil eines Unique Users ist. Findet die Nachbefragung auf einem Client statt, der bisher ein Random-Client und Teil eines anderen Unique Users war, so wird dieser bisherige Random-Client vom bisherigen Unique User entfernt und dem neuen Unique User zugeordnet. Eine Zuordnung ist erst zum Zeitpunkt der Nachbefragung möglich, da die Befragungsbrücke erst zu diesem Zeitpunkt entsteht.

Eintausch-Clients

Der Austausch erfolgt durch einen Ersatz-Client aus der Menge der angereicherten Clients. Der Ersatz-Client weist das gleiche soziodemografische Profil, den gleichen Herzschlag und den gleichen Gerätetyp wie der auszutauschende Client auf.

Die Wahl des Ersatz-Clients aus derselben soziodemografischen Kategorie ist ein zwingendes Kriterium zum Erhalt der soziodemografischen Trennschärfe der Unique User. Der Zeitpunkt des bisher letztmaligen Auftretens ist ebenso relevant, damit inaktive Clients nicht durch andere inaktive Clients ersetzt werden. Der Herzschlag wiederum sorgt für eine vergleichbare Nutzungsintensität auf Client- und damit auch auf Nutzerebene.

Die oben dargestellten Austauschgründe sind inhaltlich zwingend, setzen jedoch eine Abwägung zwischen dem Anspruch, die Zuordnung möglichst lange stabil zu halten (Kriterium der Kontinuität) und dem Anspruch, die Zuordnung möglichst aktuell zu halten (Kriterium der Aktualität), voraus.

Bereitstellung der neuen Unique User-Client-Zuordnungen

Die Aktualisierung des Technischen Panels endet mit der Bereitstellung der aktualisierten Unique User-Client-Zuordnungen, die bis zur Lieferung einer neuen Zuordnung zur täglichen Extraktion des Datensatzes 1 verwendet werden.