Entfernung von Fremdnutzung

[Hauptautor: Kantar]

Im Regelfall wird die Internet-Nutzung eines Clients genau einem Unique User zugeordnet. In manchen Fällen erfolgt die Nutzung eines Clients jedoch durch mehrere Nutzer (z.B. auf einem Familien-Tablet), ein sogenannter Multi-User-Client. Diese Mehrfachnutzung führt in der Regel zu einer größeren Variabilität im Nutzungsverhalten als bei Clients mit ausschließlich individueller Nutzung. Im Rahmen eines zweistufigen Verfahrens wird diese Mehrfachnutzung tagesgenau bereinigt. Die Identifikation von Mehrfachnutzung erfolgt jede Nacht und zielt auf das Erkennen von zur Soziodemografie des Nutzers klar unpassender Nutzungsvorgänge ab. Die kleinste Verarbeitungseinheit, die wegen solcher Multi-User-Nutzung entfernt wird, ist die Session. Nur die Nutzungsanteile des Hauptnutzers werden danach weiterverarbeitet.

Schätzung des Multi-User-Status auf Client-Ebene

Die Identifikation von Clients, die von mehr als einem Nutzer genutzt werden, erfolgt in einem mehrstufigen System auf Basis von technischen Messinformationen, Befragungsdaten und statistischer Modellierung.

Grundlage für die Identifikation der Multi-User-Clients sind folgende Datenquellen:

  1. Befragungsdaten: Als Multi-User-Client gilt, wenn laut Angabe in der OnSite- und InApp-Befragung außer dem Befragten noch weitere Personen von demselben Rechner aus das Internet nutzen und an diesem Rechner keine Login-Kennung verwendet wird.
  2. Statistische Modellierung: In Fällen, in denen die beschriebenen Informationen fehlen, wird eine Modellierung mit Hilfe statistischer Schätzverfahren vorgenommen.

Idee ist, dass Multi-User-Clients in der Regel eine größere Variabilität hinsichtlich ihres Nutzungsverhaltens aufweisen als Clients eines einzelnen Nutzers (Single-User-Clients). Die Identifikation der Multi-User-Clients erfolgt auf Basis des bisherigen Nutzungsverhaltens, kann jedoch innerhalb der Tagesverarbeitung nur in die Zukunft gerichtet Wirkung entfalten. Weist ein Client in der Vergangenheit also eine große Variabilität im Nutzungsverhalten auf, so ist er ein potentieller Multi-User-Client. Die Information, ob ein Client potentiell Multi-User-Client ist, wird an die nachgelagerten Dienstleister zur Berücksichtigung im Übernachtprozess weitergereicht.

Berücksichtigung der Client-Variabilität

Für jeden Client der Nutzer-Client-Zuordnung wird eine client-spezifische Nutzungsvariabilität auf Basis der bisher vorliegenden Nutzung errechnet. Weist ein Client viele Nutzungsvorgänge von Seiten mit unterschiedlichem soziodemografischen Profil auf, erhöht dies seine Variabilität. Nutzt ein Client im gesamten Zeitraum sehr ähnliche Angebote, verringert dies seine Variabilität. Je größer die Variabilität eines Clients ist, desto höher ist auch die Toleranzgrenze bei der Filterung der Multi-User-Nutzung.

Filterung innerhalb der täglichen Verarbeitung

Im automatisierten Übernachtbetrieb kommt es zur Prüfung, ob eine Session eines Clients als Multi-User-Anteil entfernt werden muss oder nicht. Die Identifikation von Sessions, die als Session eines fremden Nutzers entfernt werden müssen, erfolgt automatisiert und schrittweise durch:

  1. die Berechnung der zusammenhängenden Sessions eines Clients unter Berücksichtigung der Zeitstempel der einzelnen Nutzungsvorgänge,
  2. die Berechnung session-spezifischer Alters- und Geschlechtskennwerte unter Berücksichtigung von Strukturen aus der OnSite- & InApp-Befragung,
  3. den Vergleich der session-spezifischen Alters- und Geschlechtskennwerte mit der dem Client zugewiesenen Soziodemografie,
  4. der Markierung als Multi-User-Session, wenn diese Kennwerte eine bestimmte client-spezifische Toleranzgrenze überschreiten.

Der Tagesdatensatz enthält anschließend für jeden Nutzungsvorgang eines jeden Clients die Information, ob der Nutzungsvorgang zum Hauptnutzer gehört oder nicht. Eine Filterung auf Hauptnutzung erfolgt in der Weiterverarbeitung bei Ankordata.