Bevölkerungsrepräsentative Telefonbefragung


[Autoren: MMC/BIK/Ebert]

Um in der ma Internet verlässliche Aussagen bezüglich der Grundgesamtheit treffen zu können, werden neben den Daten von Internet-Nutzern auch Angaben von Personen benötigt, die das Internet gar nicht bzw. nur Internet-Angebote außerhalb der Technischen Messung nutzen. Diese Daten fließen in Form von Ergebnissen einer bevölkerungsrepräsentativen CATI-Erhebung (Computer Assisted Telephone Interview) in den CATI-Datensatz ein.

Ähnlich wie in der OnSite- & InApp-Befragung wird auch in der CATI-Erhebung hauptsächlich nach Angaben zur Soziodemografie und zur generellen Nutzung des Internets gefragt. Diese Daten helfen dabei, das Verhältnis der Internet-Nutzerschaft zur Gesamtbevölkerung abzubilden, und sind auch die Basis für die Hochrechnung.

Neben soziodemografischen Informationen werden in der CATI-Erhebung weitere personenbeschreibende Merkmale erfasst, die die Bildung vermarktungsrelevanter Zielgruppen unterstützen. Dazu gehören Markt- und Branchendaten sowie Informationen zu Einstellungen der Befragten.

Ausgangsbasis für die CATI-Erhebung ist die im jährlichen Rhythmus aktualisierte Auswahlgrundlage der Arbeitsgemeinschaft ADM-Stichproben für Telefonbefragungen. Aus dieser Auswahlgrundlage können Festnetz- und Mobilfunkstichproben gezogen werden, die dazu dienen, die Grundgesamtheit bevölkerungsrepräsentativ zu befragen. In der CATI-Erhebung werden derzeit auch noch 14-15-Jährige befragt, aber nicht tiefgehender in Richtung Veröffentlichung verarbeitet.

Dual-Frame-Ansatz

Die CATI-Erhebung der ma Internet basierte bis zur Berichterstattung ma 2015 Internet 06 ausschließlich auf einer Festnetzstichprobe. Mit dem Ziel, die Stichprobenqualität zu optimieren, wurde die ma Internet ab der Berichterstattung ma 2015 Internet 07 um eine Mobilfunkstichprobe erweitert. Der Grund für die Integration von Mobilfunknummern in die CATI-Stichproben lag in der weiterhin sinkenden Erreichbarkeit speziell der 20- bis 39-Jährigen über Festnetzanschlüsse. Es ist davon auszugehen, dass es einen steigenden Anteil von Personen gibt, die ausschließlich (Mobile-Onlies) oder überwiegend (Mostly-Mobiles) über eine Mobilfunknummer erreichbar sind und dadurch im Festnetzstichprobenansatz benachteiligt wurden. Ziel des erweiterten Stichprobenansatzes (Dual-Frame-Ansatz) war demnach die Erhöhung der Wahrscheinlichkeit dafür, Mostly-Mobiles und Mobile-Onlies (p=0) in die CATI-Erhebung zu integrieren.

Für die Durchführung von CATI-Interviews mit Mobilfunknummern ergeben sich im Vergleich zu einer Festnetzstichprobe eine Reihe von Herausforderungen. Dazu gehören die spezielle Befragungssituation (langes Interview, komplexe Fragestellungen), die Stichprobe selbst (fehlende Regionalisierung, großes Nummernuniversum mit hohem Anteil generierter Rufnummern, Stichprobenrealisierung) sowie Transformation/Gewichtung (Zusammenführung von unterschiedlichen Stichproben). Vor diesem Hintergrund wurde ein mehrstufiges Vorgehen gewählt, das helfen sollte, die erwähnten Herausforderungen besser abzuschätzen und ggf. zu umgehen. Weitergehende Informationen sind dem agma-Forschungsbericht 14 („Der Dual-Frame-Ansatz in den ma-CATI-Studien“) zu entnehmen.

Die zu realisierende Gesamtstichprobe soll die Bevölkerung in den Bundesländern möglichst unverzerrt, also proportional, abbilden. Da man bei Festnetznummern die Wohnortgemeinde des Befragten im Allgemeinen kennt, ist bei der Festnetzstichprobe die regionale Gleichverteilung über die hierarchisch angelegte Schichtung nach Bundesländern, Regierungsbezirken und Kreise unproblematisch zu realisieren. Bei der Mobilfunk-Stichprobe ist dies ungleich schwieriger. Hier liegen zu den Telefonnummern lediglich die Informationen über die 3 Anbieter und die momentan 39 Vorwahlnummern vor. Daraus lassen sich aber gegenwärtig keinerlei Informationen über den Wohnort des Befragten ableiten. Im Ergebnis erhält man aus der realisierten Mobilfunkstichprobe eine disproportionale Bundesländer-Verteilung. Aus den Mobilfunk-Studien der Vorjahre lässt sich aber ein Muster der Disproportionalität hinsichtlich der Bundesländer erkennen. Diese Information nutzt man, um zu erwartende Länderverteilung der Mobilstichprobe zu schätzen. Auf der Basis dieser Schätzung werden die Ländervorgaben der Internet-Festnetzstichprobe so vorgenommen, dass die realisierte Festnetzstichprobe die zu erwartenden Disproportionalitäten der Mobilstichprobe kompensiert und die aus beiden Komponenten gebildete Gesamtstichprobe in Hinblick auf die Bundesländerverteilung der Gleichverteilung möglichst nahe kommt.

Die Arbeitsgemeinschaft ADM-Stichproben hat 2016 Analysen durchgeführt, um das ideale Mischungsverhältnis von Festnetz- zu Mobilfunkstichproben zu bestimmen: "Die Effektivität der Gewichtung ist bei einem Mischungsverhältnis von 50:50 am höchsten, ab einem Mischungsverhältnis von 30 Prozent Mobilfunknummern steigt sie nur noch wenig an. Ab einem Mischungsverhältnis von 70 Prozent Mobilfunknummern sinkt die Effektivität deutlich." Die derzeitige Mischung der ma Internet-CATI-Erhebungswellen entspricht diesem Verhältnis. Die nachfolgenden Abschnitte zeigen in Grundzügen die Bildung der jährlich aktualisierten Auswahlgrundlage und die daraus abgeleitete Anlage und Ziehung der Stichproben für die CATI-Erhebungswellen der ma Internet auf.

Festnetz

Die mit telefonischer Befragung erreichbare Grundgesamtheit (hier: Haushalte bzw. Personen mit mindestens einem Festnetzanschluss) ist in keinem Telefonverzeichnis vollständig verzeichnet, so dass weder individuelle noch statistische Angaben dazu existieren. Die Einbeziehung nicht in Verzeichnisse eingetragener Festnetztelefonnummern in die Stichprobe ist die eigentliche Schwierigkeit bei der Stichprobenbildung.

Bildung der Auswahlgrundlage Festnetz

Im Rahmen der Arbeitsgemeinschaft ADM-Stichproben, der die Media-Micro-Census GmbH angehört, wurde bis einschließlich 2006 eine Auswahlgrundlage Festnetz erstellt, die auf die Arbeiten der Autoren Gabler und Häder vom Zentrum für Umfragen, Methoden und Analysen (ZUMA) zurückgeht und noch bis zur ma 2007 Radio verwendet wurde. Seit 2007 veröffentlicht die Bundesnetzagentur (BNA) eine Liste, in der alle an die Telefongesellschaften ausgegebenen Rufnummernblöcke für die BRD verzeichnet sind (Altbestand vor 1999 und Neubestand). Dadurch ergibt sich die Möglichkeit, die Generierung der Rufnummern als Kombination aus den offiziell vergebenen Rufnummern (BNA-Liste) und den bisher verwendeten amtlichen Rufnummernverzeichnissen herzustellen. Die darin enthaltenen Einträge braucht man noch immer, da nur diese Informationen über die tatsächliche Länge der geschalteten Rufnummern und die regionale Verortung liefern. Durch dieses Vorgehen ist sichergestellt, dass in der für die aktuelle ma Internet verwendeten Auswahlgrundlage Festnetz der Arbeitsgemeinschaft ADM-Stichproben die Menge aller bei der Bundesnetzagentur vergebenen Rufnummernblöcke und damit das Universum aller möglichen Festnetznummern abgebildet ist.

Bei der Erstellung der Auswahlgrundlage Festnetz werden solche Anbieter ausge­schlossen, die nur rein gewerbliche Anschlüsse stellen und veraltete Rufnummernblöcke der Telekom, die seit 1999 nicht einen privaten Eintrag aufweisen. Auf eine Generierung dieser leeren Rufnummernblöcke wurde verzichtet.

Durch den Einbezug der Liste der vergebenen Rufnummernblöcke der Bundesnetzagentur hat sich die Hunderter-Blockstruktur aufgelöst. Es sind in der Liste sowohl Rufnummernblöcke, die 10 Nummern umfassen, solche mit 100 Rufnummern und solche mit 1.000 Rufnummern enthalten.

Aus dem Rufnummernbestand werden die eindeutig erkennbaren geschäftlichen Telefonnummern und Faxnummern eliminiert. Den Rufnummern wird anschließend eine Regionalwahrscheinlichkeit zugeordnet. Die Zuordnung von nicht regional festgelegten Telefonnummern (nicht oder unvollständige verzeichnete Nummern) erfolgt über eine zufällige Verteilung an Gemeinden, die sich aus dem Verhältnis der im entsprechenden Rufnummernblock enthaltenen zuordenbaren Telefonnummern ergibt. Dieses Verfahren ist notwendig, da in einem Block mehr als eine Gemeinde vertreten sein kann (Vorwahlbereiche und Gemeindegrenzen stimmen nicht immer überein). Darüber hinaus wird bei der Vergabe der Regionalwahrscheinlichkeiten die Art des Betreibers mit berücksichtigt (z.B. regionaler vs. nationaler Telefonanbieter).

Auf dieser Basis wird eine Aufspaltung aller Blöcke mit dem Ergebnis vorgenommen, dass jeder so entstehende Block eindeutig einer Gemeinde zugeschrieben werden kann. Die genaue Ortsfeststellung findet letztendlich durch Befragung im Interview statt, so dass etwaige Fehlzuordnungen keinen Einfluss auf das Ergebnis im Gebiet haben.

Allokation

Innerhalb des Allokationsverfahrens von Ebert/Wendt werden ortstreue Blöcke in eine eindeutige feste Reihenfolge gebracht. Die Allokation bewirkt dabei, dass die Verteilung der Haushalte auf allen Schichtungsebenen (Länder, Regierungsbezirke, Kreise, BIK-Gemeindegrößenklassen) in optimaler Weise zu ganzzahligen Anforderungen führt. Die Anzahl zu besetztender Schichten (Kreis x 10er BIK-Gemeindegrößenklasse) beträgt ca. 1.400. Innerhalb dieser Schichten sind die Blöcke gemeindeweise nach aufsteigender Anzahl Nummern angeordnet. Diese systematische Sortierung stellt sicher, dass bei der Ziehung keine Klumpungseffekte innerhalb der Ziehungszellen auftreten.

Schichtungsstruktur

  • Schichtungszellen
    • 401 Kreise
    • 10 BIK-Gemeindegrößeklassen
  • Schichtungsuntergliederung
    • 753 BIK-Regionen
    • 4 BIK-Zonen
    • 7 politische Gemeindegrößenklassen
  • Zellenfeinstruktur
    • Gemeinden
    • Stadtteile
    • Anzahl Telefonnummern
    • Anzahl eingetragener Festnetznummern

Mittels eines Bedeutungsgewichts werden die Größenrelationen der einzelnen Zellen zueinander auf Basis der Haushaltszahlen auf Ebene von Gemeinden bzw. Stadtteilen festgelegt. Erst innerhalb dieser Einheiten kommen die Telefonnummern ins Spiel. Die Gesamtheit der Telefonnummern wird also an den Haushaltszahlen normiert – das größenproportionale Verhältnis der Schichtungszellen zueinander bestimmt die Anzahl der zu ziehenden CATI-Points pro Zelle, die Anzahl aller darin enthaltenen Telefonnummern die äquidistante Schrittlänge, mit der diese gezogen werden.

CATI-Points

Zur Ziehung der Stichprobe werden die Grenzen der Blöcke nach der oben beschriebenen Anordnung wieder aufgehoben. Die Telefonnummern befinden sich dadurch in einer langen Sequenz. Für jedes durchzuführende Interview werden aus der Sequenz 20 Telefonnummern äquidistant gezogen und zu einem CATI-Point zusammengefasst. Eine Unterscheidung zwischen in Verzeichnissen eingetragenen und generierten Nummern findet dabei nicht statt. Die Blockstruktur der Auswahlgrundlage dient somit nur zur strukturierten Anordnung der einzelnen Telefonnummern in eine feste Reihenfolge.

Die 20 Telefonnummern jedes CATI-Points werden in eine zufällige Reihenfolge gebracht. Bei der Erhebung werden diese nach vorgegebenen festen Regeln abgearbeitet. Dabei darf, mit der ersten Nummer beginnend, nur dann eine weitere Nummer eines CATI-Points nachgezogen werden, wenn die vorherige ein Ausfall ist (ungültige Rufnummer, Firmenanschluss, 15 Anwahlversuche an 10 verschiedenen Tagen zu verschiedenen Uhrzeiten führen zu keinem Haushaltskontakt, Verweigerung des Interviews durch Haushalt oder Zielperson, etc.). Die Bereitstellung von 20 Telefonnummern pro Point verfolgt das Ziel, bei Ausfällen im selben Gebiet weitere Kontaktversuche unternehmen zu können.

Die letzte Ziehungsstufe erfolgt während der Feldarbeit. Da bei der Stichprobenziehung von Haushalten ausgegangen wird, kann die Personenauswahl erst während der (telefonischen) Befragung erfolgen. Dies geschieht durch Auflistung aller in einem Privathaushalt vorhandenen Zielpersonen der Grundgesamtheit nach Alter und Geschlecht und anschließender Auswahl per Schwedenschlüssel bzw. einer entsprechenden Zufallsauswahl. Anders allerdings als bei den Face-to-Face-Interviews der ma Pressemedien wird hierbei auch in großen Haushalten nur eine Person ausgewählt.

Ziehung

Nach der Allokation, der Anordnung innerhalb der Schichtungszellen und der Festlegung des Bedeutungsgewichts kann für jede Welle die Ziehung in den  ca. 1.400 Schichten erfolgen. Wegen der unterschiedlichen Relation „Anzahl Haushalte / Anzahl Telefonnummern“ ist dabei die Schrittweite der äquidistanten Ziehungsschritte bezüglich der Telefonnummern zwischen den Zellen verschieden.

Für die Festnetzstichprobe der ma 2019 Internet I wurden 4 Wellen mit jeweils ca. 10.000 zu realisierenden Interviews, proportional über die Bundesrepublik verteilt, berücksichtigt. Aufgrund der zu erwartenden systematischen Ausfälle wird nach groben Abschätzungen über den Bedarf ein bis zu 12-facher Bruttoansatz gewählt. Für jede Welle werden somit bis zu 120.000 Points vorgehalten. Diese CATI-Points sind so aufgeteilt, dass pro Stichprobe gleichmäßig repräsentative Teilstichproben entstehen, eine für jedes der eingesetzten Institute. Dabei werden die Telefonnummern je Sample so angeordnet, dass sich bei sukzessiver Abarbeitung eine gleichmäßige Flächenverteilung über die Befragungszeit ergibt. Die Feinsteuerung der Stichprobe im Feld ist Aufgabe der Institute.

Mobilfunk

Bildung der Auswahlgrundlage Mobilfunk

Die Mobilfunk-Auswahlgrundlage der Arbeitsgemeinschaft ADM-Stichproben umfasst ein großes Nummernuniversum mit einem hohen Anteil von generierten Rufnummern. Eine regionale Schichtung der Stichprobe ist aus Datenschutzgründen nicht möglich. Aus den Vorwahlen der Mobilfunknummern ist für den Großteil der Nummern deshalb lediglich eine Zuordnung zu Mobilfunknetzen möglich.

Filtern des Nummernbestandes

Der Nummernbestand der Auswahlgrundlage Mobilfunk wird auf die privaten Einträge und generierten Rufnummern gefiltert und dann weiter verarbeitet. Ausgeschlossen werden hierdurch gewerbliche Rufnummern und Faxnummern, soweit diese aus den Einträgen ersichtlich werden. Die Ausgangsmenge von 342,095 Mio. Rufnummern im Jahr 2019 wird durch diesen Schritt jedoch nur sehr gering verkleinert, da diese nur 0,5% Einträge enthält.

Bildung der primären Stichprobe für den HLR-Lookup

Aus dieser so reduzierten Menge an Mobilfunknummern wird eine primäre Stichprobe gezogen. Die Ziehung erfolgt proportional nach Teilnehmern der Netzbetreiber (analog der Veröffentlichung der Bundesnetzagentur). Innerhalb der Netze wird zusätzlich eine Schichtung nach der Menge an Rufnummern pro Vorwahl vorgenommen. Bei der Mengenermittlung der primären Stichprobe werden bei der Übersetzung vor dem HLR-Lookup Ergebnisse des HLR-Lookups vorheriger Studien berücksichtigt. Dabei wird der Anteil der Mobilfunknummern ausgeschlossen, die als nicht valide ermittelt wurden oder durch Portierung das Ursprungsnetz gewechselt und damit eine andere Netzzuordnung als ursprünglich erhalten haben.

Bildung der Bruttostichprobe nach HLR-Lookup

Um die primäre Stichprobe auf valide Rufnummern zu reduzieren, wird in diesem Schritt eine Vorabprüfung per HLR-Lookup erstellt. Dabei werden verschiedene Stati abgefragt, die Auskunft darüber geben, ob die Mobilfunknummer valide ist, ob sie in ein anderes Netz portiert wurde und ob sie derzeit im Ausland aktiv ist (Roaming). Die so geprüften Rufnummern werden um die nicht validen Rufnummern reduziert. Dann erfolgt eine erneute Schichtung nach Netz, wobei die portierten Rufnummern jetzt dem Netz nach dem HLR-Lookup zugewiesen werden. Aus der Menge der gültigen Rufnummern werden jetzt noch einmal proportional zu den Teilnehmerzahlen laut Bundesnetzagentur vier Teilstichproben gezogen. Diese vier Teilstichproben bilden die Bruttostichprobe.

Arbeiten zur Aufbereitung der Institutsstichproben

Die Schichten dieser Bruttostichprobe sind zweidimensional als Kombination von Netzanbieter und den zugehörigen Vorwahlen definiert. Die Zuweisung auf die Institutsstichproben erfolgt proportional im Total und in den Schichten. Die gezogenen Telefonnummern werden institutsweise und auch im Total als Tagesstichproben (z.B. 105 Tage für 15 Wochen) angeordnet. Jede Tagesstichprobe bildet somit einzeln und über die bisher abgearbeiteten Tage der Feldlaufzeit aggregiert eine optimale Teilstichprobe im Sinne der Schichtung. Um dies zu realisieren muss ein geeigneter Nummerierungsalgorithmus angewendet werden.

Abarbeitung der Mobilfunkstichproben durch die Institute

Eine Point-Bildung analog zur Festnetzstichprobe durch Zusamenfassung von je 20 Telefonnummern zu einem Point ist nicht vorgesehen. Sie wäre nur sinnvoll, wenn zu den Telefonnummern Informationen zur zugehörigen Wohnortgemeinde schon in der Ziehungsdatei vorlägen. Die Verortung der Befragten geschieht aber erst im Interview über die vom Befragten genannte Postleitzahl, mit der über eine Zusatzdatei die zu dieser Postleitzahl gehörigen Gemeinden gezielt im Interview nachgefragt werden können. Damit ist sichergestellt, dass die Probleme der Mehrdeutigkeit von Gemeindenamen und die Nennung von Altgemeinden vermieden werden können.

Zur Verbesserung der Stichprobenrealisierung sollen pro Nummer sechs Kontaktversuche mit einem Abstand von ca. 50 Stunden (Ausnahme: besetzt) vorgenommen werden. Für jedes zu realisierende Interview werden einem Institut 60 Mobilfunknummern zur Verfügung gestellt.

Feldmodell

Während die Stichprobenanlage die geografische Verteilung der Interviews über das Befragungsgebiet, die Verteilung auf die Institute und vor allem die Auswahlchance der Haushalte und Personen bestimmt, regelt das Feldmodell die organisatorische und zeitliche Verteilung der Interviews. Dazu steht jedem Institut ein Sample-Management-System zur Verfügung, das nach detaillierten Vorgaben das Abarbeiten der gelieferten Telefonnummern der Stichprobe fordert.