In der vorliegenden Hausarbeit soll auf Basis eines fiktiven Fallbeispiels, in dem die Genehmigungsbehörde eine Vollerhebung untersagt, ein geeignetes Stichprobenverfahren ausgewählt und durchgeführt werden. Der Fokus liegt dabei auf zufallsgesteuerten Auswahlverfahren, da die Grundgesamtheit in dem Beispiel bundesweit mehr als 100.000 Menschen umfasst. Die Arbeit ist in sechs Kapitel unterteilt. In Kapitel 2 wird das fiktive Forschungsvorhaben geschildert. Darauf folgt in Kapitel 3 eine Betrachtung der rechtlichen Grundlagen der Sozialdatenübermittlung sowie in Kapitel 4 die Vorstellung der zufallsgesteuerten Auswahlverfahren. Anschließend werden in Kapitel 5 die Wahl eines zielführenden Stichprobenverfahrens für das Fallbeispiel und dessen Anwendung dargelegt. Mit einem Fazit in Kapitel 6 endet die Arbeit.
Der Datenschutz hat in der empirischen Forschung einen hohen Stellenwert. Besonders relevant ist der Schutz personenbezogener Daten in der Forschung jedoch dann, wenn Sozialdaten betroffen sind. Dies sind hochsensible Informationen über Menschen, die von den sozialrechtlichen Leistungsträgern gespeichert werden. An die Übermittlung dieser Daten stellt der Gesetzgeber hohe Anforderungen. So ist unter bestimmten Voraussetzungen zum Beispiel der Transfer der Sozialdaten von den Leistungsträgern an Forschungseinrichtungen zulässig.
In der empirischen Forschung haben Stichproben im Regelfall Vorteile gegenüber Vollerhebungen, da sie weniger aufwendig sind. Bei der Arbeit mit von Sozialleistungsträgern übermittelten Daten ist jedoch die Vollerhebung effizienter. Grund hierfür ist, dass die Forschungsinstitute die Daten aufbereitet erhalten und sie nicht erheben brauchen. Hier wäre die Auswahl von Stichproben zeitaufwendiger. Daher beantragen viele Institute die Übermittlung der Sozialdaten all jener Versicherten, die die Auswahlkriterien erfüllen. Dieses Vorgehen ist jedoch nicht immer zulässig.
GLIEDERUNG
1 Einleitung
2 Schilderung des fiktiven Forschungsvorhabens
3 Rechtliche Einordnung des Beispiels
4 Stichprobenverfahren
4.1 Verfahren der einfachen Zufallsauswahl
4.2 Verfahren der komplexen Zufallsauswahl
5 Auswahl und Anwendung eines geeigneten Stichprobenverfahrens für das Beispiel..
5.1 Auswahl eines geeigneten Stichprobenverfahrens
5.2 Anwendung des ausgewählten Verfahrens
6 FazitundAusblick
Literaturverzeichnis
ABBILDUNGSVERZEICHNIS
Abbildung 1: Grobes Prüfschema für die Zulässigkeit einer Sozialdatenübermittlung zur Forschung. Quelle: eigene Abbildung
Abbildung 2: Die Verfahren der einfachen Wahrscheinlichkeitsauswahl. Quelle: eigene Abbildung nach Kromrey et al. 2016: 266
Abbildung 3: Die Verfahren der komplexen Wahrscheinlichkeitsauswahl. Quelle: eigene Abbildung nach Kromrey et al. 2016: 266
Abbildung 4: Darstellung der gebildeten Schichten bzw. Urnen. Quelle: eigene Abbildung.
TABELLENVERZEICHNIS
Tabelle 1: Darstellung der Ziehung am Beispiel von Baden-Württemberg. Quelle: eigene Tabelle
Hinweis
Aus Gründen der leichteren Lesbarkeit wird in der vorliegenden Hausarbeit die gewohnte männliche Sprachform bei personenbezogenen Substantiven und Pronomen verwendet. Dies impliziert jedoch keine Benachteiligung des weiblichen Geschlechts, sondern soll im Sinne der sprachlichen Vereinfachung als geschlechtsneutral zu verstehen sein.
1 Einleitung
„Der Datenschutz schützt keine Daten, Herr Henrichmann. Der Datenschutz schützt die Menschenwürde, die Privatsphäre, die Errungenschaften dieses Landes und unseres Rechtsstaates.“ (von Notz 2021: 26012).
Aus diesem Grund hat der Datenschutz auch in der empirischen Forschung einen hohen Stellenwert (Häder 2019: 137). Besonders relevant ist der Schutz personenbezogener Daten in der Forschung jedoch dann, wenn Sozialdaten betroffen sind. Dies sind hochsensible Informationen über Menschen, die von den sozialrechtlichen Leistungsträgem gespeichert werden. Jeder Bürger hat einen Anspruch darauf, dass die Sozialverwaltung die gespeicherten Daten nicht missbraucht und sie nur im Rahmen ihrer gesetzlichen Verpflichtung erhebt, verarbeitet, nutzt oder übermittelt (Marburger 2020: 28). So erlaubt der Gesetzgeber zum Beispiel den Transfer der Sozialdaten von den Leistungsträgern an Forschungseinrichtungen. Dieser ist allerdings nur unter strengen Auflagen zulässig und bedarf der Zustimmung einer Genehmigungsbehörde.
In der empirischen Forschung haben Stichproben im Regelfall Vorteile gegenüber Vollerhebungen, da sie weniger aufwendig sind (Kromrey et al. 2016: 254). Bei der Arbeit mit von Sozialleistungsträgern übermittelten Daten ist jedoch die Vollerhebung effizienter. Grund hierfür ist, dass die Forschungsinstitute die Daten aufbereitet erhalten und sie nicht erheben brauchen. Hier wäre die Auswahl von Stichproben zeitaufwendiger. Daher beantragen viele Institute die Übermittlung der Sozialdaten all jener Versicherten, die die Auswahlkriterien erfüllen.
Dieses Vorgehen widerspricht jedoch dem Grundsatz, dass die von dem Datentransfer betroffenen Versicherten im Regelfall eine Einwilligung erteilen müssen (Grimm 2019: 47). Nur in Ausnahmefällen ist das Einholen von Einwilligungen nicht erforderlich. In der vorliegenden Hausarbeit soll auf Basis eines fiktiven Fallbeispiels, in dem die Genehmigungsbehörde eine Vollerhebung untersagt, ein geeignetes Stichprobenverfahren ausgewählt und durchgeführt werden. Der Fokus liegt dabei auf zufallsgesteuerten Auswahlverfahren, da die Grundgesamtheit in dem Beispiel bundesweit mehr als 100.000 Menschen umfasst. Weil bei dieser Größenordnung die Merkmalsausprägungen nicht hinreichend bestimmt werden können, wäre bei den nicht zufallsgesteuerten Verfahren die Generalisierbarkeit der Ergebnisse unsicher und Auswahlfehler ließen sich nicht kontrollieren (Kromrey et al. 2016: 296).
Die vorliegende Arbeit ist in sechs Kapitel unterteilt. In Kapitel 2 wird das fiktive Forschungsvorhaben geschildert. Darauf folgt in Kapitel 3 eine Betrachtung der rechtlichen Grundlagen der Sozialdatenübermittlung sowie in Kapitel 4 die Vorstellung der zufallsgesteuerten Auswahlverfahren. Anschließend werden in Kapitel 5 die Wahl eines zielführenden Stichprobenverfahrens für das Fallbeispiel und dessen Anwendung dargelegt. Mit einem Fazit in Kapitel 6 endet die Arbeit.
2 Schilderung des fiktiven Forschungsvorhabens
Eine Universität entdeckt das Phänomen, dass Mitarbeitende in Werkstätten für behinderte Menschen besonders häufig Arbeitsunfälle erleiden. Dies führt bei den Unfallkassen der Länder, bei denen die Beschäftigten dieser Werkstätten unfallversichert sind, zu hohen finanziellen Belastungen. Die Universität möchte daher im Rahmen eines empirischen Forschungsprojektes herausfinden, wie die Anzahl der Arbeitsunfälle in diesen Einrichtungen reduziert werden kann. Als Beispiel sollen dabei holz- und metallverarbeitende Betriebe dienen.
Im Rahmen des Projektes soll eine Primär- und eine Sekundärdatenerhebung durchgeführt werden. Erstere erfolgt unmittelbar in den Werkstätten für behinderte Menschen. Mit Einwilligung der behinderten Personen bzw. ihrer gesetzlichen Betreuer werden verunfallte Beschäftigte interviewt. Anschließend findet eine Übermittlung der pseudonymisierten Behandlungs-, Diagnose- und Kostendaten dieser Versicherten von den zuständigen Unfallkassen an die Universität statt. Die Genehmigungsbehörden der einzelnen Bundesländer haben diese Datentransfers genehmigt.
Um einen Vergleich mit den verunfallten Arbeitnehmern aus regulären holz- und metallverarbeitenden Betrieben hersteilen zu können, möchte die Universität ebenfalls die Daten dieser Personen von der zuständigen Berufsgenossenschaft für eine Sekundärdatenanalyse übermittelt bekommen. Eine Datenüberprüfung ergab, dass bundesweit im Beobachtungszeitraum 142.475 Menschen1 in regulären Betrieben Arbeitsunfälle erlitten (BG Holz und Metall o. J.). Mit diesen Daten soll aus Gründen der Einfachheit eine Vollerhebung durchgeführt werden.
Wegen der Menge der Daten soll keine Einwilligung bei den betroffenen Versicherten eingeholt werden. Laut der Universität sei dies unzumutbar, da für die Repräsentativität der Studie und für ein genaues Abbild der Gesellschaft die Daten aller Verunfallten benötigt werden. Das für die Genehmigung zuständige Bundesamt lehnte jedoch den pauschalen Datentransfer ohne Einverständnis mit der Begründung ab, dass auch bei fehlenden Einwilligungen eine repräsentative Studie mittels Stichprobenverfahren erfolgen könne. Hierzu gestattete die Behörde die Übermittlung der Adress-, Namens-, Arbeitgeber- und Geburtsdaten sowie des Geschlechts der 142.475 Versicherten an die Universität, damit diese die entsprechenden Einwilligungen einholen kann.
Da sie das Forschungsvorhaben nicht aufgeben möchte, muss sich die Universität nun Gedanken über den Einsatz und die Durchführung eines geeigneten Stichprobenverfahrens mit 3.000 Einheiten machen. Für die weitere Bearbeitung der Hausarbeit wird unterstellt, dass sich aus den Kontaktdaten der Versicherten folgende Erkenntnisse ergeben:
1. Der Anteil der verunfallten Menschen pro Bundesland entspricht dem Bevölkerungsanteil der Population des Bundeslandes gemessen an der Gesamtbevölkerung Deutschlands.
2. Von den verunfallten Beschäftigten sind 85 Prozent männlich und 15 Prozent weiblich. Dieser Anteil betrifftjedes Bundesland.
3. Von den Verunfallten sind 73 Prozent über 45 Jahre alt. Dieser Anteil betrifftjedes Bundesland sowie Männer und Frauen gleichermaßen.
3 Rechtliche Einordnung des Beispiels
Die Übermittlung von Sozialdaten ist in § 75 des Zehnten Buches Sozialgesetzbuch (SGB X) normiert. Die Datenschutzgrundverordnung (DS-GVO) der Europäischen Union ist allgemeingültig und gilt direkt nach Erlass verbindlich sowie unmittelbar in jedem Mitgliedsstaat der Union, das heißt auch in Deutschland (Hölscheidt/Menzenbach 2008: 577). Trotz der Höherrangigkeit enthält sie jedoch sogenannte Öffnungsklauseln. Dies ermöglicht es den Staaten, ergänzende Regelungen zu treffen, sofern sie nicht mit dem EU-Recht in Konflikt stehen (Haratsch et al. 2020: Rn. 395). Demnach können Mitgliedsstaaten für Gesundheitsdaten besondere Bedingungen festlegen und bei wissenschaftlichen For- schungszwecken die Auskunfts- und Widerspruchsrechte der Bürger einschränken sowie spezifischere Regelungen einführen, wenn es dem öffentlichen Interesse dient (Johannes 2017: 260).
Der § 75 Absatz 1 Satz 1 SGB X lässt die Übermittlung von Sozialdaten für die wissenschaftliche Forschung im Sozialleistungs- oder im Arbeitsmarkt- und Berufsforschungsbereich zu. Darüber hinaus müssen drei weitere Voraussetzungen erfüllt sein:
Zunächst muss das öffentliche Interesse am Forschungsvorhaben das Geheimhaltungsinteresse der betroffenen Person erheblich überwiegen. Dieser Prüfungsschritt gilt der Abwägung des Grundrechts auf freie Forschung und Lehre der Universitäten auf der einen und dem allgemeinen Persönlichkeitsrecht der betroffenen Versicherten auf der anderen Seite. Bei der Abwägung ist auf die „konkret-individuellen objektiven Gesichtspunkte sowie die subjektive Sicht“ (Herbst 2019: 10) derbetroffenen Versicherten abzustellen.
Des Weiteren muss der Datentransfer erforderlich sein. „Die Erforderlichkeit liegt vor, wenn das Forschungs- bzw. Planungsvorhaben nur unter unverhältnismäßig großen Schwierigkeiten erfüllt werden kann [...]“ (Krause 2018: 12). Da die Gesundheits-, Kosten- und Diagnosedaten im Regelfall nur den Sozialleistungsträgem vorliegen und Versicherte diese Daten nicht kennen, ist die Erforderlichkeit üblicherweise gegeben. Jedoch fehlt es regelmäßig an der Notwendigkeit für eine Vollerhebung, wenn auch Stichproben ausreichend wären (Rombach 2019: 14).
Eine weitere Voraussetzung ist das Einholen von Einwilligungen bei den betroffenen Personen (Herbst 2019: 12). Ohne dies ist eine Datenübermittlung nicht zulässig. Eine Ausnahme liegt nur dann vor, wenn die Einholung unzumutbar ist (ebd.: 13). Selbst ein erheblicher Verwaltungsaufwand führt nicht zur Unzumutbarkeit (Krause 2018: 15). Jedoch sind keine Einwilligungen erforderlich, wenn das Forschungsziel nur bei einer Vollerhebung erreicht werden kann (ebd.: 15) oder die Forschungsstelle Kontaktdaten für die Kontaktaufnahme benötigt, beispielsweise zum Einholen einer Einwilligung (Bundestag 2014: 56).
Anhand des in Abbildung 1 dargestellten Schemas lässt sich grob die Zulässigkeit eines Datentransfers prüfen.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1: Grobes Prüfschema für die Zulässigkeit einer Sozialdatenübermittlung zur Forschung. Quelle: eigene Abbildung.
Übertragen auf den Beispielsachverhalt wäre eine Datenübermittlung zumindest teilweise unzulässig. Einerseits fehlt es aufgrund der Möglichkeit der Stichprobenverfahren an der Erforderlichkeit, die Sozialdaten aller verunfallten Menschen an die Universität zu transferieren. Andererseits liegen keine objektiven Gründe vor, die das Einholen von Einwilligungen unzumutbar machen würden. Dass das öffentliche Interesse am Forschungsvorhaben das Geheimhaltungsinteresse der betroffenen Personen erheblich überwiegt, wird vorliegend unterstellt, da eine verfassungsrechtliche Abwägung der beiden Rechtsgüter den Rahmen dieser Hausarbeit überschreiten würde.
4 Stichprobenverfahren
Stichproben sind die Teilmenge aus einer Grundgesamtheit, die die untersuchungsrelevanten Merkmale dieser Gesamtheit möglichst genau widerspiegeln sollen (Bortz 2005: 86). Mit der zufallsgesteuerten und der nicht zufallsgesteuerten Auswahl existieren zwei Verfahrensarten zum Ziehen der Stichproben (Kromrey et al. 2016: 265). Bei den nicht zufallsgesteuerten Auswahlverfahren lässt sich zwischen der willkürlichen und der bewussten Auswahl differenzieren, während die zufallsgesteuerte Wahrscheinlichkeitsauswahl einfach oder komplex durchführbar ist (ebd.: 266 ff.). Bei Zufallsstischproben ist immer bekannt, mit welcher Wahrscheinlichkeit eine Komponente der Grundgesamtheit in die Auswahl kommt (Pospeschill 2013: 148).
Da die willkürliche Auswahl nicht repräsentativ ist (Eckey et al. 2008: 25 f.) und bei der bewussten Auswahl zur Herstellung der Repräsentativität gezielt nach bestimmten Merkmalen in der Population gesucht wird (ebd.: 27), erfolgt vorliegend nur die Betrachtung der zufallsgesteuerten Verfahren - denn wie das Fallbeispiel zeigt, sind kaum Merkmale der Grundpopulation bekannt. Mit der bewussten Auswahl wäre es daher nur schwer möglich, das Forschungsvorhaben repräsentativ durchzuführen.
4.1 Verfahren der einfachen Zufallsauswahl
Bei der einfachen bzw. einstufigen Wahrscheinlichkeitsauswahl haben alle Elemente der Grundgesamtheit die gleiche Chance, ausgewählt zu werden (Häder 2019: 157). Die bekanntesten Verfahren hierbei sind die Kartei- und die Gebietsauswahl. Beide Arten lassen sich mit einer reinen oder einer systematischen Zufallsauswahl durchführen (Kromrey et al. 2016: 266). Veranschaulicht ist dies in Abbildung 2.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2: Die Verfahren der einfachen Wahrscheinlichkeitsauswahl. Quelle: eigene Abbildung nach Kromrey et al. 2016: 266.
Bei der Karteiauswahl werden die Stichproben anhand einer Liste oder einer Kartei ausgewählt. Hierfür muss jedoch ein Verzeichnis sämtlicher Elemente vorliegen (Diekmann 2016: 381). Im Fallbeispiel der Behindertenwerkstätten liegt ein solches Verzeichnis mit den Adressdaten der 142.475 verunfallten Personen vor. Mit der reinen oder der systematischen Zufallsauswahl könnten nun Stichproben gezogen werden, denen ein Schreiben mit der Bitte um Einwilligung zugesendet wird.
[...]
1 Im Bericht der Berufsgenossenschaft Holz und Metall sind 142.475 Arbeitsunfälle angegeben. Es ist möglich, dass eine Person im Betrachtungszeitraum mehrmals verunfallt ist. Da hierzu keine Zahlen vorliegen, wird unterstellt, dass die Anzahl der Arbeitsunfälle der Anzahl der verunfallten Menschen entspricht.