T5.3 Use case “Secondary data and record linkage”

T5.3 Use case “Secondary data and record linkage”

Hintergrund

In epidemiologischen Studien werden große Mengen an Informationen über jeden einzelnen Teilnehmenden gesammelt. Dabei kommen teils aufwendige Erhebungsmethoden (z.B. Befragungen) zum Einsatz, die sehr kosten- und zeitintensiv sein können. Mitunter kann es zu Wissens- und Erinnerungslücken bei den Teilnehmenden kommen. Die Nach- und Weiternutzung bereits vorliegender (Forschungs-)Daten, inklusive deren Metadaten, können Sekundäranalysen für individuelle Fragestellungen ermöglichen. Damit können kostenintensive eigene Primärerhebungen vermieden bzw. subjektiv berichtete Fragebogendaten um objektiv gemessene Daten ergänzt werden. Als relevante Ressourcen zur Nachnutzung kommen, neben Krankheitsregistern, Sekundärdatenquellen in Frage, in denen Individualdaten für andere Zwecke als die Forschung gespeichert werden. Zu diesen gehören beispielsweise von Krankenkassen zu Erstattungszwecken erhobene Leistungsdaten.

Image

Veranschaulichung der Forschungsmöglichkeiten mit verknüpften Registern/Sekundärdaten.

Record Linkage, d.h. die Verknüpfung von Primärdaten mit Sekundär-/Registerdatenquellen oder die Verknüpfung verschiedener Sekundär-/Registerdatenquellen miteinander auf individueller Ebene, schafft Synergieeffekte. Das heißt, Record Linkage bietet die effizienteste Möglichkeit für die Gesundheitsforschung, bei der hochinformative, aber noch nicht ausreichend genutzte Daten gemeinsam genutzt und kombiniert werden, um Forschungsfragen zu beantworten, die mit herkömmlichen Ansätzen auf Basis einer einzelnen Datenquelle nicht beantwortet werden können. Auf diese Weise könnten Daten aus klinischen Studien mit medizinischen Versorgungsdaten oder sogar mit anderen sozialen Daten anreichert werden, was einen ganzheitlicheren Ansatz ermöglichen würde, wenn es z. B. um die Analyse der Wirksamkeit und Langzeittoxizität von Arzneimitteln geht. Die Nach- und Weiternutzung derartiger Daten und die Verknüpfung solcher Daten mit anderen Datenquellen für Forschungszwecke steht in Deutschland derzeit noch vor einigen zu lösenden Herausforderungen. Dazu gehören die für Deutschland geltenden strengen Datenschutzbestimmungen, ein fehlender eindeutiger Identifikator (Unique Identifier) und eine limitierte Daten-Interoperabilität wie einheitliche Datenstandards, -formate und Semantiken.

Unsere Ziele

Einführung von Standards für die Veröffentlichung von Metadaten über Sekundärdaten

Entwicklung und Pilotierung von Data-Access-Infrastrukturen

Bewertung der Nützlichkeit und Machbarkeit von Record Linkage-Möglichkeiten (in Zusammenarbeit mit TA6 "Privacy & Data Access in Concert")

Erarbeitung von Lösungen zur Verbesserung des Record Linkage (in Zusammenarbeit mit TA6 “Privacy & Data Access in Concert”)

Ergebnisse & laufende Arbeiten

In Zusammenarbeit mit TA2 "Standards for FAIR Data" und TA3 "Services" arbeiten wir an der Entwicklung eines Metadatenschemas und Standards sowohl fürs Datensatzverknüpfungen als auch für Sekundär-/Registerdaten. Dies beinhaltet:

  • Die Identifizierung vorhandener und fehlender Standards für die "Standardization and interoperability roadmap",

  • Die Erstellung eine Übersicht geeigneter Standards für ein Record Linkage mit Sekundär-/Registerdaten, d.h.  die "Identifikation relevanter Datenformate, Standards und Terminologien für die Interoperabilität" (Lesen Sie mehr über Datenharmonisierung),

  • Die Integration von Metadatenfelder zu Sekundär-/Registerdaten und des Record Linkage-Moduls in den German Central Health Study Hub und in das dahinterliegende Metadatenschema,

  • Die Entwicklung eines Implementierungsleitfaden, insbesondere einer Beschreibung des Record Linkage-Moduls, für das Metadatenschema.

Image

Screenshot einer Suche nach Metadaten der Sekundärdatenquelle "GePaRD" auf dem German Central Health Study Hub.

White Paper: Verbesserung des Record Linkage für die Gesundheitsforschung in Deutschland

In Deutschland ist es aktuell schwer, Gesundheitsdaten aus verschiedenen Quellen zu verknüpfen. Das behindert die Gesundheitsversorgung deutlich – auch gerade im Vergleich zu europäischen Nachbarländern. Um dem entgegenzuwirken, hat NFDI4Health mit weiteren Expert:innen, unter anderem aus der Medizininformatik-Initiative und dem Netzwerk Universitätsmedizin, ein White Paper zum Record Linkage erarbeitet. Das White Paper beschreibt die Hindernisse für eine effektive Nutzung von Gesundheitsdaten und liefert praktikable und bürokratiearme Lösungen, die im Einklang mit der Europäischen Datenschutz-Grundverordnung stehen. Das White Paper verfolgt einen interdisziplinären Ansatz Forschende bei ihren Projekten zur Verknüpfung von Datensätzen anzuleiten und zu unterstützen und gibt dem Gesetzgeber die folgenden 4 zentralen Empfehlungen:

  1. Einführung eines eindeutigen Identifikators für Personen (Unique Identifier)

  2. Etablierung von bereichsspezifischen Pseudonymen

  3. Etablierung einer dezentral-föderierten Forschungsdateninfrastruktur mit zentralen Komponenten zur Datenverknüpfung

  4. Aufbau einer zentralen Aufsichts- und Genehmigungsbehörde

Link zum White Paper | Pressemitteilung White Paper | News-Beitrag White Paper

Outreach Aktivitäten

NFDI4Health organisierte mehrere Veranstaltungen, um die Community einzubeziehen und Unterstützung zum Record Linkage anzubieten:

Über 20 Vorträge über den Status quo & unsere politischen Forderungen

Über 20 Vorträge über den Status quo & unsere politischen Forderungen

Mehre Workshops zum White Paper, um Input von Experten zu erhalten

Einige Beispiele

Bereitstellung einer kommentierten Vorlage für ein Informed Consent-Formular

Bereitstellung einer kommentierten Vorlage für ein Informed Consent-Formular

Das White Paper, unsere Outreach-Aktivitäten und die kommentierte Vorlage für ein Informed Consent-Formular wurden in Zusammenarbeit mit TA6 “Privacy & Data Access in Concert” entwickelt.

Publikationen

Abaza H, Shutsko A, Golebiewski M, Klopfenstein S, Schmidt CO, Vorisek CN, Brünings-Kuppe C, Clemens V, Darms J, Hanß S, Intemann T, Jannasch F, Kasbohm E, Lindstädt B, Löbe M, Orban E, Perrar I, Peters M, Sax U, Schulze MB, Schupp C, Schwarz F, Schwedhelm C, Strathmann S, Waltemath D, Wünsche H, Zeleke A. The NFDI4Health metadata schema (V3_3). Köln 2023. https://repository.publisso.de/resource/frl%3A6472531

Intemann T, Kaulke K, Kipker D-K, Lettieri V, Stallmann C, Schmidt CO, Geidel L, Bialke M, Hampf C, Stahl D, Lablans M, Rohde F, Franke M, Kraywinkel K, Kieschke J, Bartholomäus S, Näher A-F, Tremper G, Lambarki M, March S, Prasser F, Haber AC, Drepper J, Schlünder I, Kirsten T, Pigeot I, Sax U, Buchner B, Ahrens W & Semler S. White Paper: Verbesserung des Record Linkage für die Gesundheitsforschung in Deutschland. 2023. https://doi.org/10.4126/FRL01-006461895

Intemann T, Lettieri V, Kipker DK, Kuntz A, Ahrens W, Pigeot I, Buchner B, Sax U, Fluck J, Fröhlich H, Geok Ng H, Hahn H, Kirsten T, Lange JJ, Lassen-Schmidt B, Prause G, Richter A, Schmidt C. Informed Consent zum Record Linkage: Best Practice und Mustertexte. Publisso, 2023. https://doi.org/10.4126/FRL01-006399943

Pigeot I, Fröhlich H, Intemann T, Prause G, Wright MN. KI und die Nationale Forschungsdateninfrastruktur für personenbezogene Gesundheitsdaten (NFDI4Health). In: Dössel OS, Tobias; Rutert, Britta, editor. Künstliche Intelligenz in der Medizin. Denkanstöße aus der Akademie: Eine Schriftenreihe der Berlin-Brandenburgischen Akademie der Wissenschaften, Nr. 11. Berlin: Berlin-Brandenburgische Akademie der Wissenschaften; 2023. p. 62-74. https://edoc.bbaw.de/frontdoor/index/index/docId/3807

Pigeot I, Intemann T, Kollhorst B, Sax U, Ahrens W. FAIRifizierung von Real World Data für die Gesundheitsforschung: Ein Petitum für modernes Record Linkage. Prävention und Gesundheitsförderung. Präv Gesundheitsf (2022). https://link.springer.com/article/10.1007/s11553-022-00973-x

Ansprechpartner:innen

This image for Image Layouts addon

Prof. Dr. Iris Pigeot

Measure-Lead: T5.3 “Use case Secondary data and record linkage”
E-Mail: pigeot@leibniz-bips.de 
Phone: +49 (0)228 73-60351

Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS GmbH
Achterstraße 30
D-28359 Bremen 

This image for Image Layouts addon

Prof. Dr. Wolfgang Ahrens

Measure-Lead T5.3 “Use case Secondary data and record linkage”
E-Mail: ahrens@leibniz-bips.de
Phone: +49 (0)421 218-56822

Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS GmbH
Achterstraße 30
D-28359 Bremen