Übereinstimmung von Diagnoseangaben in Befragungs- und GKV-Routinedaten
Ergebnisse einer Datenlinkage-Studie
Hintergrund: Die Häufigkeit ärztlicher Diagnosen (Diagnoseprävalenz) ist ein zentraler Kennwert in Epidemiologie und Versorgungsforschung. Ihre Schätzung fällt je nach Datengrundlage heterogen aus. Einem besseren Verständnis der Diskrepanzen dient die personenbezogene Verknüpfung von Befragungs- und GKV-Routinedaten.
Methode: Für 6 558 erwachsene Versicherte der BARMER wurden die individuellen Diagnoseangaben verschiedener Erkrankungen aus einer Befragung (Oktober bis Dezember 2021) mit den ICD-10-basierten Diagnosecodierungen (Q4/2020–Q3/2021) verglichen. Übereinstimmung wurde via zweier Kappa-Werte, Sensitivität und Spezifität bewertet.
Ergebnisse: Für den Zeitbezug der letzten 12 Monate zeigen Diagnoseangaben von Diabetes und Hypertonie mit Werten für Kappa- und PABAκ-Werten um 0,8 sowie Höchstwerten bei Sensitivität oder Spezifität eine gute bis sehr gute Übereinstimmung. Moderate Übereinstimmungen bezogen auf Kappa ergeben sich für die Diagnoseangaben von Herzinsuffizienz (0,4), Adipositas, Angststörung, Depression und koronarer Herzkrankheit (jeweils 0,5). Die Diagnoseangaben für posttraumatische Belastungsstörung (PTBS), alkoholbezogene Störung, psychische und somatoforme Störung stimmen am geringsten überein (Kappa ≤ 0,3). Mit zunehmendem Alter weichen Diagnoseangaben stärker ab.
Schlussfolgerung: Personenbezogene Diagnoseangaben aus Befragungs- und GKV-Routinedaten sind häufig diskrepant. Nur bei zwei der 11 untersuchten Erkrankungen sind die ermittelten Diskrepanzen vermutlich zu vernachlässigen. Damit bestätigt sich, dass beide Datenquellen unterschiedliche Häufigkeiten widerspiegeln. Das Alter ist eine entscheidende Einflussgröße. Weitere Gründe für Abweichungen sind zu untersuchen und vermeidbare Ursachen zu adressieren.