Labor MVZ Martinsried
Labor MVZ Martinsried

MVZ Martinsried -
Service, Qualität und Innovation

CNV (Copy Number Variation) Analyse aus NGS Daten

M. Sc. Martin Ziegler, M. Sc. Daniel Becker

Eine sichere Detektion von SNVs (Single Nucleotide Variants) und kleineren InDels (Insertionen und Deletionen) durch Next-Generation-Sequencing (NGS)-Plattformen und -Auswertesystemen ist seit Längerem Teil der Routinediagnostik. Größere Regionen (>150bp) mit Gendosisunterschied können bei short-read-Sequenzierung, technologisch bedingt, nicht durch herkömmliche Sequenzanalyse detektiert werden. Um diese Unterschiede in der Anzahl der Kopien einzelner Zielregionen (Targets) zu detektieren, wurde in der molekulargenetischen Diagnostik bisher primär eine Kombination aus Multiplex-PCR mit anschließender Fragmentlängenanalyse genutzt (MLPA). Der Nachteil dieser hochsensitiven Methode liegt jedoch in der beschränkten Verfügbarkeit. Nur für einen Bruchteil der genomischen Regionen, die mit NGS analysierbar sind, stehen kommerzielle MLPA-Kits zur Verfügung.

Ausweg aus dieser Einschränkung bietet die indirekte Detektion von CNVs aus den bereits erhobenen NGS-Daten. Für die technische Umsetzung gibt es eine große Anzahl kommerziell und öffentlich entwickelter Algorithmen, die auf Basis unterschiedlicher Methodik CNVs bzw. SVs (Strukturelle Varianten) detektieren (Pirooznia, Goes et al. 2015). Die Auswahl der grundsätzlichen Methodik ist abhängig von der Art der Sequenzierung. Deletionen, Duplikationen oder komplexere Rearrangements (Translokationen, Inversionen,…) führen zu einem Bruchpunkt im DNA-Strang. Um diese strukturellen Varianten zu detektieren, ist eine Sequenzierung dieses Bruchpunktes zwingend nötig. Hierfür ist meist eine gesamtgenomische, PCR-freie Sequenzierung nötig (WGS; Whole Genome Sequencing). Da dieser Ansatz für diagnostische Fragestellungen in der Molekulargenetik (noch) zu umfangreich bzw. kostenintensiv ist, werden bisher meist gezielt Regionen von Interesse (ROIs) angereichert und anschließend sequenziert (Panel-Sequenzierung). Für diesen Ansatz eignen sich besonders sogenannte Read-Depth-Algorithmen. Diese Technologie basiert auf der Normalisierung der Anreicherungsdaten innerhalb der Patienten eines Panels. Im Detail wird die Anzahl (Depths of Coverage) der sequenzierten DNA-Fragmente (Reads) an jeder genomischen Position bestimmt und mit den Daten eines Normalisierungskollektives abgeglichen (siehe folgende Abbildungen).

Basierend auf dieser Methode wurde im MVZ eine CNV-Analysepipeline entwickelt, um Gendosisunterschiede im Bereich von einem Target bzw. Exon zu detektieren (Becker, Ziegler et al. 2018). Zur Steigerung der Spezifität der Analyse-Pipeline werden CNVs von drei unabhängigen Algorithmen detektiert (siehe Abbildung). Mit diesem Ansatz können hetero-, hemi- und homozygote CNVs im Analysebereich mit hoher Sicherheit erfasst werden (Ziegler, Becker et al. 2018). Ein diagnostischer Mehrwert ergibt sich vor allem bei Indikationen, bei denen bisher, technisch bedingt, keine CNV-Analyse möglich war bzw. nur für eine kleine Anzahl von Genen verfügbar war (Busse, Ibisler et al. 2018).

Literatur

Becker et al, NGS based CNV calling in a clinical diagnostic setting. ASHG 2018 Annual Meeting / Busse et al, CNV Detection from Targeted NGS Data: A Case Report on a Family with Hereditary Spherocytosis. 29. Jahrestagung der Deutschen Gesellschaft für Humangenetik (2018) / Ziegler et al, CNVs from targeted NGS data: Building a cohort for validation and semiautomatic regression testing in a diagnostic setting. ASHG 2018 Annual Meeting / Pirooznia et al, Front Genet 6:138 (2015)