Methoden & Technologien

Copy Number Variation Analyse aus NGS Daten
CNV-Analyse

Eine sichere Detektion von SNVs (Single Nucleotide Variants) und kleineren InDels (Insertionen und Deletionen) durch Next-Generation-Sequencing (NGS)-Plattformen und -Auswertesystemen ist seit Längerem Teil der Routinediagnostik. Größere Regionen (>150bp) mit Gendosisunterschied können bei short-read-Sequenzierung, technologisch bedingt, nicht durch herkömmliche Sequenzanalyse detektiert werden. Um diese Unterschiede in der Anzahl der Kopien einzelner Zielregionen (Targets) zu detektieren, wurde in der molekulargenetischen Diagnostik bisher primär eine Kombination aus Multiplex-PCR mit anschließender Fragmentlängenanalyse genutzt (MLPA). Der Nachteil dieser hochsensitiven Methode liegt jedoch in der beschränkten Verfügbarkeit. Nur für einen Bruchteil der genomischen Regionen, die mit NGS analysierbar sind, stehen kommerzielle MLPA-Kits zur Verfügung.

Ausweg aus dieser Einschränkung bietet die indirekte Detektion von CNVs aus den bereits erhobenen NGS-Daten. Für die technische Umsetzung gibt es eine große Anzahl kommerziell und öffentlich entwickelter Algorithmen, die auf Basis unterschiedlicher Methodik CNVs bzw. SVs (Strukturelle Varianten) detektieren (Pirooznia, Goes et al. 2015). Die Auswahl der grundsätzlichen Methodik ist abhängig von der Art der Sequenzierung. Deletionen, Duplikationen oder komplexere Rearrangements (Translokationen, Inversionen,…) führen zu einem Bruchpunkt im DNA-Strang. Um diese strukturellen Varianten zu detektieren, ist eine Sequenzierung dieses Bruchpunktes zwingend nötig. Hierfür ist meist eine gesamtgenomische, PCR-freie Sequenzierung nötig (WGS; Whole Genome Sequencing). Da dieser Ansatz für diagnostische Fragestellungen in der Molekulargenetik (noch) zu umfangreich bzw. kostenintensiv ist, werden bisher meist gezielt Regionen von Interesse (ROIs) angereichert und anschließend sequenziert (Panel-Sequenzierung). Für diesen Ansatz eignen sich besonders sogenannte Read-Depth-Algorithmen. Diese Technologie basiert auf der Normalisierung der Anreicherungsdaten innerhalb der Patienten eines Panels. Im Detail wird die Anzahl (Depths of Coverage) der sequenzierten DNA-Fragmente (Reads) an jeder genomischen Position bestimmt und mit den Daten eines Normalisierungskollektives abgeglichen (siehe folgende Abbildungen).

Basierend auf dieser Methode wurde im MVZ eine CNV-Analysepipeline entwickelt, um Gendosisunterschiede im Bereich von einem Target bzw. Exon zu detektieren (Becker, Ziegler et al. 2018). Zur Steigerung der Spezifität der Analyse-Pipeline werden CNVs von drei unabhängigen Algorithmen detektiert (siehe Abbildung). Mit diesem Ansatz können hetero-, hemi- und homozygote CNVs im Analysebereich mit hoher Sicherheit erfasst werden (Ziegler, Becker et al. 2018). Ein diagnostischer Mehrwert ergibt sich vor allem bei Indikationen, bei denen bisher, technisch bedingt, keine CNV-Analyse möglich war bzw. nur für eine kleine Anzahl von Genen verfügbar war (Busse, Ibisler et al. 2018)