NGS/exome sequencing
24 belangrijke vragen over NGS/exome sequencing
Geef de 4 stappen van klassieke Sanger sequencing.
- fragmenteren van DNA (shotgun)
- amplificeren DNA (dit vooral kostte heel veel tijd, klonering)
- extension en chain termination
- electrophoresis
Wat is de doorbraak die leidde tot ontwikkeling van NGS ( = high troughput sequencing)?
Eerste machine = 454 Life sciences sequencer, dus op basis van pyrosequencing.
Hoe wordt een DNA library gemaakt?
Illumina: gevolgd door cluster amplificatie.
- Hogere cijfers + sneller leren
- Niets twee keer studeren
- 100% zeker alles onthouden
Wat is het doel van sequence alignment?
Daartoe: alignen van sequences met een reference genome om identiteit te bepalen.
BLAST/BWA gebruiken: deze leggen de reads op de juiste positie op de referentie sequentie.
Wat houdt de term coverage in? Waarom is deze term relevant?
- Per nucleotide-positie tellen hoeveel reads overlappend zijn. Dan krijg je dus bijv een coverage van 4, als 4 reads dit nucleotide beslaan.
- kijken hoeveel procent van de referentie sequentie is afgedekt met reads --> percentage.
De coverage zegt iets over de kwaliteit van de analyse.
Mate Pairs/Paired-end sequencing zijn veelgebruikte technieken. Leg uit wat ze inhouden.
- Paired end: fragmentation of genomic DNA into short segments, followed by sequencing of both ends of the segment.
- Mate Pairs: gDNA: circulair, ook aan twee uiteinden.
Je weet welke reads bij elkaar horen (komen uit zelfde fragment uit DNA library): daartussen mis je dus een stuk (stuk in midden wordt niet gesynthetiseerd).
Protocollen compleet anders. voor analyse: belangrijk is dat er bij mate pairs meer afstand tussen de reads zit.
Waarmee kan gekeken worden naar inserties en deleties in het DNA?
Veel complexe elementen van het humane genoom kunnen niet in kaar gebracht worden met short-read paired end sequencing: de onderdelen zijn te lang. Met welke techniek kan dit worden opgelost?
- single-molecule real-time sequencing approaches (bar code library preparation: multiplexing)
- synthetic approaches (rely on existing short-read approaches --> in silico construction)
Waarom is exome sequencing relevant/wat is het doel?
Dus: op zoek naar genvarianten in speficieke protein coderende regio's.
Wat voor varianten kun je identificeren met exome sequencing?
- Single nucleotide polymorphism: punt mutatie dat heeft volstaan in de populatie.
- Indels (insertie/deletie)
Wat is een exon capture? Waarom voeren we dit uit?
- cruciale stap in exome sequencing
- procedure om introns en intergenic regions van het DNA te verwijderen
- daarna kan vervolgd worden met sequencing: waar we dan dus minder van hoeven te doen! (slechts paar procent DNA is eiwit-coderend)
Stel: je hebt een exon capture uitgevoerd? Bevat het DNA dan nog introns? Welke extra info krijgen we zo mee?
bijv wasstap niet helemaal succesvol. of probe neemt nog deel mee.
exome sequencing geeft dus ook inzicht in exome splice sites.
Wat is het resultaat van NGS in exome sequencing? Wat is de vervolgstap?
- Millions of sequence reads! (nog steeds)
- Bioinformatica begint: referentie DNA sequentie nodig, bijv vanuit public data base
- Die hebben we nodig, om een lijst van nucleotide differences tussen patiënt en referentie te verkrijgen.
- Filtering op die lijst toepassen.
- In die lijst willen we alle verschillen die geen experimentele sequencing errors zijn.
Hoe krijg je uit een exome sequencing lijst de juiste SNPs?
- Wegfilteren errors
- SNPs shared between patients. Patienten onderling vergelijken: dan zie je bijv één gen wat in alle patiënten is gemuteerd. --> verder valideren: bioinformatica en terug naar het lab. maar anderen kun je weggooien.
- list of synonymous SNPs: SNPs die het eiwit niet gaan veranderen kun je ook weggooien
Leg uit hoe identificatie van zeldzame en veel voorkomende ziektes werkt via verschillende technieken.
- zeldzaam = high impact --> identificeren via exome seq
- common = low impact --> GWAS. most are in regulatory regions --> geen exome seq
- GWAS: meer kandidaten nodig.
Waarom zijn zeer zeldzame ziekten erg moeilijk te onderzoeken met linkage analysis?
- Zo zeldzaam en zo ernstig dat de mutatie eigenlijk niet wordt doorgegeven aan volgende generatie.
- het zijn dus waarschijnlijk de novo mutaties die ontstaan in de germ line
- dus geen linkage analyse door generaties
- statistisch niet te doen
Dus: argument voor exome sequencing. (+ kosten)
Welke informatie kan meegenomen worden in de analyse bij exome sequencing?
- manier van overerving ziekte (dom/rec)
- of het een de novo mutatie is
- extend of locus heterogeneity: of het door meerdere mutaties wordt veroorzaakt.
- populatiestructuur
Waarom is het makkelijker om recessieve mutatieziekten te identificeren met exome sequencing?
Hoe onderzoek je de novo mutaties?
Voor exome sequencing moet dus een exome capture worden uitgevoerd. Leg de procedure van exome capture uit.
- ontwerpen van capture probes (die zijn complementair aan exonen) (bioinformatica speelt hier een rol in design!)
- ontwikkelingen: steeds meer probes beschikbaar. maar je neemt dus niet per se alles mee. dit is dus ook een probleem. Daarom argument om toch compleet te sequencen, nu dit steeds goedkoper wordt.
- je kunt dit doen via microarray capture (probes zitten vast) en solution capture (probes in oplossing).
Geef 4 mogelijke uitkomsten van alignment procedures.
- alignment op unieke positie --> houden
- alignment op meerdere posities --> weg
- alignment met lage betrouwbaarheid (veel mismatches) --> weg
- geen alignment gevonden (experimentele artefacten) --> weg
Na identificatie van echte SNPs (exome seq) gooi je alle bekende mutaties in dbSNP public databases eruit. Waarom?
Waarom gooi je SNPs die voorkomen in Segmental Duplications (SDs)?
Geef 4 limitaties van exome sequencing.
- technical failure (eg probes)
- filtering kan causale variant verwijderen
- genetische heterogeniteit maakt vinden gen moeilijk
- false positive variants
De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:
- Een unieke studie- en oefentool
- Nooit meer iets twee keer studeren
- Haal de cijfers waar je op hoopt
- 100% zeker alles onthouden