NGS/exome sequencing

24 belangrijke vragen over NGS/exome sequencing

Geef de 4 stappen van klassieke Sanger sequencing.

  • fragmenteren van DNA (shotgun)
  • amplificeren DNA (dit vooral kostte heel veel tijd, klonering)
  • extension en chain termination
  • electrophoresis

Wat is de doorbraak die leidde tot ontwikkeling van NGS ( = high troughput sequencing)?

Methoden waarmee het meteen gedetecteerd kan worden als een gelabelde nucleotide wordt ingebouwd. Dus tijdens synthese vindt detectie plaats --> snelheid omhoog.
Eerste machine = 454 Life sciences sequencer, dus op basis van pyrosequencing.

Hoe wordt een DNA library gemaakt?

Fragmentatie van gDNAs, daaraan bepaalde adaptors ligeren. Daaraan ga je je primers zetten.

Illumina: gevolgd door cluster amplificatie.
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Wat is het doel van sequence alignment?

Na sequencen: miljoenen short sequence reads, maar waar horen ze bij, wat representeren ze?
Daartoe: alignen van sequences met een reference genome om identiteit te bepalen.
BLAST/BWA gebruiken: deze leggen de reads op de juiste positie op de referentie sequentie.

Wat houdt de term coverage in? Waarom is deze term relevant?

Ook wel sequence depth genoemd. Twee interpretaties:
  1. Per nucleotide-positie tellen hoeveel reads overlappend zijn. Dan krijg je dus bijv een coverage van 4, als 4 reads dit nucleotide beslaan.
  2. kijken hoeveel procent van de referentie sequentie is afgedekt met reads --> percentage.

  De coverage zegt iets over de kwaliteit van de analyse.

Mate Pairs/Paired-end sequencing zijn veelgebruikte technieken. Leg uit wat ze inhouden.

  • Paired end: fragmentation of genomic DNA into short segments, followed by sequencing of both ends of the segment.
  • Mate Pairs: gDNA: circulair, ook aan twee uiteinden.

Je weet welke reads bij elkaar horen (komen uit zelfde fragment uit DNA library): daartussen mis je dus een stuk (stuk in midden wordt niet gesynthetiseerd).
Protocollen compleet anders. voor analyse: belangrijk is dat er bij mate pairs meer afstand tussen de reads zit.

Waarmee kan gekeken worden naar inserties en deleties in het DNA?

Mate-pairs sequencing (wordt uitgelegd in werkcollege) (komt in tentamen): detection of structural variation.

Veel complexe elementen van het humane genoom kunnen niet in kaar gebracht worden met short-read paired end sequencing: de onderdelen zijn te lang. Met welke techniek kan dit worden opgelost?

Long-read sequencing
  • single-molecule real-time sequencing approaches (bar code library preparation: multiplexing)
  • synthetic approaches (rely on existing short-read approaches --> in silico construction)

Waarom is exome sequencing relevant/wat is het doel?

Middels exome sequencing kunnen gen varianten geïdentificeerd worden die (zeldzame) Mendeliaanse ziekten veroorzaken.
Dus: op zoek naar genvarianten in speficieke protein coderende regio's.

Wat voor varianten kun je identificeren met exome sequencing?

  • Single nucleotide polymorphism: punt mutatie dat heeft volstaan in de populatie.
  • Indels (insertie/deletie)

Wat is een exon capture? Waarom voeren we dit uit?

  • cruciale stap in exome sequencing
  • procedure om introns en intergenic regions van het DNA te verwijderen
  • daarna kan vervolgd worden met sequencing: waar we dan dus minder van hoeven te doen! (slechts paar procent DNA is eiwit-coderend)

Stel: je hebt een exon capture uitgevoerd? Bevat het DNA dan nog introns? Welke extra info krijgen we zo mee?

JA
bijv wasstap niet helemaal succesvol. of probe neemt nog deel mee.
exome sequencing geeft dus ook inzicht in exome splice sites.

Wat is het resultaat van NGS in exome sequencing? Wat is de vervolgstap?

  • Millions of sequence reads! (nog steeds)
  • Bioinformatica begint: referentie DNA sequentie nodig, bijv vanuit public data base
  • Die hebben we nodig, om een lijst van nucleotide differences tussen patiënt en referentie te verkrijgen.
  • Filtering op die lijst toepassen.
  • In die lijst willen we alle verschillen die geen experimentele sequencing errors zijn.

Hoe krijg je uit een exome sequencing lijst de juiste SNPs?

Eerst heb je een lijst met verschillen met referentie. Maar gaat dit om seq errors, of echte mutaties? En zijn het dan ook de disease causing mutaties?
  1. Wegfilteren errors
  2. SNPs shared  between patients. Patienten onderling vergelijken: dan zie je bijv één gen wat in alle patiënten is gemuteerd. --> verder valideren: bioinformatica en terug naar het lab. maar anderen kun je weggooien.
  3. list of synonymous SNPs: SNPs die het eiwit niet gaan veranderen kun je ook weggooien

Leg uit hoe identificatie van zeldzame en veel voorkomende ziektes werkt via verschillende technieken.

  • zeldzaam = high impact --> identificeren via exome seq
  • common = low impact --> GWAS. most are in regulatory regions --> geen exome seq
  • GWAS: meer kandidaten nodig.

Waarom zijn zeer zeldzame ziekten erg moeilijk te onderzoeken met linkage analysis?

  • Zo zeldzaam en zo ernstig dat de mutatie eigenlijk niet wordt doorgegeven aan volgende generatie.
  • het zijn dus waarschijnlijk de novo mutaties die ontstaan in de germ line
  • dus geen linkage analyse door generaties
  • statistisch niet te doen

Dus: argument voor exome sequencing. (+ kosten)

Welke informatie kan meegenomen worden in de analyse bij exome sequencing?

  • manier van overerving ziekte (dom/rec)
  • of het een de novo mutatie is
  • extend of locus heterogeneity: of het door meerdere mutaties wordt veroorzaakt.
  • populatiestructuur

Waarom is het makkelijker om recessieve mutatieziekten te identificeren met exome sequencing?

Dan hoef je alleen nog naar kandidaten te kijken waarbij 2 mutaties aanwezig zijn: gaat veel minder voortkomen.

Hoe onderzoek je de novo mutaties?

Door DNA van ouders zonder de ziekte en van het kind met de ziekte te bekijken: zoek de verschillen. Maar je kunt ook common variants zoeken binnen een patiënten groep.

Voor exome sequencing moet dus een exome capture worden uitgevoerd. Leg de procedure van exome capture uit.

  • ontwerpen van capture probes (die zijn complementair aan exonen) (bioinformatica speelt hier een rol in design!)
  • ontwikkelingen: steeds meer probes beschikbaar. maar je neemt dus niet per se alles mee. dit is dus ook een probleem. Daarom argument om toch compleet te sequencen, nu dit steeds goedkoper wordt.
  • je kunt dit doen via microarray capture (probes zitten vast) en solution capture  (probes in oplossing).

Geef 4 mogelijke uitkomsten van alignment procedures.

  • alignment op unieke positie --> houden
  • alignment op meerdere posities --> weg
  • alignment met lage betrouwbaarheid (veel mismatches) --> weg
  • geen alignment gevonden (experimentele artefacten) --> weg

Na identificatie van echte SNPs (exome seq) gooi je alle bekende mutaties in dbSNP public databases eruit. Waarom?

We kijken naar een zeldzame aandoening. de kans dat deze mutatie al eens is gevonden is heel klein. Je kunt wel pech hebben dat het m toch is! je kunt er ook voor kiezen om alleen die weg te gooien met hoge allelfrequentie.

Waarom gooi je SNPs die voorkomen in Segmental Duplications (SDs)?

Je krijgt alignments op twee plekken, doordat ze op twee stukken voorkomen. Ze verschillen mogelijk wel iets (gebeurt in evolutie), en dan ga je dus vals positieve verschillen vinden.

Geef 4 limitaties van exome sequencing.

  • technical failure (eg probes)
  • filtering kan causale variant verwijderen
  • genetische heterogeniteit maakt vinden gen moeilijk
  • false positive variants

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo