Information management (public biological databases)

14 belangrijke vragen over Information management (public biological databases)

Leg het onderscheid tussen primaire en secundaire databanken uit. Welk derde type onderscheiden we?

  • primair: databases met originele,  experimenteel verkregen data, zoals nucleotide seq
  • secundair: data afgeleid van analyse primaire data (bijv pathway databases)
  • specialized databases: richten zich op een specifieke onderzoeksinteresse (bijv een bepaald organisme)

Leg het onderscheid tussen redundant en non-redundant databases uit.

  • non-redundant: duplicate entries are removed (RefSeq)
  • redundant: several groups sequenced same parts ---> all in database (GenBank)

Leg het begrip minimal information standars uit.

Richtlijnen voor welke extra informatie/beschrijvingen je moet toevoegen als je je data opstuurt naar een databank.
Andere term =  MIAME standaarden: (wordt waarschijnlijk gevraagd op tentamen)
  • raw data (output na hybridisaties)
  • processed data (na normalisatie, data matrix)
  • sample annotation (experimentele factoren + bijbehorende waarden)
  • experimental design (incl sample data relationships: welke data hoort waar bij)
  • annotation of platform (array) (illumina, sanger, commerciele arrays)
  • lab and data processing protocols

eerste twee gaan dus om data, laatste 4 om metadata
  • Hogere cijfers + sneller leren
  • Niets twee keer studeren
  • 100% zeker alles onthouden
Ontdek Study Smart

Hoe vormt naamgeving een complicatie voor databanken?

Genen, eiwitten en vooral metabolieten hebben verschillende namen: soms slechts hoofdletterverschil of echt hele andere naam. Daar is ook weer een database voor: ChEBI ontolgy.Ontologieën maken om dwarsverbanden te leggen en de woorden goed uit elkaar te houden.

Leg het gevaar van error propagation uit.

  • fouten in database zijn aanwezig
  • worden doorgegeven en overgenomen
  • door info te gebruiken zet je dus foute data door --> nieuwe foute data?

Stel dat je zelf een database wil opzetten met info over humane transcriptiefactoren. Hoe pak je dit aan (met annotatie)?

  • minimale informatie standaarden
  • volgen FAIR processen
  • of andere standaarden gebruiken (SBGN, BioPax, etc)
  • set up annotation/curation

Stel je gaat een database opzetten voor bepaald journal. Hoe ga je dat opzetten?

EIgenlijk minimale informatie standaarden: MIAME
(dit moet je dus kennen)

Wat is FAIR? Hoe bereik je dit?

  • findable
  • accesible
  • interoperable
  • reproducable

zie syllabus, uitleggen hoe bereiken.

Als je voldoet aan MIAME standaarden, voldoe je dan aan FAIR?

zie syllabus

Wat houdt information management in?

Het verzamelen en beheren (managen) van informatie van één of meer bronnen, en de verspreiding van die informatie naar één of meerdere publieken.

Noem 5 criteria waaraan een database moet voldoen, wil deze in de NAR collectie worden opgenomen.

  • grondig gecureerd zijn
  • interessant zijn voor een groter aantal onderzoekers
  • comprehensive wat betreft coverage
  • een mate van toegevoegde waarde hebben (bijv handmatige curatie)
  • waarschijnlijk om lang behouden te blijven

Leg het begrip annotatie uit in de context van public biological databases.

Annotatie is de associatie van (high troughput) data, zoals eiwitsequenties, met biologische informatie uit literatuur en andere databases. Het gaat om een notitie, samenvatting of commentaar bij een deel van de data om de betekenis ervan te illustreren.
Wanneer het bijvoorbeeld om eiwitsequenties gaan, kunnen de volgende dingen relevant zijn voor annotatie:
  • functies, enzym specifieke informatie
  • biologisch relevante domeinen
  • post-trans modificaties
  • weefsel specificiteit
  • structuur
  • interacties
  • splice isoforms
  • associaties met ziekte
  • links met andere databases
  • ... 

Leg uit wat biocuration inhoudt.

Ook wel curatie genoemd. Gaat een paar stappen verder dan annotatie: waar bij annotatie informatie wordt toegewezen aan data, gaat handmatige curatie ook om verzamelen, valideren, kwaliteitscontroles, gebruik van standaarden en communicatie.
Een biocurator voert deze taken uit: controleren van data in databases, organiseren, standaarden opzetten, toegankelijk houden databases.

Noem 5 dingen die meespelen bij het kiezen van data/een database.

  • experimentele variatie ruis - data moet hoge kwaliteit hebben
  • database errors - dit gaat altijd opspelen
  • high quality annotation - annotie van een database moet netjes zijn (is er goede curatie?)(houdt men zich aan minimal information standards?)
  • non-redundancy - soms voorkeur voor gecureerde database waarin sequentie één keer voorkomt (scheelt tijd)
  • consistency - data moet consisten zijn, ook met andere databases

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

  • Een unieke studie- en oefentool
  • Nooit meer iets twee keer studeren
  • Haal de cijfers waar je op hoopt
  • 100% zeker alles onthouden
Onthoud sneller, leer beter. Wetenschappelijk bewezen.
Trustpilot-logo