Information management (public biological databases)
14 belangrijke vragen over Information management (public biological databases)
Leg het onderscheid tussen primaire en secundaire databanken uit. Welk derde type onderscheiden we?
- primair: databases met originele, experimenteel verkregen data, zoals nucleotide seq
- secundair: data afgeleid van analyse primaire data (bijv pathway databases)
- specialized databases: richten zich op een specifieke onderzoeksinteresse (bijv een bepaald organisme)
Leg het onderscheid tussen redundant en non-redundant databases uit.
- non-redundant: duplicate entries are removed (RefSeq)
- redundant: several groups sequenced same parts ---> all in database (GenBank)
Leg het begrip minimal information standars uit.
Andere term = MIAME standaarden: (wordt waarschijnlijk gevraagd op tentamen)
- raw data (output na hybridisaties)
- processed data (na normalisatie, data matrix)
- sample annotation (experimentele factoren + bijbehorende waarden)
- experimental design (incl sample data relationships: welke data hoort waar bij)
- annotation of platform (array) (illumina, sanger, commerciele arrays)
- lab and data processing protocols
eerste twee gaan dus om data, laatste 4 om metadata
- Hogere cijfers + sneller leren
- Niets twee keer studeren
- 100% zeker alles onthouden
Hoe vormt naamgeving een complicatie voor databanken?
Leg het gevaar van error propagation uit.
- fouten in database zijn aanwezig
- worden doorgegeven en overgenomen
- door info te gebruiken zet je dus foute data door --> nieuwe foute data?
Stel dat je zelf een database wil opzetten met info over humane transcriptiefactoren. Hoe pak je dit aan (met annotatie)?
- minimale informatie standaarden
- volgen FAIR processen
- of andere standaarden gebruiken (SBGN, BioPax, etc)
- set up annotation/curation
Stel je gaat een database opzetten voor bepaald journal. Hoe ga je dat opzetten?
(dit moet je dus kennen)
Wat is FAIR? Hoe bereik je dit?
- findable
- accesible
- interoperable
- reproducable
zie syllabus, uitleggen hoe bereiken.
Als je voldoet aan MIAME standaarden, voldoe je dan aan FAIR?
Wat houdt information management in?
Noem 5 criteria waaraan een database moet voldoen, wil deze in de NAR collectie worden opgenomen.
- grondig gecureerd zijn
- interessant zijn voor een groter aantal onderzoekers
- comprehensive wat betreft coverage
- een mate van toegevoegde waarde hebben (bijv handmatige curatie)
- waarschijnlijk om lang behouden te blijven
Leg het begrip annotatie uit in de context van public biological databases.
Wanneer het bijvoorbeeld om eiwitsequenties gaan, kunnen de volgende dingen relevant zijn voor annotatie:
- functies, enzym specifieke informatie
- biologisch relevante domeinen
- post-trans modificaties
- weefsel specificiteit
- structuur
- interacties
- splice isoforms
- associaties met ziekte
- links met andere databases
- ...
Leg uit wat biocuration inhoudt.
Een biocurator voert deze taken uit: controleren van data in databases, organiseren, standaarden opzetten, toegankelijk houden databases.
Noem 5 dingen die meespelen bij het kiezen van data/een database.
- experimentele variatie ruis - data moet hoge kwaliteit hebben
- database errors - dit gaat altijd opspelen
- high quality annotation - annotie van een database moet netjes zijn (is er goede curatie?)(houdt men zich aan minimal information standards?)
- non-redundancy - soms voorkeur voor gecureerde database waarin sequentie één keer voorkomt (scheelt tijd)
- consistency - data moet consisten zijn, ook met andere databases
De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:
- Een unieke studie- en oefentool
- Nooit meer iets twee keer studeren
- Haal de cijfers waar je op hoopt
- 100% zeker alles onthouden