Startpagina / Samenvattingen / Class notes - OMICS in Biomedical Sciences / data-databases-database

Information management (public biological databases)

14 belangrijke vragen over Information management (public biological databases)

Leg het onderscheid tussen primaire en secundaire databanken uit. Welk derde type onderscheiden we?

primair: databases met originele, experimenteel verkregen data, zoals nucleotide seq
secundair: data afgeleid van analyse primaire data (bijv pathway databases)
specialized databases: richten zich op een specifieke onderzoeksinteresse (bijv een bepaald organisme)

Leg het onderscheid tussen redundant en non-redundant databases uit.

non-redundant: duplicate entries are removed (RefSeq)
redundant: several groups sequenced same parts ---> all in database (GenBank)

Leg het begrip minimal information standars uit.

Richtlijnen voor welke extra informatie/beschrijvingen je moet toevoegen als je je data opstuurt naar een databank.
Andere term = MIAME standaarden: (wordt waarschijnlijk gevraagd op tentamen)

raw data (output na hybridisaties)
processed data (na normalisatie, data matrix)
sample annotation (experimentele factoren + bijbehorende waarden)
experimental design (incl sample data relationships: welke data hoort waar bij)
annotation of platform (array) (illumina, sanger, commerciele arrays)
lab and data processing protocols

eerste twee gaan dus om data, laatste 4 om metadata

Hoe vormt naamgeving een complicatie voor databanken?

Genen, eiwitten en vooral metabolieten hebben verschillende namen: soms slechts hoofdletterverschil of echt hele andere naam. Daar is ook weer een database voor: ChEBI ontolgy.Ontologieën maken om dwarsverbanden te leggen en de woorden goed uit elkaar te houden.

Leg het gevaar van error propagation uit.

fouten in database zijn aanwezig
worden doorgegeven en overgenomen
door info te gebruiken zet je dus foute data door --> nieuwe foute data?

Stel dat je zelf een database wil opzetten met info over humane transcriptiefactoren. Hoe pak je dit aan (met annotatie)?

minimale informatie standaarden
volgen FAIR processen
of andere standaarden gebruiken (SBGN, BioPax, etc)
set up annotation/curation

Stel je gaat een database opzetten voor bepaald journal. Hoe ga je dat opzetten?

EIgenlijk minimale informatie standaarden: MIAME
(dit moet je dus kennen)

Wat is FAIR? Hoe bereik je dit?

findable
accesible
interoperable
reproducable

zie syllabus, uitleggen hoe bereiken.

Als je voldoet aan MIAME standaarden, voldoe je dan aan FAIR?

zie syllabus

Wat houdt information management in?

Het verzamelen en beheren (managen) van informatie van één of meer bronnen, en de verspreiding van die informatie naar één of meerdere publieken.

Noem 5 criteria waaraan een database moet voldoen, wil deze in de NAR collectie worden opgenomen.

grondig gecureerd zijn
interessant zijn voor een groter aantal onderzoekers
comprehensive wat betreft coverage
een mate van toegevoegde waarde hebben (bijv handmatige curatie)
waarschijnlijk om lang behouden te blijven

Leg het begrip annotatie uit in de context van public biological databases.

Annotatie is de associatie van (high troughput) data, zoals eiwitsequenties, met biologische informatie uit literatuur en andere databases. Het gaat om een notitie, samenvatting of commentaar bij een deel van de data om de betekenis ervan te illustreren.
Wanneer het bijvoorbeeld om eiwitsequenties gaan, kunnen de volgende dingen relevant zijn voor annotatie:

functies, enzym specifieke informatie
biologisch relevante domeinen
post-trans modificaties
weefsel specificiteit
structuur
interacties
splice isoforms
associaties met ziekte
links met andere databases
...

Leg uit wat biocuration inhoudt.

Ook wel curatie genoemd. Gaat een paar stappen verder dan annotatie: waar bij annotatie informatie wordt toegewezen aan data, gaat handmatige curatie ook om verzamelen, valideren, kwaliteitscontroles, gebruik van standaarden en communicatie.
Een biocurator voert deze taken uit: controleren van data in databases, organiseren, standaarden opzetten, toegankelijk houden databases.

Noem 5 dingen die meespelen bij het kiezen van data/een database.

experimentele variatie ruis - data moet hoge kwaliteit hebben
database errors - dit gaat altijd opspelen
high quality annotation - annotie van een database moet netjes zijn (is er goede curatie?)(houdt men zich aan minimal information standards?)
non-redundancy - soms voorkeur voor gecureerde database waarin sequentie één keer voorkomt (scheelt tijd)
consistency - data moet consisten zijn, ook met andere databases

De vragen op deze pagina komen uit de samenvatting van het volgende studiemateriaal:

OMICS in Biomedical Sciences

Bekijk samenvatting

Een unieke studie- en oefentool
Nooit meer iets twee keer studeren
Haal de cijfers waar je op hoopt
100% zeker alles onthouden

Onthoud sneller, leer beter. Wetenschappelijk bewezen.

Studiemateriaal generieke omslagafbeelding

Information management (public biological databases)

14 belangrijke vragen over Information management (public biological databases)

Leg het onderscheid tussen primaire en secundaire databanken uit. Welk derde type onderscheiden we?

Leg het onderscheid tussen redundant en non-redundant databases uit.

Leg het begrip minimal information standars uit.

Hoe vormt naamgeving een complicatie voor databanken?

Leg het gevaar van error propagation uit.

Stel dat je zelf een database wil opzetten met info over humane transcriptiefactoren. Hoe pak je dit aan (met annotatie)?

Stel je gaat een database opzetten voor bepaald journal. Hoe ga je dat opzetten?

Wat is FAIR? Hoe bereik je dit?

Als je voldoet aan MIAME standaarden, voldoe je dan aan FAIR?

Wat houdt information management in?

Noem 5 criteria waaraan een database moet voldoen, wil deze in de NAR collectie worden opgenomen.

Leg het begrip annotatie uit in de context van public biological databases.

Leg uit wat biocuration inhoudt.

Noem 5 dingen die meespelen bij het kiezen van data/een database.

Samenvattingen die gerelateerd zijn aan NGS/exome sequencing

Class notes - OMICS in Biomedical Sciences

Cognitive Neuroscience the Biology of T He M…

Psychopharmacology Drugs, the Brain, and Beh…

Reader de Staat en de Mensen

Verkoop in de drogisterij

Reader de Stad

Oncologie

Class notes - Matching

Class notes - De Staat & de Mensen

Class notes - Cognitie

Class notes - van de Oerknal naar het Leven

Class notes - De Stad