Tenttiwiki

Geneettinen bioinformatiikka (v. 2012 alkaen Bioinformatiikan perusteet)

19.2.2013

 1. Fylogeneettisen puun aineistosta tehdään bootstrap-analyysi tilastollisen uskottavuuden testaamiseksi. Saatu puu näyttää erilaiselta kuin alkuperäinen. Kumpi puu on “uskottavampi”.
 2. Sinulla on tiedossasi ihmisen YFG1 geenin DNA sekvenssi. Haluat löytää hiiren vastaavan ortologisen geenin. Kerro mitä ohjelmaa käytät ja mitä parametrejä sinun on muutettava ja miksi jotta saat hakusi kokonaisajan nopeutumaan.
 3. Olet saanut tehtäväksi paikantaa geenialua ja mahdollisesti tunnistaa geeni, jossa oleva mutaatio/polymorfia aiheuttaa ennen tunnistamattoman vakavan sairauden ja näyttää periytyvän tässä ihmisen sukupuussa. Kuvaa tutkimussuunnitelma metodeista datan analyysiin. Pelkkä listaus ei riitä. Avuksi annettiin lisäksi listä kysymyksiä ja sukupuu.
 4. Mistä termistä lyhenne muodostuu. Selitä lyhyesti mitä termi tarkoittaa käytännössä.
 • LOD
 • CCDS
 • RNAseq
 • GWAS
 • NGS
 • IBD ja IBS
 • Hs.
 • IUPAC

22.2.2012

 1. Selitä lyhyesti
  • Miksi jotkut SNP:t esiintyvät vain joissakin väestöissä/populaatioissa? (1p)
  • Kuinka monta eriliasta juuretonta puuta on olemasssa, jos tutkittavia taksoneita on seitsemän? (0,5p)
  • Kytkentäanalyysin idea omin sanoin. (max ½ sivua, 1,5p)
 2. Laadi alla annetun neljän Drosophila-lajin sekvenssiainoistosta parsimoniapuu. Mitkä nukelotidikohdat ovat indormatiivisia? (3p)
 D. mel A G T C C G G A T  
 D.sim A A T C C A G A T  
 D.hum C A C T T G G A C  
 D.tim A A C T A A G G C
 1. Olet juuri tullut valituksi tekemään gradua narkolepsian tutkimusryhmään. Ryhmä on kehittänyt narkolepsian hiirimallin, jonka avulla narkolepsian molekulaarisisia mekanismeja tutkitaan. Mistä kaikkialta etsisit taustatietoa taudista ja malliorganismista? (2p)
 2. Laske seuraavan sekvenssirinnastuksen saama pistemäärä mielestäsi sopivimmalla pisteytysmatriisilla (luentomonisteista)(1p). Käytä aukon avaamissakkoa 12 ja jatkamissakkoa 4. Perustele pisteurusmatriisivalintasi (1p).
 QLKEKKVRCRSLAHLAAPVQKK-EKEA
 
 QALEQRVRCR-LAHHLASVQKEPEKAA

23.2.2011

 1. Määrittele lyhyesti
  • GenScan (1 p)
  • Dottup (1 p)
  • Entrez (1 p)
 2. Sinun pitäisi laskea Karlin-Altschul-suureen arvo, kun käytetään BLOSUM50-matriisia aukkosakoilla avaamissakko 15 ja jatkamissakko 8. Kirjoita kaava auki. Mitkä ovat tarvittavat K:n ja λ:n arvot? (2 p)
 3. EMBL-pankin näyte-entry (IL-16 mRNA ihmisestä). Mitä tarkoittavat merkinnät (2 p)
  • db_xref=“GOA:Q14005”
  • db_xref=“HGNC:5980”
  • db_xref=“InterPro:IPR001478”
  • db_xref=“PDB:1X6D”
  • db_xref=“UniProtKB/Swiss-Prot:Q14005”
 4. Käytä seuraavan sekvenssin linjaamiseen Smith-Waterman-algoritmia BLOSUM62-pisteytysmatriisilla:
  • PGSEIPW
  • EFPGDIW

Aukkosakot ovat yksinkertaisuuden vuoksi nollat eli aukon avaamisesta 0 ja jatkamisesta sakotetaan 0 p. Laske ja kirjoita taulukon solujen arvot näkyviin sekä lopuksi kirjoita auki itse rinnastus. (3 p)

21.4.2010

 1. Määrittele lyhyesti
  • Hapmap (1p)
  • Ultranopea metabolisointi (1p)
  • Algoritmi (1p)
 2. Miksi geeniekspressioanalyysin ryhmittely- eli klusterointianalyysissä tehdään? Miksi = mitä sillä yritetään savuttaa? (2p)
 3. Millä todennäköisyydellä kahden yhtä pitkan (250ah) sekvenssin linjauksen pistemäärä on 75? Linjaus on tehty PAM250-matriisia käyttäen, aukon avaussakko 10 ja jatkamissakko 8. Auki kirjoitettu kaava oikein valituilla numeroarvoilla riittää vastaukseksi (tarkkaa lukuarvoa ei siis tarvitse laskea). (2p)
 4. Laadi alla annettujen neljän Drosophila-lajin sekvenssiaineistosta parsimoniapuu (2p) Mitkä nukleotidikohdat ovat informatiivisia? (1p)
 D. mel A G T C C G G A C
 D.sim A G T G C C G A T 
 D.hum C G C T A G C A T
 D.tim A A C T A C G G C

24.2.2009

 1. Selitä hyvin lyhyesti seuraavat termit ja anna esimerkki käytöstä bioinformatiikassa:
  • parsimonian periaate
  • suurimman uskottavuuden menetelmät
  • dynaaminen ohjelmointi
  • SNP:t
  • annotaatio
 2. Laske seuraavan sekvenssirinnastuksen saama pistemäärä mielestäsi sopivimmalla pisteytysmatriisilla ja aukkosakoilla (ks luentomuistiinpanot). Onko linjaus mielestäsi ylipäätään järkevä? Perustele myös pisteytysmatriisivalintasi.
  • QLKEQKARCRSLSHLAAPVQKK-EKEA
  • QLKEQRVRCR-LAHLLASAQKEPEKAA
 3. Rakenna UPGMA-puu HIV1-kannoille A-D, joista tiedetään, että kannat A ja B eroavat toisistaan yhteensä 14 substituution verran, A ja C 20 substituution verran, A ja D 46 substit. B ja C eroavat 22, B ja D 44 substit., C ja D eroavat 48 substituutiolla. Sekvenssin pituus on kaikilla 100 bp. Käyttäkää absoluuttisia etäisyyksiä ilman JC-korjausta:
  • millainen etäisyysmatriisi syntyy
  • millainen puu syntyy
  • mikä on A:lle läheisintä sukua oleva populaatio
  • onko A- ja B-populaatioiden lähin yhteinen kantamuoto vanhempi kuin A:n ja D:n
  • miten puu muuttuisi, jos JC-etäisyys otettaisiin huomioon
 4. Saat mahdollisuuden tehdä pro gradu-työsi bioinformatiikasta keväällä 2010 tutkimalla sataa valitsemaasi kohdetta, joiden koko genomit sekvenoidaan pyynnöstäsi. Mitä valitsisit? Miksi? Mitä analyysejä tekisit tutkielmaan? Mitä ongelmia epäilet työn kuluessa tulevan vastaan? Miten raportoisit tuloksista?