Warning: Declaration of action_plugin_captcha::register(&$controller) should be compatible with DokuWiki_Action_Plugin::register(Doku_Event_Handler $controller) in /var/www/fs3/43/helixryf/public_html/tenttiwiki/lib/plugins/captcha/action.php on line 0
bioinformatiikan_tyoet - Tenttiwiki
Tenttiwiki

Bioinformatiikan työt

4.4.2012

  1. Vastaa seuraaviin kysymyksiin lyhyesti. (yht. 3 p)
    • Etsi GO-tunnuksen 0016322 biologinen kuvaus ja pääluokka. (1p)
    • Kuinka moneen ihmisen geeniin GO-luokka mitochondrial large ribosomal subunit liittyy? (1p)
    • Luettele edellisen kohdan geeneille uniikit evidence koodit. (1p)
  2. Mitä tekee EMBOSSin komento/ohjelma sixpack (1p)? Entä wobble (1p)? Jos haluaisit visualisoida sekvenssin linjauksen pistematriisimenetelmällä (dotplot), mitä EMBOSSin komentoja/ohjelmia voisit käyttää (1p)?
  3. Olet genotyypannut SNPn neljästä eri kandidaattigeenistä otoksessa sairaita ja terveitä. Data (tenttidata.ped ja tenttidata.map) löytyy Moodlesta samalta sivulta kuin tenttikysärit. Tehtävänäsi on selvittää, mitkä SNPeistä assosioituvat tautiin. Tee analyysit Plinkillä. Muista ensin poistaa liian huonosti genotyyppautuneet yksilöt /markkerit. Huomaa myös, että tästä datasta puuttuu family-id ja sairaat on koodattu ykkösiksi ja terveet nolliksi: tämän vuoksi, käytä plink-komentorivilläsi joka kerta määreitä –no-fid ja –1. Siis, plink … … –no-fid –1
    • Kuinka monta sairasta ja tervettä datassa on (ennen pruningia)? 0,5 p
    • Kuinka monta naista ja miestä (ennen pruningia)? 0,5 p
    • Mikä kandigeeneistä saa parhaan p-arvon? 1 p
    • Mitä sanoisit muiden kandigeenien p-arvoista? 1 p
    • Aja vielä genotyyppiassosiaatiot: miten tulkitset tuloksesi edellisten valossa? 1 p
  4. Oheiset sekvenssit ovat muutamien ihmisapinoiden DNA-sekvenssejä. Rakenna ensin MSA ja rekonstruoi sen perusteella fylogeneettinen puu. Analysoi saamiasi tuloksia: tee luotettavuusanalyysi. Mitä voisit sanoa lajien sukulaisuussuhteista tämän aineiston pohjalta saamasi puun perusteella? Entä voitko päätellä jotakin geenin evoluutiosta? (yht. 5 p)
 >Human
 ACTGCACTCACCGCACCCGGCCAATTTTTGTGTTTTTAGTAGAGACTAAATACCATATAGTGAACAC
 CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGTCGGAG
 ATTGAGCGCGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCCGGGCGGCGAAGCT
 GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 GTCGCAGGGCGCGGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 GGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 GGAAAGGTGCGGCAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCCC
 GGACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCTTTCGCCGCCACGAGGAC
 CTACTTCTCCCACCTGGACCTG
 
 >Chimp1
 ACTGCACTCACCGCACCCGGCCAATTTTTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
 CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
 ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
 GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 GTCGCAGGGCGCCGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 GGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 GGAGAGGTAGCGCGAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCC
 GGAACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCCACGAAGA
 CCTACTTCTCCCACCTGGACCTG
 
 > Chimp2
 ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
 CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
 ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
 GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 GTCGCAGGGCGCCGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 GGTGCGCGCCCTGTGGAACCGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 GGAAAGGTGCGGCAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCCC
 GGACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCTTTCGCCGCCACGAGGAC
 CCTACTTCTCCCAACTGGACCTG
 
 > Chimp3
 ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
 CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
 ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
 GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 GTCGCAAAGGCGCCGCGGGTACCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 GGTGCGCGCCCTGTGGAACCGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 GGAGAGGTAGCGCGAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCC
 GGAACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCCACGAAGG
 CCGACTTCTCCCAACTGGACCTG
 
 >Baboon
 ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAAAACTATATGG
 TGAACACCTAAGACGCGGGGGCCTTGGATCCAGGGCGATTCAGAGTTCCCCCGGTCGGAGCAGTCGGAGA
 TGGAGGCCGCGCGGTCCCGGGATCCGGGACCAGGCCCTGCACCCCAGGGTGGCGAGGCTGCAGCGCGGCG
 CCCCCTGGTGGCCGCGGGACCCCTGGCCGGTCTTTTGCAGGCGCAGCGCGGGCGCAGGGCGCGGCGGGTTC
 CAGCGCGGGAATGGCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAACTGGGAAGC
 AATGTTGGCGTCTATGCTACTGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCTCCGGGGC
 CCTGCCTCCCCAAGCCCCCCGGACGCGCCTCACCGCCGTTCCTCTCGCAGGACCTTCCTGGCTTTCCCCG
 CCACGAAGACCTACTTCTCCCACCTAGACCTG
 
 >Orang2
 ACTGCACTCACCGCACCTGGCCAATTTTTGTGTTTTTACTAGAGACTAAAAACCATATGGTGAACACCTC
 CACCGGGGGGCCTTGGATCCAGGCAATTCAGAGGGCCCCGGTCGGAGCTGTCGGAGATGGAGCGCGCGCG
 CTCCCGGGATCCCGGACGAGGCCCTGGACCCCAGGGCGGCGAGGCTGCAGAGAGGCGCCCCCTGGAGGCC
 GCGGGACCCCTGGCCGGTTCGCGCAGGCGCGGCGGGGACGCAGGGCGCGGCGGGTTCCAGCGCGGGGATG
 GCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCT
 ACACGACAGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCCCAGGGCCCTCCCTCCCCAAG
 CCCCCCGGACTCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCAACGAAGACCTAC
 TTCTCCCACCTGCCCACCTG
 
 >Orang3
 ATGCACTCACCGCACCTGGCCAATTTTTGTGATTTTACTAGAGACTAAAAACCATATGGTGAACACCTC
 CACCGGGGGGCCTTGGATCCAGGCAATTCAGAGGGCCCCGGTCGGAGCTGTCGGAGATGGAGCGCGCGCG
 CTCCCGGGATCCCGGACGAGGCCCTGGACCCCAGGGCGGCGAGGCTGCAGAGAGGCGCCCCCTGGAGGCC
 GCGGGACCCCTGGCCGGTTCGCGCAGGCGCGGGGGGGACGCAGGGCGCGGCGGGTTCCAGCGCGGGGATG
 GCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCT
 ACACGACAGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCCCAGGGCCCTCCCTCCCCAAG
 CCCCCCGGACTCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTCCCCGCAACGAAGACCTAC
 TTCTCCCACCTGCCCACCTG    

12.1.2012 (uusinta)

    • Sen sijaan että käyttäisi alkuperäistä dataa, voiko fylogenia-analyysissä käyttää ainoastaan bootstrap-monistettua materiaalia koska siitä saa kätevästi samalla luotettavuusarvotkin?
    • Miksi mikrosirudatasta kannattaa filtteroida liian pienen hajonnan omaavat geenit ennen varsinaista analyysiä?
    • Jos Blast-ajon parametriä ”threshold” eli kynnysarvo nostetaan isommaksi niin nopeutuuko ajo?
    • Lituruohon geeni AT5G51650. Onko tälle paralogeja lituruohossa tai ortologeja muissa organismeissa. Raportoi tulos.
  1. M69201, M64481, J05008, X03021, M16567. Etsi näille EMBL tunnuksille vastaavat Unigene ja HGNC nimet (jos löytyy). Mikä transkriptiofaktori sitoutuu kaikkien näiden kohdegeenien (target Gene) promoottoreihin? Vastauksia voi etsiä monella tavalla ja myös arvaamalla. Valmista vastausta ei löydy mistään vaan joudut yhdistelemään.
  2. Hae seuraavat Gene IDt NCBIstä: 842859, 827785, 836324, 831683, 817302, 838390. Hae niiden aminohapposekvenssit, tee niistä FastA muotoinen tiedosto ja piirrä niistä fylogeneettinen puu käyttäen fylogeniapäivänä opittuja ohjelmia. Muista että kyseessä on aminohappo eikä nukleotidisekvenssit joten et voi käyttää mallina nukleotidisubstituutiomallia vaan RaxML manuaalista etsit oikean mallin. Muista raportoida kaikki vaiheet koska jos vastaat väärin niin saat edes osan pisteistä jos näemme että teit periaatteessa oikein. Muista että ymmärryksestä palkitaan, ei ulkoaoppimisesta.
  3. Kahden eri geenin ekspressiota tutkittiin yhdestä sinilevälajista saaduista näytteistä. Levänäytteet luokiteltiin kahteen luokkaan niiden sisältämien myrkkyjen perusteella. Analysoi keskiarvo, mediaani, varianssi ja keskihajonta näiden geenien ilmentymiselle. Oletetaan että muuttujien arvot ovat normaalisesti jakautuneita.
 Geeni1 Geeni2 luokka
 27,0	7,0	1
 25,0	14,0	2
 22,0	19,0	2
 17,0	18,0	1
 12,0	13,0	2
 26,0	14,0	1
 27,0	10,0	1
 16,0	.	1
 25,0	19,0	1
 38,0	21,0	2
 27,0	33,0	2
 23,0	10,0	1
 15,0	20,0	1
 10,0	28,0	2
 29,0	26,0	2
 16,0	38,0	2
 13,0	14,0	1
 19,0	25,0	2
 25,0	10,0	1
 25,0	9,0	1
 15,0	37,0	2

30.11.2011

  1. Vastaa lyhyesti seuraaviin kysymyksiin (4p)
    • Mitä tarkoitetaan E-arvolla? Miten se lasketaan (etsi ja tulkitse kaava)? Miten saatuja E-arvoja tulkitaan? (1p)
    • Mitä tekee AliBaba2? Mitä ei-kaupallisia vastineita sille löydät? (1p)
    • Mikä EMBOSS-ohjelma listaa geenistä kodonien käyttömäärät? (1p)
    • Etsi tietokannoista Age-related macular degeneration -oireyhtymään liittyviä geenejä. Mainitse ainakin kolme. (1p)
  2. Kerro omin sanoin suomeksi (tai ruotsiksi) miten Musclen algoritmi toimii. (3p) (Ethän rupea suomentamaan joka lausetta vaan kerro vain pääasiat.)
  3. Näytä missä hiiren MLH1:ssä on saareke metyloitua DNA:a? esim. kuva ja/tai koordinaatit. Muista kertoa myös mistä ne löysit.
  4. Härkäsammakolla (Xenopus laevis) on rhodopsin -proteiinia koodittava lähettiRNA L07770. Kuinka moni proteiini ihmisellä kuuluu samaan proteiiniperheeseen eli kuinka monella on uniikki Gene ID, sisältäen prosite-dokumentaation mukaisen PS00238-konsensussekvenssin? Esitä tämä konsensussekvenssi. Vinkki: voit käyttää myös Blastp-ohjelman variaatiota tässä tehtävässä.

17.01.2011

    • Hae ihmisen acyl-Coenzyme A binding protein mRNA sekvenssi ENTREZ-tietokannasta hakunumerolla BC062996 (730 bp). Vertaa tätä sekvenssiä transloituna kaikkiin simpanssin proteiineihin. Mikä Blast -ohjelma tekee tämän (translointeineen) automaattisesti? Mitä ovat parhaat vastaavuudet, jotka löydät? (2 p)
    • Vertaa DNA-sekvenssiä nyt kaikkien muiden lajien DNA-sekvensseihin poislukien ihmisen ja simpanssin sekvenssit. Näytä hakuikkuna (optiot, joita käytit), esim. kopioimalla se sellaisenaan vastausdokumenttiisi. Mihin lajeihin saat nyt parhaat osumat? (Nimeä 5 parasta.) (2 p)
    • Kuvaile mitkä ovat kriteerisi osuman merkitsevyydelle. (1 p)
    • Mistä löytää tiedon leivontahiivan (=viinihiiva) nukleosomien sijainnista kromatiinilla (=tietokanta)?
    • Osipov, S. A, Preobrazhenskaya, O. V. & Karpov, V. L. 2010. Etsi julkaisutiedot.
    • Kuinka paljon hiivan geeneistä arvioidaan olevan orthologeja ihmisen geeneille
    • esittele geeni joka vaikuttaa terveen ihmisen ulkonäköön (eli ihmisellä joko on se ominaisuus tai ei ole).
  1. Oheiset sekvenssit ovat homologisia proteiinisekvenssejä muutamasta harvinaisesta eläinlajista. Piirrä sekvensseistä fylogeneettinen puu kurssilla käytetyillä työkaluilla. Analysoi saamiasi tuloksia: Mitä voisit sanoa lajien sukulaisuussuhteista saamasi puun perusteella? Kuinka luotettavia eri lajihaarautumiset ovat annetun aineiston pohjalta? Käytä BLOSUM62-matriisia, substituutioarvojen optimisaatiota sekä GAMMA-mallia fylogeneettistä puuta/puita laatiessasi (muista siihen käytetyn ohjelman –help -tuloste). (5p)
 >Marsupilami
 MVHFTAEEKAAVTSLWSKMNVEEAGGEALGRLLVVYPWTQRFFDSFGNLSSPSAILGNPKVKAHGKKVLTSFGDAIKNMDNLKPAFAKLSELHCDKLHVDPENFKLLGNVMVIILATHFGKEFTPEVQAAWQKLVSAVAIALAHKYH
 
 >Mursu
 MQLARKEMRDSIPYPHTTGLQTVGLQTLLLLQQIATEKVARPDIMVHFSAEEKAAITSLWGKVNVEDAGGEALGRLLVVYPWTQRFFDNFGNLSSASAIMGNPKVKAHGKKVLTSFGDAVKNMDNLKGTFAKLSELHCDKLHVDPENFRL
 LGNVLVIILASHFGKEFTPDVQAAWQKLVAGVATALAHKYH
 
 >Möhköfantti
 MVHFTAEEKAAITGLWGKVNVEEAGGEALGRLLVVYPWTQRFFDSFGNLSSASAIMGNPKVKAHGKKVLTSFGEAIKNLDNLKGAFAKLSELHCDKLHVDPENFRLLGNVIVIILATHFGREFTPDVQAAWQKLVSGVATALAHKYH
 
 >Mikälie
 MVNFTAEEKTLINGLWSKVNVEEVGGEALGRLLVVYPWTHRFFDSFGNLSSASAIMGNPRVKAHGKKVLTAFGESIKNLDNLKSALAKLSELHCDKLHVDPENFKLLGNVLVIVLASHFGNEFTAEMQAAWQKLVAGVATALSHKYH
   
 >Vuhku
 MVNFTAEEKSLINGLWSKVNVEEVGGEALGRLLVVYPWTQRFFDSFGNLSSASAIMGNPRVKAHGKKVLTAFGETIKNLDNLKSALAKLSELHCDKLHVDPENFKLLGNVLVIVLASHFGNEFTAEVQAAWQKLVAGVATALSHKYH
 
 >Puhku
 MVHWTAEEKQLITGLWGKVNVAECGAEALARLLIVYPWTQRFFASFGNLSSATAIIGNPMVRAHGKKVLSSFGEAVKNLDNIKKSFAQLSKLHCDKLHVDPENFRLLGDILIIVLASHFSKDFTPASQAAWQKMVRVVAHALAHEYH
 
 >Pahku
 MVAWTAEERAFIQDIFSKLNYEEAGPKALQRALIVYPWTQRYFGSFGNLYNAEAIINNPKVAAHGTVVLHGLDRAMKNMDDIKNTYAELSVLHSEKLHVDPDNFRLLADCLTIVIASTMGAAFTADMQAAWQKFLAVVVSALQRQYH

1.12.2010

  1. Kerro lyhyesti: Mitä tarkoitetaan E-arvolla? Miten se lasketaan (etsi ja tulkitse kaava)? Miten saatuja E-arvoja tulkitaan?
  2. Lituruohon Arabidopsis thaliana ERD15 proteiinin alussa on PAM2 konservoitu alue (domain). Kaiva esiin sen hakunumero jostakin tietokannasta. Hae pidempi ERD15 koodittamista aminohapposekvensseistä ja etsi sille homologi viherlevistä (se on jossain Streptophyta pääjaksossa). Sun tarttee nyt selvittää ensin mikä on viherlevä (mites semmonen tehdään?) sekä käyttää ajossa oikeeta kirjastoo (, nyt meni kokeiluks, muista että organismin nimet täyttyy automaattisesti, käytä sitä. Protein ja nucleotide tietokannat ei muuten nyt auta). Muista kirjoittaa päiväkirjanomaisesti missä kävit ja mitä teit.
  3. Etsi ja raportoi jonkin myb transkriptiofaktorin yläpuolella oleva signalointireitti Siis ei yksittäinen tekijä vaan mikä reitti (pathway)?
  4. Oheiset sekvenssit ovat muutamien ihmisapinoiden DNA-sekvenssejä. Rakenna ensin MSA ja rekonstruoi sen perusteella fylogeneettinen puu. Analysoi saamiasi tuloksia: tee luotettavuusanalyysi. Mitä voisit sanoa lajien sukulaisuussuhteista tämän aineiston pohjalta saamasi puun perusteella? Entä voitko päätellä jotakin geenin evoluutiosta?
 >Human
 ACTGCACTCACCGCACCCGGCCAATTTTTGTGTTTTTAGTAGAGACTAAATACCATATAGTGAACAC
 CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGTCGGAG
 ATTGAGCGCGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCCGGGCGGCGAAGCT
 GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 GTCGCAGGGCGCGGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 GGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 GGAAAGGTGCGGCAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCCC
 GGACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCTTTCGCCGCCACGAGGAC
 CTACTTCTCCCACCTGGACCTG
 
 >Chimp1
 ACTGCACTCACCGCACCCGGCCAATTTTTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
 CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
 ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
 GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 GTCGCAGGGCGCCGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 GGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 GGAGAGGTAGCGCGAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCC
 GGAACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCCACGAAGA
 CCTACTTCTCCCACCTGGACCTG
 
 > Chimp2
 ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
 CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
 ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
 GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 GTCGCAGGGCGCCGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 GGTGCGCGCCCTGTGGAACCGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 GGAAAGGTGCGGCAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCCC
 GGACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCTTTCGCCGCCACGAGGAC
 CCTACTTCTCCCAACTGGACCTG
 
 > Chimp3
 ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
 CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
 ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
 GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 GTCGCAAAGGCGCCGCGGGTACCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 GGTGCGCGCCCTGTGGAACCGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 GGAGAGGTAGCGCGAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCC
 GGAACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCCACGAAGG
 CCGACTTCTCCCAACTGGACCTG
 
 >Baboon
 ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAAAACTATATGG
 TGAACACCTAAGACGCGGGGGCCTTGGATCCAGGGCGATTCAGAGTTCCCCCGGTCGGAGCAGTCGGAGA
 TGGAGGCCGCGCGGTCCCGGGATCCGGGACCAGGCCCTGCACCCCAGGGTGGCGAGGCTGCAGCGCGGCG
 CCCCCTGGTGGCCGCGGGACCCCTGGCCGGTCTTTTGCAGGCGCAGCGCGGGCGCAGGGCGCGGCGGGTTC
 CAGCGCGGGAATGGCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAACTGGGAAGC
 AATGTTGGCGTCTATGCTACTGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCTCCGGGGC
 CCTGCCTCCCCAAGCCCCCCGGACGCGCCTCACCGCCGTTCCTCTCGCAGGACCTTCCTGGCTTTCCCCG
 CCACGAAGACCTACTTCTCCCACCTAGACCTG
 
 >Orang2
 ACTGCACTCACCGCACCTGGCCAATTTTTGTGTTTTTACTAGAGACTAAAAACCATATGGTGAACACCTC
 CACCGGGGGGCCTTGGATCCAGGCAATTCAGAGGGCCCCGGTCGGAGCTGTCGGAGATGGAGCGCGCGCG
 CTCCCGGGATCCCGGACGAGGCCCTGGACCCCAGGGCGGCGAGGCTGCAGAGAGGCGCCCCCTGGAGGCC
 GCGGGACCCCTGGCCGGTTCGCGCAGGCGCGGCGGGGACGCAGGGCGCGGCGGGTTCCAGCGCGGGGATG
 GCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCT
 ACACGACAGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCCCAGGGCCCTCCCTCCCCAAG
 CCCCCCGGACTCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCAACGAAGACCTAC
 TTCTCCCACCTGCCCACCTG
 
 >Orang3
 ATGCACTCACCGCACCTGGCCAATTTTTGTGATTTTACTAGAGACTAAAAACCATATGGTGAACACCTC
 CACCGGGGGGCCTTGGATCCAGGCAATTCAGAGGGCCCCGGTCGGAGCTGTCGGAGATGGAGCGCGCGCG
 CTCCCGGGATCCCGGACGAGGCCCTGGACCCCAGGGCGGCGAGGCTGCAGAGAGGCGCCCCCTGGAGGCC
 GCGGGACCCCTGGCCGGTTCGCGCAGGCGCGGGGGGGACGCAGGGCGCGGCGGGTTCCAGCGCGGGGATG
 GCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCT
 ACACGACAGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCCCAGGGCCCTCCCTCCCCAAG
 CCCCCCGGACTCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTCCCCGCAACGAAGACCTAC
 TTCTCCCACCTGCCCACCTG

7.4.2010

  1. Hae EU004672-tunnuksella nukleotidisekvenssi fasta-muodossa ja analysoi sitä. Käytä EMBOSS-pakettia, ainakin kohtiin b-e.
    • Mistä organismista sekvenssi on peräisin, ja mikä sekvenssi on kyseessä? (1p)
    • Mikä on sekvenssin pisin ORF? Missä lukukehyksessä ja mistä mihin? (1p)
    • Mikä olisi kyseisen ORFin koodaaman proteiinin molekyylipaino ja monta aminohappotähdettä siinä olisi? (1p)
    • Mikä olisi sen isoelektrinen piste? Mitä isoelektrinen piste tarkoittaa? (1p)
    • Mitkä nukleotidit voidaan muuttaa siten, että nukleotidien 1000 ja 2000 välille saadaan lisättyä ZhoI-restriktioentsyymin tunnistuskohta ilman proteiinisekvenssin muutosta? Riittää, että käsittelet pelkkää pisintä ORFia sellaisenaan (eli sen ensimmäinen nukleotidi on vastauksen kannalta nukleotidi 1 jne.). Tähän tarvittavaa ohjelmaa ei käytetty harjoituksissa! (2p)
    • Hae ihmisen acyl-Coenzyme A binding protein mRNA sekvenssi ENTREZ-tietokannasta hakunumerolla BC062996 (730 bp). Vertaa tätä sekvenssiä transloituna kaikkiin simpanssin proteiineihin. Mikä Blast -ohjelma tekee tämän (translointeineen) automaattisesti? Mitä ovat parhaat vastaavuudet, jotka löydät? (2 p)
    • Vertaa DNA-sekvenssiä nyt kaikkien muiden lajien DNA-sekvensseihin poislukien ihmisen ja simpanssin sekvenssit. Näytä hakuikkuna (optiot, joita käytit), esim. kopioimalla se sellaisenaan vastausdokumenttiisi. Mihin lajeihin saat nyt parhaat osumat? (Nimeä 5 parasta.) (2 p)
    • Kuvaile mitkä ovat kriteerisi osuman merkitsevyydelle. (1 p)
  2. Hae tiedot tunnukselle GO:0004917.
    • Mikä termi tämä on? Kuinka monta geenituotetta siihen liittyy? (1p)
    • Mitkä geenituotteet ovat kyseessä? Kuinka luotettavia niiden assosiaatiot ovat tähän termiin? (1p)
    • Mitkä sairaudet liittyvät näihin geenituotteisiin? Jos joukossa on monia samanlaisia ei tarvitse listata kaikkia, vaan yleisempi luokka riittää. (1p)
    • Mikä on HOXA3:n konsensussitoutumissekvenssi hiiressä? (Selvennä IUPAC-koodilla esitetyt kohdat!) (2 p)
    • Missä kudoksissa HOXA3 ilmenee? Mitä se tekee? (2 p)
    • Minkä geenien promoottoreissa sillä on sitoutumiskohtia (älä listaa keinotekoisten sekvenssien paikkoja vaan ainoastaan aitojen genomisten!)? Kuka, missä ja milloin on julkaissut tämän sitoutumistekijän? (2 p)

30.5.2006

  1. Kerro mitä seuraavat termit tarkoittavat (lyhyesti) ( 1 piste/kohta)
    • FASTA
    • E-score BLAST-hakujen yhteydessä
    • Kimura 2-p
    • EMBOSS
  2. Avaa Unix ja luo alihakemisto, kirjoita Unixissa sekvenssitiedosto ja laita se alihakemistoon. Analysoi tiedosto plotorf-ohjelmalla. Kerro mitä käskyjä käytät ja missä järjestyksessä. Oikeinkirjoitusvirheistä ei sakoteta. (4 p.)
  3. Sinulla on 5 kpl 180-200 ah pitkiä proteiineja, jotka ovat 50-70% identtisiä toisiinsa verrattuina. Olet myös löytänyt ryhmän sisältä kaksi lokaalia samankaltaisuusaluetta, jotka löytyvät lähes identtisinä kaikista viidestä proteiinista. Ensimmäinen lokaali samankaltaisuusalue on 21 ah ja toinen 27 ah pitkä. Sinun pitää selvittää, mitä muita proteiineja (tietokannoissa) kuuluu tähän samaan ryhmään. Mitä menetelmiä ja algoritmeja käyttäisit samankaltaisten sekvenssien löytämiseen? Vinkki: tutustu Blastin variantteihin - raportoi mielestäsi parhaat. (4 p.)
  4. Saat seuraavan sekvenssin. Selvitä mistä geenistä se on ja mitä kyseinen geeni tekee. Minkälaisen ontologiarakenteen löydät sen tehtäville? Liittyykö geeniin mitään sairauksia? Entä kirjallisuus (5 oleellisinta viitettä), joka geeniin liittyy? Esitä tulos pienen työselosteen muodossa eli laita vastaukseen ainakin seuraavat otsikot: tavoita, menetelmät ja materiaalit, tulokset, viitteet. Muistathan että käyttämäsi ohjelmat ja tietokannat ovat nyt menetelmiäsi ja materiaalejasi! Vastauksen pituus ei ole niinkään tärkeä arvosteluperuste, mutta sisältö ja selkeys ovat. (6 p.)
 atgatgtgcg gggcgccctc cgccacgcag ccggccaccg ccgagaccca
 gcacatcgcc gaccaggtga ggtcccagct tgaagagaaa gaaaacaaga
 agttccctgt gtttaaggcc gtgtcattca agagccaggt ggtcgcgggg
 acaaactact tcatcaaggt gcacgtcggc gacgaggact tcgtacacct
 gcgagtgttc caatctctcc ctcatgaaaa caagcccttg accttatcta
 actaccagac caacaaagcc aagcatgatg agctgaccta tttctag

17.11.2005

  1. Vastaa lyhyesti seuraaviin kysymyksiin (6p)
    • kumpi on merkitsevämpi arvo sekvenssien samankaltaisuudelle: 2e-76 vai 1e-92?
    • millä nimellä kutsutaan puriinin vaihtumista pyrimidiiniksi sekvenssissä?
    • Mikä on PMID?
    • Mikä EMBOSS-ohjelma listaa geenistä kodonien käyttömäärät?
    • Kuinka monta geeniä on poistunut kromosomista Deleted in Polyposis 1 -syndroomassa?
    • Mikä geeni osallistuu cofiliinin konservoidun LIMkinaasi-fosforylointikohdan säätelyyn Tuberous Sclerosis Complex-oireyhtymässä?
  2. Saat seuraavan sekvenssin. Selvitä mistä geenistä se on ja mitä kyseinen geeni tekee? Minkälaisen ontologiarakenteen löydät sen tehtäville? Liittyykö geeniin mitään sairauksia? Entä kirjallisuus (5 oleellisinta viitettä), joka geeniin liittyy? Esitä tulos pienen työselosteen muodossa, eli laita vastaukseen ainakin seuraavat otsikot: tavoite, menetelmät ja materiaalit, tulokset, viitteet. Muistathan että käyttämäsi ohjelmat ja tietokannat ovat nyt menetelmiäsi ja materiaalejasi! Vastauksen pituus ei ole niinkään tärkeä arvosteluperuste, mutta sisältö ja selkeys ovat.(6p.)
atgatgtgcg gggcgccctc cgccacgcag ccggccaccg ccgagaccca gcacatcgcc
gaccaggtga ggtcccagct tgaagagaaa gaaaacaaga agttccctgt gtttaaggcc
gtgtcattca agagccaggt ggtcgcgggg acaaactact tcatcaaggt gcacgtcggc
gacgaggact tcgtacacct gcgagtgttc caatctctcc ctcatgaaaa caagcccttg
accttatcta actaccagac caacaaagcc aagcatgatg agctgaccta tttctag
  1. Etsi ainakin yksi kasvipromoottori jossa on GT-1 transkriptiofaktorin sitoutumiskohtia ja aja sillä promoottorianalyysi (6p)
  2. Avaa Unix ja luo alihakemisto, kirjoita Unixissa sekvenssitiedosto ja laita se alihakemistoon. Analysoi tiedosto plotorf-ohjelmalla. Kerro mitä käskyjä käytät ja missä järjestyksessä. Oikeinkirjoitusvirheistä ei sakoteta. (6p)
  3. Oheiset sekvenssit ovat muutamien ihmisapinoiden DNA-sekvenssejä. Piirrä sekvensseistä parsimoniapuu Phylip-pakettia käyttäen. Mikä on lyhyimmän puun pituus? Analysoi saamiasi tuloksia: Mitä voisit sanoa lajien sukulaisuussuhteista saamasi puun perusteella? Entä voitko päätellä jotakin geenin evoluutiosta?
>A
ACTGCACTCACCGCACCCGGCCAATTTTTGTGTTTTTAGTAGAGACTAAATACCATATAGTGAACAC
CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGTCGGAG
ATTGAGCGCGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCCGGGCGGCGAAGCT
GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
GTCGCAGGGCGCGGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
GGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
GGAAAGGTGCGGCAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCCC
GGACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCTTTCGCCGCCACGAGGAC
CTACTTCTCCCACCTGGACCTG

>B
ACTGCACTCACCGCACCCGGCCAATTTTTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
GTCGCAGGGCGCCGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
GGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
GGAGAGGTAGCGCGAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCC
GGAACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCCACGAAGA
CCTACTTCTCCCACCTGGACCTG

>C
ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
GTCGCAGGGCGCCGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
GGTGCGCGCCCTGTGGAACCGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
GGAAAGGTGCGGCAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCCC
GGACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCTTTCGCCGCCACGAGGAC
CCTACTTCTCCCAACTGGACCTG

>D
ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
GTCGCAAAGGCGCCGCGGGTACCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
GGTGCGCGCCCTGTGGAACCGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
GGAGAGGTAGCGCGAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCC
GGAACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCCACGAAGG
CCGACTTCTCCCAACTGGACCTG

>E
ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAAAACTATATGG
TGAACACCTAAGACGCGGGGGCCTTGGATCCAGGGCGATTCAGAGTTCCCCCGGTCGGAGCAGTCGGAGA
TGGAGGCCGCGCGGTCCCGGGATCCGGGACCAGGCCCTGCACCCCAGGGTGGCGAGGCTGCAGCGCGGCG
CCCCCTGGTGGCCGCGGGACCCCTGGCCGGTCTTTTGCAGGCGCAGCGCGGGCGCAGGGCGCGGCGGGTTC
CAGCGCGGGAATGGCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAACTGGGAAGC
AATGTTGGCGTCTATGCTACTGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCTCCGGGGC
CCTGCCTCCCCAAGCCCCCCGGACGCGCCTCACCGCCGTTCCTCTCGCAGGACCTTCCTGGCTTTCCCCG
CCACGAAGACCTACTTCTCCCACCTAGACCTG

>F
ACTGCACTCACCGCACCTGGCCAATTTTTGTGTTTTTACTAGAGACTAAAAACCATATGGTGAACACCTC
CACCGGGGGGCCTTGGATCCAGGCAATTCAGAGGGCCCCGGTCGGAGCTGTCGGAGATGGAGCGCGCGCG
CTCCCGGGATCCCGGACGAGGCCCTGGACCCCAGGGCGGCGAGGCTGCAGAGAGGCGCCCCCTGGAGGCC
GCGGGACCCCTGGCCGGTTCGCGCAGGCGCGGCGGGGACGCAGGGCGCGGCGGGTTCCAGCGCGGGGATG
GCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCT
ACACGACAGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCCCAGGGCCCTCCCTCCCCAAG
CCCCCCGGACTCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCAACGAAGACCTAC
TTCTCCCACCTGCCCACCTG

>G
ATGCACTCACCGCACCTGGCCAATTTTTGTGATTTTACTAGAGACTAAAAACCATATGGTGAACACCTC
CACCGGGGGGCCTTGGATCCAGGCAATTCAGAGGGCCCCGGTCGGAGCTGTCGGAGATGGAGCGCGCGCG
CTCCCGGGATCCCGGACGAGGCCCTGGACCCCAGGGCGGCGAGGCTGCAGAGAGGCGCCCCCTGGAGGCC
GCGGGACCCCTGGCCGGTTCGCGCAGGCGCGGGGGGGACGCAGGGCGCGGCGGGTTCCAGCGCGGGGATG
GCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCT
ACACGACAGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCCCAGGGCCCTCCCTCCCCAAG
CCCCCCGGACTCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTCCCCGCAACGAAGACCTAC
TTCTCCCACCTGCCCACCTG