Tenttiwiki

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
bioinformatiikan_tyoet [2014/08/08 02:46]
91.207.7.33 Again http://www.ownaleg.co.uk/888-free-online-slots top 888 free online slots been functional for around 100 years and http://www.ownaleg.co.uk/free-online-slots best free online slots s chester http://www.ownaleg.co.uk/slots slots looking to have some f
bioinformatiikan_tyoet [2014/08/15 22:43] (current)
Line 1: Line 1:
 +====== Bioinformatiikan työt ======
  
 +
 +
 +
 +
 +
 +==== 4.4.2012 ====
 +
 +  - Vastaa seuraaviin kysymyksiin lyhyesti. (yht. 3 p)
 +      * Etsi GO-tunnuksen 0016322 biologinen kuvaus ja pääluokka. (1p)
 +      * Kuinka moneen ihmisen geeniin GO-luokka mitochondrial large ribosomal subunit liittyy? (1p)
 +      * Luettele edellisen kohdan geeneille uniikit evidence koodit. (1p)
 +  - Mitä tekee EMBOSSin komento/​ohjelma sixpack (1p)? Entä wobble (1p)? Jos haluaisit visualisoida sekvenssin linjauksen pistematriisimenetelmällä (dotplot), mitä EMBOSSin komentoja/​ohjelmia voisit käyttää (1p)?   
 +  - Olet genotyypannut SNPn neljästä eri kandidaattigeenistä otoksessa sairaita ja terveitä. Data (tenttidata.ped ja tenttidata.map) löytyy Moodlesta samalta sivulta kuin tenttikysärit. Tehtävänäsi on selvittää,​ mitkä SNPeistä assosioituvat tautiin. Tee analyysit Plinkillä. Muista ensin poistaa liian huonosti genotyyppautuneet yksilöt /markkerit. Huomaa myös, että tästä datasta puuttuu family-id ja sairaat on koodattu ykkösiksi ja terveet nolliksi: tämän vuoksi, käytä plink-komentorivilläsi joka kerta määreitä --no-fid ja --1. Siis, plink … … --no-fid --1
 +     * Kuinka monta sairasta ja tervettä datassa on (ennen pruningia)? 0,5 p
 +     * Kuinka monta naista ja miestä (ennen pruningia)? 0,5 p
 +     * Mikä kandigeeneistä saa parhaan p-arvon? 1 p
 +     * Mitä sanoisit muiden kandigeenien p-arvoista? 1 p 
 +     * Aja vielä genotyyppiassosiaatiot:​ miten tulkitset tuloksesi edellisten valossa? 1 p
 +  - Oheiset sekvenssit ovat muutamien ihmisapinoiden DNA-sekvenssejä. Rakenna ensin MSA ja rekonstruoi sen perusteella fylogeneettinen puu. Analysoi saamiasi tuloksia: tee luotettavuusanalyysi. Mitä voisit sanoa lajien sukulaisuussuhteista tämän aineiston pohjalta saamasi puun perusteella?​ Entä voitko päätellä jotakin geenin evoluutiosta?​ (yht. 5 p)
 +
 +   >​Human
 +   ​ACTGCACTCACCGCACCCGGCCAATTTTTGTGTTTTTAGTAGAGACTAAATACCATATAGTGAACAC
 +   ​CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGTCGGAG
 +   ​ATTGAGCGCGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCCGGGCGGCGAAGCT
 +   ​GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 +   ​GTCGCAGGGCGCGGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 +   ​GGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 +   ​GGAAAGGTGCGGCAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCCC
 +   ​GGACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCTTTCGCCGCCACGAGGAC
 +   ​CTACTTCTCCCACCTGGACCTG
 +   
 +   >​Chimp1
 +   ​ACTGCACTCACCGCACCCGGCCAATTTTTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
 +   ​CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
 +   ​ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
 +   ​GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 +   ​GTCGCAGGGCGCCGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 +   ​GGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 +   ​GGAGAGGTAGCGCGAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCC
 +   ​GGAACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCCACGAAGA
 +   ​CCTACTTCTCCCACCTGGACCTG
 +   
 +   > Chimp2
 +   ​ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
 +   ​CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
 +   ​ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
 +   ​GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 +   ​GTCGCAGGGCGCCGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 +   ​GGTGCGCGCCCTGTGGAACCGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 +   ​GGAAAGGTGCGGCAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCCC
 +   ​GGACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCTTTCGCCGCCACGAGGAC
 +   ​CCTACTTCTCCCAACTGGACCTG
 +   
 +   > Chimp3
 +   ​ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
 +   ​CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
 +   ​ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
 +   ​GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 +   ​GTCGCAAAGGCGCCGCGGGTACCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 +   ​GGTGCGCGCCCTGTGGAACCGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 +   ​GGAGAGGTAGCGCGAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCC
 +   ​GGAACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCCACGAAGG
 +   ​CCGACTTCTCCCAACTGGACCTG
 +   
 +   >​Baboon
 +   ​ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAAAACTATATGG
 +   ​TGAACACCTAAGACGCGGGGGCCTTGGATCCAGGGCGATTCAGAGTTCCCCCGGTCGGAGCAGTCGGAGA
 +   ​TGGAGGCCGCGCGGTCCCGGGATCCGGGACCAGGCCCTGCACCCCAGGGTGGCGAGGCTGCAGCGCGGCG
 +   ​CCCCCTGGTGGCCGCGGGACCCCTGGCCGGTCTTTTGCAGGCGCAGCGCGGGCGCAGGGCGCGGCGGGTTC
 +   ​CAGCGCGGGAATGGCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAACTGGGAAGC
 +   ​AATGTTGGCGTCTATGCTACTGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCTCCGGGGC
 +   ​CCTGCCTCCCCAAGCCCCCCGGACGCGCCTCACCGCCGTTCCTCTCGCAGGACCTTCCTGGCTTTCCCCG
 +   ​CCACGAAGACCTACTTCTCCCACCTAGACCTG
 +   
 +   >​Orang2
 +   ​ACTGCACTCACCGCACCTGGCCAATTTTTGTGTTTTTACTAGAGACTAAAAACCATATGGTGAACACCTC
 +   ​CACCGGGGGGCCTTGGATCCAGGCAATTCAGAGGGCCCCGGTCGGAGCTGTCGGAGATGGAGCGCGCGCG
 +   ​CTCCCGGGATCCCGGACGAGGCCCTGGACCCCAGGGCGGCGAGGCTGCAGAGAGGCGCCCCCTGGAGGCC
 +   ​GCGGGACCCCTGGCCGGTTCGCGCAGGCGCGGCGGGGACGCAGGGCGCGGCGGGTTCCAGCGCGGGGATG
 +   ​GCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCT
 +   ​ACACGACAGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCCCAGGGCCCTCCCTCCCCAAG
 +   ​CCCCCCGGACTCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCAACGAAGACCTAC
 +   ​TTCTCCCACCTGCCCACCTG
 +   
 +   >​Orang3
 +   ​ATGCACTCACCGCACCTGGCCAATTTTTGTGATTTTACTAGAGACTAAAAACCATATGGTGAACACCTC
 +   ​CACCGGGGGGCCTTGGATCCAGGCAATTCAGAGGGCCCCGGTCGGAGCTGTCGGAGATGGAGCGCGCGCG
 +   ​CTCCCGGGATCCCGGACGAGGCCCTGGACCCCAGGGCGGCGAGGCTGCAGAGAGGCGCCCCCTGGAGGCC
 +   ​GCGGGACCCCTGGCCGGTTCGCGCAGGCGCGGGGGGGACGCAGGGCGCGGCGGGTTCCAGCGCGGGGATG
 +   ​GCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCT
 +   ​ACACGACAGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCCCAGGGCCCTCCCTCCCCAAG
 +   ​CCCCCCGGACTCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTCCCCGCAACGAAGACCTAC
 +   ​TTCTCCCACCTGCCCACCTG ​   ​
 +  ​
 +
 +
 +
 +
 +
 +==== 12.1.2012 (uusinta) ====
 +
 +
 +   -
 +     * Sen sijaan että käyttäisi alkuperäistä dataa, voiko fylogenia-analyysissä käyttää ainoastaan bootstrap-monistettua materiaalia koska siitä saa kätevästi samalla luotettavuusarvotkin?​
 +     * Miksi mikrosirudatasta kannattaa filtteroida liian pienen hajonnan omaavat geenit ennen varsinaista analyysiä?
 +     * Jos Blast-ajon parametriä ”threshold” eli kynnysarvo nostetaan isommaksi niin nopeutuuko ajo?
 +     * Lituruohon geeni AT5G51650. Onko tälle paralogeja lituruohossa tai ortologeja muissa organismeissa. Raportoi tulos.
 +  - M69201, M64481, J05008, X03021, M16567. Etsi näille EMBL tunnuksille vastaavat Unigene ja HGNC nimet (jos löytyy). Mikä transkriptiofaktori sitoutuu kaikkien näiden kohdegeenien (target Gene) promoottoreihin?​ Vastauksia voi etsiä monella tavalla ja myös arvaamalla. Valmista vastausta ei löydy mistään vaan joudut yhdistelemään.
 +  - Hae seuraavat Gene IDt NCBIstä: 842859, 827785, 836324, 831683, 817302, 838390. Hae niiden aminohapposekvenssit,​ tee niistä FastA muotoinen tiedosto ja piirrä niistä fylogeneettinen puu käyttäen fylogeniapäivänä opittuja ohjelmia. Muista että kyseessä on aminohappo eikä nukleotidisekvenssit joten et voi käyttää mallina nukleotidisubstituutiomallia vaan RaxML manuaalista etsit oikean mallin. Muista raportoida kaikki vaiheet koska jos vastaat väärin niin saat edes osan pisteistä jos näemme että teit periaatteessa oikein. Muista että ymmärryksestä palkitaan, ei ulkoaoppimisesta.
 +  - Kahden eri geenin ekspressiota tutkittiin yhdestä sinilevälajista saaduista näytteistä. Levänäytteet luokiteltiin kahteen luokkaan niiden sisältämien myrkkyjen perusteella. Analysoi keskiarvo, mediaani, varianssi ja keskihajonta näiden geenien ilmentymiselle. Oletetaan että muuttujien arvot ovat normaalisesti jakautuneita.
 +
 +   ​Geeni1 Geeni2 luokka
 +   ​27,​0 7,​0 1
 +   ​25,​0 14,​0 2
 +   ​22,​0 19,​0 2
 +   ​17,​0 18,​0 1
 +   ​12,​0 13,​0 2
 +   ​26,​0 14,​0 1
 +   ​27,​0 10,​0 1
 +   ​16,​0 . 1
 +   ​25,​0 19,​0 1
 +   ​38,​0 21,​0 2
 +   ​27,​0 33,​0 2
 +   ​23,​0 10,​0 1
 +   ​15,​0 20,​0 1
 +   ​10,​0 28,​0 2
 +   ​29,​0 26,​0 2
 +   ​16,​0 38,​0 2
 +   ​13,​0 14,​0 1
 +   ​19,​0 25,​0 2
 +   ​25,​0 10,​0 1
 +   ​25,​0 9,​0 1
 +   ​15,​0 37,​0 2
 +
 +
 +==== 30.11.2011 ====
 +
 +  - Vastaa lyhyesti seuraaviin kysymyksiin (4p) 
 +    * Mitä tarkoitetaan E-arvolla? Miten se lasketaan (etsi ja tulkitse kaava)? Miten saatuja E-arvoja tulkitaan? (1p)
 +    * Mitä tekee AliBaba2? Mitä ei-kaupallisia vastineita sille löydät? (1p)
 +    * Mikä EMBOSS-ohjelma listaa geenistä kodonien käyttömäärät?​ (1p)
 +    * Etsi tietokannoista Age-related macular degeneration -oireyhtymään liittyviä geenejä. Mainitse ainakin kolme. (1p)
 +  - Kerro omin sanoin suomeksi (tai ruotsiksi) miten Musclen algoritmi toimii. (3p) (Ethän rupea suomentamaan joka lausetta vaan kerro vain pääasiat.)
 +  - Näytä missä hiiren MLH1:ssä on saareke metyloitua DNA:a? esim. kuva ja/tai koordinaatit. Muista kertoa myös mistä ne löysit.
 +  - Härkäsammakolla (Xenopus laevis) on rhodopsin -proteiinia koodittava lähettiRNA L07770. Kuinka moni proteiini ihmisellä kuuluu samaan proteiiniperheeseen eli kuinka monella on uniikki Gene ID, sisältäen prosite-dokumentaation mukaisen ​ PS00238-konsensussekvenssin?​ Esitä tämä konsensussekvenssi. Vinkki: voit käyttää myös Blastp-ohjelman variaatiota tässä tehtävässä.
 +
 +
 +
 +
 +==== 17.01.2011 ====
 +
 +  -
 +    * Hae ihmisen acyl-Coenzyme A binding protein mRNA sekvenssi ENTREZ-tietokannasta hakunumerolla BC062996 (730 bp). Vertaa tätä sekvenssiä transloituna kaikkiin simpanssin proteiineihin. ​ Mikä Blast -ohjelma tekee tämän (translointeineen) automaattisesti?​ Mitä ovat parhaat vastaavuudet,​ jotka löydät? (2 p)
 +    * Vertaa DNA-sekvenssiä nyt kaikkien muiden lajien DNA-sekvensseihin poislukien ihmisen ja simpanssin sekvenssit. Näytä hakuikkuna (optiot, joita käytit), esim. kopioimalla se sellaisenaan vastausdokumenttiisi. Mihin lajeihin saat nyt parhaat osumat? (Nimeä 5 parasta.) (2 p)
 +    * Kuvaile mitkä ovat kriteerisi osuman merkitsevyydelle. (1 p)
 +  -
 +    * Mistä löytää tiedon leivontahiivan (=viinihiiva) nukleosomien sijainnista kromatiinilla (=tietokanta)?​
 +    * Osipov, S. A, Preobrazhenskaya,​ O. V. & Karpov, V. L. 2010. Etsi julkaisutiedot.
 +    * Kuinka paljon hiivan geeneistä arvioidaan olevan orthologeja ihmisen geeneille
 +    * esittele geeni joka vaikuttaa terveen ihmisen ulkonäköön (eli ihmisellä joko on se ominaisuus tai ei ole).
 +  - Oheiset sekvenssit ovat homologisia proteiinisekvenssejä muutamasta harvinaisesta eläinlajista. Piirrä sekvensseistä fylogeneettinen puu kurssilla käytetyillä työkaluilla. Analysoi saamiasi tuloksia: Mitä voisit sanoa lajien sukulaisuussuhteista saamasi puun perusteella?​ Kuinka luotettavia eri lajihaarautumiset ovat annetun aineiston pohjalta? Käytä BLOSUM62-matriisia,​ substituutioarvojen optimisaatiota sekä GAMMA-mallia fylogeneettistä puuta/puita laatiessasi (muista siihen käytetyn ohjelman –help -tuloste). (5p)
 +
 +   >​Marsupilami
 +   ​MVHFTAEEKAAVTSLWSKMNVEEAGGEALGRLLVVYPWTQRFFDSFGNLSSPSAILGNPKVKAHGKKVLTSFGDAIKNMDNLKPAFAKLSELHCDKLHVDPENFKLLGNVMVIILATHFGKEFTPEVQAAWQKLVSAVAIALAHKYH
 +   
 +   >​Mursu
 +   ​MQLARKEMRDSIPYPHTTGLQTVGLQTLLLLQQIATEKVARPDIMVHFSAEEKAAITSLWGKVNVEDAGGEALGRLLVVYPWTQRFFDNFGNLSSASAIMGNPKVKAHGKKVLTSFGDAVKNMDNLKGTFAKLSELHCDKLHVDPENFRL
 +   ​LGNVLVIILASHFGKEFTPDVQAAWQKLVAGVATALAHKYH
 +   
 +   >​Möhköfantti
 +   ​MVHFTAEEKAAITGLWGKVNVEEAGGEALGRLLVVYPWTQRFFDSFGNLSSASAIMGNPKVKAHGKKVLTSFGEAIKNLDNLKGAFAKLSELHCDKLHVDPENFRLLGNVIVIILATHFGREFTPDVQAAWQKLVSGVATALAHKYH
 +   
 +   >​Mikälie
 +   ​MVNFTAEEKTLINGLWSKVNVEEVGGEALGRLLVVYPWTHRFFDSFGNLSSASAIMGNPRVKAHGKKVLTAFGESIKNLDNLKSALAKLSELHCDKLHVDPENFKLLGNVLVIVLASHFGNEFTAEMQAAWQKLVAGVATALSHKYH
 +     
 +   >​Vuhku
 +   ​MVNFTAEEKSLINGLWSKVNVEEVGGEALGRLLVVYPWTQRFFDSFGNLSSASAIMGNPRVKAHGKKVLTAFGETIKNLDNLKSALAKLSELHCDKLHVDPENFKLLGNVLVIVLASHFGNEFTAEVQAAWQKLVAGVATALSHKYH
 +   
 +   >​Puhku
 +   ​MVHWTAEEKQLITGLWGKVNVAECGAEALARLLIVYPWTQRFFASFGNLSSATAIIGNPMVRAHGKKVLSSFGEAVKNLDNIKKSFAQLSKLHCDKLHVDPENFRLLGDILIIVLASHFSKDFTPASQAAWQKMVRVVAHALAHEYH
 +   
 +   >​Pahku
 +   ​MVAWTAEERAFIQDIFSKLNYEEAGPKALQRALIVYPWTQRYFGSFGNLYNAEAIINNPKVAAHGTVVLHGLDRAMKNMDDIKNTYAELSVLHSEKLHVDPDNFRLLADCLTIVIASTMGAAFTADMQAAWQKFLAVVVSALQRQYH
 +
 +
 +
 +==== 1.12.2010 ====
 +
 +  - Kerro lyhyesti: Mitä tarkoitetaan E-arvolla? Miten se lasketaan (etsi ja tulkitse kaava)? Miten saatuja E-arvoja tulkitaan?
 +  - Lituruohon Arabidopsis thaliana ERD15 proteiinin alussa on PAM2 konservoitu alue (domain). Kaiva esiin sen hakunumero jostakin tietokannasta. Hae pidempi ERD15 koodittamista aminohapposekvensseistä ja etsi sille homologi viherlevistä (se on jossain Streptophyta pääjaksossa). Sun tarttee nyt selvittää ensin mikä on viherlevä (mites semmonen tehdään?) sekä käyttää ajossa oikeeta kirjastoo (, nyt meni kokeiluks, muista että organismin nimet täyttyy automaattisesti,​ käytä sitä. Protein ja nucleotide tietokannat ei muuten nyt auta). Muista kirjoittaa päiväkirjanomaisesti missä kävit ja mitä teit.
 +  - Etsi ja raportoi jonkin myb transkriptiofaktorin yläpuolella oleva signalointireitti Siis ei yksittäinen tekijä vaan mikä reitti (pathway)?
 +  - Oheiset sekvenssit ovat muutamien ihmisapinoiden DNA-sekvenssejä. Rakenna ensin MSA ja rekonstruoi sen perusteella fylogeneettinen puu. Analysoi saamiasi tuloksia: tee luotettavuusanalyysi. Mitä voisit sanoa lajien sukulaisuussuhteista tämän aineiston pohjalta saamasi puun perusteella?​ Entä voitko päätellä jotakin geenin evoluutiosta? ​
 +
 +   >​Human
 +   ​ACTGCACTCACCGCACCCGGCCAATTTTTGTGTTTTTAGTAGAGACTAAATACCATATAGTGAACAC
 +   ​CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGTCGGAG
 +   ​ATTGAGCGCGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCCGGGCGGCGAAGCT
 +   ​GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 +   ​GTCGCAGGGCGCGGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 +   ​GGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 +   ​GGAAAGGTGCGGCAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCCC
 +   ​GGACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCTTTCGCCGCCACGAGGAC
 +   ​CTACTTCTCCCACCTGGACCTG
 +   
 +   >​Chimp1
 +   ​ACTGCACTCACCGCACCCGGCCAATTTTTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
 +   ​CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
 +   ​ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
 +   ​GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 +   ​GTCGCAGGGCGCCGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 +   ​GGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 +   ​GGAGAGGTAGCGCGAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCC
 +   ​GGAACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCCACGAAGA
 +   ​CCTACTTCTCCCACCTGGACCTG
 +   
 +   > Chimp2
 +   ​ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
 +   ​CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
 +   ​ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
 +   ​GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 +   ​GTCGCAGGGCGCCGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 +   ​GGTGCGCGCCCTGTGGAACCGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 +   ​GGAAAGGTGCGGCAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCCC
 +   ​GGACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCTTTCGCCGCCACGAGGAC
 +   ​CCTACTTCTCCCAACTGGACCTG
 +   
 +   > Chimp3
 +   ​ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
 +   ​CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
 +   ​ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
 +   ​GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 +   ​GTCGCAAAGGCGCCGCGGGTACCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 +   ​GGTGCGCGCCCTGTGGAACCGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 +   ​GGAGAGGTAGCGCGAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCC
 +   ​GGAACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCCACGAAGG
 +   ​CCGACTTCTCCCAACTGGACCTG
 +   
 +   >​Baboon
 +   ​ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAAAACTATATGG
 +   ​TGAACACCTAAGACGCGGGGGCCTTGGATCCAGGGCGATTCAGAGTTCCCCCGGTCGGAGCAGTCGGAGA
 +   ​TGGAGGCCGCGCGGTCCCGGGATCCGGGACCAGGCCCTGCACCCCAGGGTGGCGAGGCTGCAGCGCGGCG
 +   ​CCCCCTGGTGGCCGCGGGACCCCTGGCCGGTCTTTTGCAGGCGCAGCGCGGGCGCAGGGCGCGGCGGGTTC
 +   ​CAGCGCGGGAATGGCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAACTGGGAAGC
 +   ​AATGTTGGCGTCTATGCTACTGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCTCCGGGGC
 +   ​CCTGCCTCCCCAAGCCCCCCGGACGCGCCTCACCGCCGTTCCTCTCGCAGGACCTTCCTGGCTTTCCCCG
 +   ​CCACGAAGACCTACTTCTCCCACCTAGACCTG
 +   
 +   >​Orang2
 +   ​ACTGCACTCACCGCACCTGGCCAATTTTTGTGTTTTTACTAGAGACTAAAAACCATATGGTGAACACCTC
 +   ​CACCGGGGGGCCTTGGATCCAGGCAATTCAGAGGGCCCCGGTCGGAGCTGTCGGAGATGGAGCGCGCGCG
 +   ​CTCCCGGGATCCCGGACGAGGCCCTGGACCCCAGGGCGGCGAGGCTGCAGAGAGGCGCCCCCTGGAGGCC
 +   ​GCGGGACCCCTGGCCGGTTCGCGCAGGCGCGGCGGGGACGCAGGGCGCGGCGGGTTCCAGCGCGGGGATG
 +   ​GCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCT
 +   ​ACACGACAGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCCCAGGGCCCTCCCTCCCCAAG
 +   ​CCCCCCGGACTCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCAACGAAGACCTAC
 +   ​TTCTCCCACCTGCCCACCTG
 +   
 +   >​Orang3
 +   ​ATGCACTCACCGCACCTGGCCAATTTTTGTGATTTTACTAGAGACTAAAAACCATATGGTGAACACCTC
 +   ​CACCGGGGGGCCTTGGATCCAGGCAATTCAGAGGGCCCCGGTCGGAGCTGTCGGAGATGGAGCGCGCGCG
 +   ​CTCCCGGGATCCCGGACGAGGCCCTGGACCCCAGGGCGGCGAGGCTGCAGAGAGGCGCCCCCTGGAGGCC
 +   ​GCGGGACCCCTGGCCGGTTCGCGCAGGCGCGGGGGGGACGCAGGGCGCGGCGGGTTCCAGCGCGGGGATG
 +   ​GCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCT
 +   ​ACACGACAGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCCCAGGGCCCTCCCTCCCCAAG
 +   ​CCCCCCGGACTCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTCCCCGCAACGAAGACCTAC
 +   ​TTCTCCCACCTGCCCACCTG
 +
 +
 +==== 7.4.2010 ====
 +
 +  - Hae EU004672-tunnuksella nukleotidisekvenssi fasta-muodossa ja analysoi sitä. Käytä EMBOSS-pakettia,​ ainakin kohtiin b-e.
 +    * Mistä organismista sekvenssi on peräisin, ja mikä sekvenssi on kyseessä? (1p)
 +    * Mikä on sekvenssin pisin ORF? Missä lukukehyksessä ja mistä mihin? (1p)
 +    * Mikä olisi kyseisen ORFin koodaaman proteiinin molekyylipaino ja monta aminohappotähdettä siinä olisi? (1p)
 +    * Mikä olisi sen isoelektrinen piste? Mitä isoelektrinen piste tarkoittaa? (1p)
 +    * Mitkä nukleotidit voidaan muuttaa siten, että nukleotidien 1000 ja 2000 välille saadaan lisättyä ZhoI-restriktioentsyymin tunnistuskohta ilman proteiinisekvenssin muutosta? Riittää, että käsittelet pelkkää pisintä ORFia sellaisenaan (eli sen ensimmäinen nukleotidi on vastauksen kannalta nukleotidi 1 jne.). Tähän tarvittavaa ohjelmaa ei käytetty harjoituksissa! (2p)
 +  - 
 +    * Hae ihmisen acyl-Coenzyme A binding protein mRNA sekvenssi ENTREZ-tietokannasta hakunumerolla BC062996 (730 bp). Vertaa tätä sekvenssiä transloituna kaikkiin simpanssin proteiineihin. ​ Mikä Blast -ohjelma tekee tämän (translointeineen) automaattisesti?​ Mitä ovat parhaat vastaavuudet,​ jotka löydät? (2 p)
 +    * Vertaa DNA-sekvenssiä nyt kaikkien muiden lajien DNA-sekvensseihin poislukien ihmisen ja simpanssin sekvenssit. Näytä hakuikkuna (optiot, joita käytit), esim. kopioimalla se sellaisenaan vastausdokumenttiisi. Mihin lajeihin saat nyt parhaat osumat? (Nimeä 5 parasta.) (2 p)
 +    * Kuvaile mitkä ovat kriteerisi osuman merkitsevyydelle. (1 p)
 +  - Hae tiedot tunnukselle GO:0004917.
 +    * Mikä termi tämä on? Kuinka monta geenituotetta siihen liittyy? (1p)
 +    * Mitkä geenituotteet ovat kyseessä? Kuinka luotettavia niiden assosiaatiot ovat tähän termiin? (1p)
 +    * Mitkä sairaudet liittyvät näihin geenituotteisiin?​ Jos joukossa on monia samanlaisia ei tarvitse listata kaikkia, vaan yleisempi luokka riittää. (1p)
 +  - 
 +    * Mikä on HOXA3:n konsensussitoutumissekvenssi hiiressä? (Selvennä IUPAC-koodilla esitetyt kohdat!) (2 p)
 +    * Missä kudoksissa HOXA3 ilmenee? Mitä se tekee? (2 p)
 +    * Minkä geenien promoottoreissa sillä on sitoutumiskohtia (älä listaa keinotekoisten sekvenssien paikkoja vaan ainoastaan aitojen genomisten!)?​ Kuka, missä ja milloin on julkaissut tämän sitoutumistekijän?​ (2 p)
 +
 +
 +
 +==== 30.5.2006 ====
 +
 +  - Kerro mitä seuraavat termit tarkoittavat (lyhyesti) ( 1 piste/​kohta)
 +    * FASTA
 +    * E-score BLAST-hakujen yhteydessä
 +    * Kimura 2-p
 +    * EMBOSS
 +  - Avaa Unix ja luo alihakemisto,​ kirjoita Unixissa sekvenssitiedosto ja laita se alihakemistoon. Analysoi tiedosto plotorf-ohjelmalla. Kerro mitä käskyjä käytät ja missä järjestyksessä. Oikeinkirjoitusvirheistä ei sakoteta. (4 p.)
 +  - Sinulla on 5 kpl 180-200 ah pitkiä proteiineja,​ jotka ovat 50-70% identtisiä toisiinsa verrattuina. Olet myös löytänyt ryhmän sisältä kaksi lokaalia samankaltaisuusaluetta,​ jotka löytyvät lähes identtisinä kaikista viidestä proteiinista. Ensimmäinen lokaali samankaltaisuusalue on 21 ah ja toinen 27 ah pitkä. Sinun pitää selvittää,​ mitä muita proteiineja (tietokannoissa) kuuluu tähän samaan ryhmään. Mitä menetelmiä ja algoritmeja käyttäisit samankaltaisten sekvenssien löytämiseen?​ Vinkki: tutustu Blastin variantteihin - raportoi mielestäsi parhaat. (4 p.)  ​
 +  - Saat seuraavan sekvenssin. Selvitä mistä geenistä se on ja mitä kyseinen geeni tekee. Minkälaisen ontologiarakenteen löydät sen tehtäville?​ Liittyykö geeniin mitään sairauksia? Entä kirjallisuus (5 oleellisinta viitettä), joka geeniin liittyy? Esitä tulos pienen työselosteen muodossa eli laita vastaukseen ainakin seuraavat otsikot: tavoita, menetelmät ja materiaalit,​ tulokset, viitteet. Muistathan että käyttämäsi ohjelmat ja tietokannat ovat nyt menetelmiäsi ja materiaalejasi! Vastauksen pituus ei ole niinkään tärkeä arvosteluperuste,​ mutta sisältö ja selkeys ovat. (6 p.)
 +
 +   ​atgatgtgcg gggcgccctc cgccacgcag ccggccaccg ccgagaccca
 +   ​gcacatcgcc gaccaggtga ggtcccagct tgaagagaaa gaaaacaaga
 +   ​agttccctgt gtttaaggcc gtgtcattca agagccaggt ggtcgcgggg
 +   ​acaaactact tcatcaaggt gcacgtcggc gacgaggact tcgtacacct
 +   ​gcgagtgttc caatctctcc ctcatgaaaa caagcccttg accttatcta
 +   ​actaccagac caacaaagcc aagcatgatg agctgaccta tttctag
 +
 +
 +
 +
 +==== 17.11.2005 ====
 +
 +  - Vastaa lyhyesti seuraaviin kysymyksiin (6p)
 +    * kumpi on merkitsevämpi arvo sekvenssien samankaltaisuudelle:​ 2e-76 vai 1e-92?
 +    * millä nimellä kutsutaan puriinin vaihtumista pyrimidiiniksi sekvenssissä?​
 +    * Mikä on PMID?
 +    * Mikä EMBOSS-ohjelma listaa geenistä kodonien käyttömäärät?​
 +    * Kuinka monta geeniä on poistunut kromosomista Deleted in Polyposis 1 -syndroomassa?​
 +    * Mikä geeni osallistuu cofiliinin konservoidun LIMkinaasi-fosforylointikohdan säätelyyn Tuberous Sclerosis Complex-oireyhtymässä?​
 +  - Saat seuraavan sekvenssin. Selvitä mistä geenistä se on ja mitä kyseinen geeni tekee? Minkälaisen ontologiarakenteen löydät sen tehtäville?​ Liittyykö geeniin mitään sairauksia? Entä kirjallisuus (5 oleellisinta viitettä), joka geeniin liittyy? Esitä tulos pienen työselosteen muodossa, eli laita vastaukseen ainakin seuraavat otsikot: tavoite, menetelmät ja materiaalit,​ tulokset, viitteet. Muistathan että käyttämäsi ohjelmat ja tietokannat ovat nyt menetelmiäsi ja materiaalejasi! Vastauksen pituus ei ole niinkään tärkeä arvosteluperuste,​ mutta sisältö ja selkeys ovat.(6p.)
 +
 +  atgatgtgcg gggcgccctc cgccacgcag ccggccaccg ccgagaccca gcacatcgcc
 +  gaccaggtga ggtcccagct tgaagagaaa gaaaacaaga agttccctgt gtttaaggcc
 +  gtgtcattca agagccaggt ggtcgcgggg acaaactact tcatcaaggt gcacgtcggc
 +  gacgaggact tcgtacacct gcgagtgttc caatctctcc ctcatgaaaa caagcccttg
 +  accttatcta actaccagac caacaaagcc aagcatgatg agctgaccta tttctag
 +
 +  - Etsi ainakin yksi kasvipromoottori jossa on GT-1 transkriptiofaktorin sitoutumiskohtia ja aja sillä promoottorianalyysi (6p)
 +  - Avaa Unix ja luo alihakemisto,​ kirjoita Unixissa sekvenssitiedosto ja laita se alihakemistoon. Analysoi tiedosto plotorf-ohjelmalla. Kerro mitä käskyjä käytät ja missä järjestyksessä. Oikeinkirjoitusvirheistä ei sakoteta. (6p)
 +  - Oheiset sekvenssit ovat muutamien ihmisapinoiden DNA-sekvenssejä. Piirrä sekvensseistä parsimoniapuu Phylip-pakettia käyttäen. Mikä on lyhyimmän puun pituus? Analysoi saamiasi tuloksia: Mitä voisit sanoa lajien sukulaisuussuhteista saamasi puun perusteella?​ Entä voitko päätellä jotakin geenin evoluutiosta? ​
 +
 +  >A
 +  ACTGCACTCACCGCACCCGGCCAATTTTTGTGTTTTTAGTAGAGACTAAATACCATATAGTGAACAC
 +  CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGTCGGAG
 +  ATTGAGCGCGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCCGGGCGGCGAAGCT
 +  GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 +  GTCGCAGGGCGCGGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 +  GGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 +  GGAAAGGTGCGGCAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCCC
 +  GGACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCTTTCGCCGCCACGAGGAC
 +  CTACTTCTCCCACCTGGACCTG
 +  ​
 +  >B
 +  ACTGCACTCACCGCACCCGGCCAATTTTTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
 +  CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
 +  ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
 +  GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 +  GTCGCAGGGCGCCGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 +  GGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 +  GGAGAGGTAGCGCGAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCC
 +  GGAACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCCACGAAGA
 +  CCTACTTCTCCCACCTGGACCTG
 +  ​
 +  >C
 +  ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
 +  CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
 +  ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
 +  GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 +  GTCGCAGGGCGCCGCGGGTTCCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 +  GGTGCGCGCCCTGTGGAACCGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 +  GGAAAGGTGCGGCAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCCC
 +  GGACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCTTTCGCCGCCACGAGGAC
 +  CCTACTTCTCCCAACTGGACCTG
 +  ​
 +  >D
 +  ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAATACCATATGGTGAACAC
 +  CTAAGACGGGGGGCCTTGGATCCAGGGCGATTCAGAGGGCCCCGGTCGGAGCTGCCGGAG
 +  ATTGAGCACGCGCGGTCCCGGGATCTCCGACGAGGCCCTGGACCCCAGGGCGGCGAAGCT
 +  GCGGCGCGGCGCCCCCTGGAGGCCGCGGGACCCCTGGCCGGTCCGCGCAGGCGCAGCGGG
 +  GTCGCAAAGGCGCCGCGGGTACCAGCGCGGGGATGGCGCTGTCCGCGGAGGACCGGGCGCT
 +  GGTGCGCGCCCTGTGGAACCGAAGCTGGGCAGCAACGTCGGCGTCTACACGACAGAGGCCCT
 +  GGAGAGGTAGCGCGAGGCTGGGCGCCCCCGCCCCCAGGGGCCCTCCCTCCCCAAGCCCCC
 +  GGAACGCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCCACGAAGG
 +  CCGACTTCTCCCAACTGGACCTG
 +  ​
 +  >E
 +  ACTGCACTCACCGCACCCGGCCAATTGTGTTTTTAGTAGAGACTAAAAACTATATGG
 +  TGAACACCTAAGACGCGGGGGCCTTGGATCCAGGGCGATTCAGAGTTCCCCCGGTCGGAGCAGTCGGAGA
 +  TGGAGGCCGCGCGGTCCCGGGATCCGGGACCAGGCCCTGCACCCCAGGGTGGCGAGGCTGCAGCGCGGCG
 +  CCCCCTGGTGGCCGCGGGACCCCTGGCCGGTCTTTTGCAGGCGCAGCGCGGGCGCAGGGCGCGGCGGGTTC
 +  CAGCGCGGGAATGGCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAACTGGGAAGC
 +  AATGTTGGCGTCTATGCTACTGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCTCCGGGGC
 +  CCTGCCTCCCCAAGCCCCCCGGACGCGCCTCACCGCCGTTCCTCTCGCAGGACCTTCCTGGCTTTCCCCG
 +  CCACGAAGACCTACTTCTCCCACCTAGACCTG
 +  ​
 +  >F
 +  ACTGCACTCACCGCACCTGGCCAATTTTTGTGTTTTTACTAGAGACTAAAAACCATATGGTGAACACCTC
 +  CACCGGGGGGCCTTGGATCCAGGCAATTCAGAGGGCCCCGGTCGGAGCTGTCGGAGATGGAGCGCGCGCG
 +  CTCCCGGGATCCCGGACGAGGCCCTGGACCCCAGGGCGGCGAGGCTGCAGAGAGGCGCCCCCTGGAGGCC
 +  GCGGGACCCCTGGCCGGTTCGCGCAGGCGCGGCGGGGACGCAGGGCGCGGCGGGTTCCAGCGCGGGGATG
 +  GCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCT
 +  ACACGACAGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCCCAGGGCCCTCCCTCCCCAAG
 +  CCCCCCGGACTCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTTCCCCGCAACGAAGACCTAC
 +  TTCTCCCACCTGCCCACCTG
 +  ​
 +  >G
 +  ATGCACTCACCGCACCTGGCCAATTTTTGTGATTTTACTAGAGACTAAAAACCATATGGTGAACACCTC
 +  CACCGGGGGGCCTTGGATCCAGGCAATTCAGAGGGCCCCGGTCGGAGCTGTCGGAGATGGAGCGCGCGCG
 +  CTCCCGGGATCCCGGACGAGGCCCTGGACCCCAGGGCGGCGAGGCTGCAGAGAGGCGCCCCCTGGAGGCC
 +  GCGGGACCCCTGGCCGGTTCGCGCAGGCGCGGGGGGGACGCAGGGCGCGGCGGGTTCCAGCGCGGGGATG
 +  GCGCTGTCCGCGGAGGACCGGGCGCTGGTGCGCGCCCTGTGGAAGAAGCTGGGCAGCAACGTCGGCGTCT
 +  ACACGACAGAGGCCCTGGAGAGGTGCGGCGAGGCTGGGCGCCCCCGCCCCCAGGGCCCTCCCTCCCCAAG
 +  CCCCCCGGACTCGCCTCACCCACGTTCCTCTCGCAGGACCTTCCTGGCCTCCCCGCAACGAAGACCTAC
 +  TTCTCCCACCTGCCCACCTG