1) Acesse a página do GenBank (http://www.ncbi.nlm.nih.gov/genbank/).
Leia os tópicos "What is GenBank?", "Access to GenBank" e
"GenBank Data Usage".
2)Procure e recupere um registro do GenBank com um gene completo que codifica para uma proteína (sequência genômica, não mRNA) de um eucarioto com intron(s). Para isso, digite uma combinação de termos na caixa de entrada de textos ao lado do menu "pop up" onde deve estar selecionado "nucleotide". Por exemplo, busque por "drosophila melanogaster alcohol dehydrogenase". Caso você tenha dificuldades em encontrar o gene escolhido, use a opção "Advanced", abaixo da caixa de entrada de texto. Nesse caso você pode combinar termos de busca em todos os campos, em campo especificado e uma combinação com os operadores lógicos "AND", "OR" e "NOT". Grave o registro em disco e, com um editor de texto, encontre:
Nome do gene; Nome da proteína codificada;
Autores; Publicação correspondente; Número de exons e introns;
início e término deles.
3)Recuperar o registro correspondente à mesma
sequência nucleotídica dos bancos de dados EMBL e DDBJ
4)Baixar um arquivo do tipo GENKBANK.
5)Gerar, com um editor de textos, um arquivo do tipo "FASTA" com a sequência de nucleotídeos, a partir do arquivo .
6)Gerar com um editor de textos, um arquivo do tipo "FASTA" com a sequência de aminoácidos.
7)Entre na página:http://www.catch22.net/software/hexedit e baixe o programa Hexedit de acordo com a versão do Windows instalado no computador que você está usando. Caso esteja usando um Mac, use esse https://ridiculousfish.com/hexfiend/. Para Linux, escolha um dos editores:https://www.tecmint.com/best-hex-editors-for-linux/Comente como foi sua experiência. Examine o arquivo FASTA que você gerou, com especial atenção aos caracteres de controle de mudança de linha, usando uma tabela ASCII. Comente sobre sua experiência.