19 de setembro de 2009

Bioinformatics can be that cool

Ainda não aprendi a fazer todas as análises de bioinformática como eu queria, leia-se da forma mais prática, mas estou voltando as boas com a área. É muito bonito depois do trabalhão que dá chegar até um simples arquivo FASTA, ver que aquela simples sequência de nucleotídeos codifica uma proteína interessante, tem um domínio altamente conservado (como na foto abaixo) e vai ajudar a entender um pouco mais sobre o organismo que estudamos.

Domínio FRED (NCBI)

A quantidade de informação que podemos extrair de uma sequência de DNA ou proteína usando ferramentas de bioinformática e graças a internet (a 8ª maravilha do mundo) é absurda! Dois exemplos:

O NCBI tem um banco de dados de domínios conservados onde é possível buscar na sequência de uma dada proteína a existência de algum domínio conservado. Em se tratando de uma sequência de nucleotídeos, basta traduzi-la usando por exemplo a ferramenta de tradução do expasy  ou mesmo o Bioedit. Mas existem 6 possíveis traduções: 3 frames em dois sentidos. Se biblioteca de cDNA é direcional (as sequencias foram clonadas no sentido 5'3'), 3 possibilidades já podem ser eliminadas, pois conhecemos o sentido da sequencia. Entre as 3 possibilidades remanescentes, a mais provável é aquela sem um STOP codon, ou com um maior trecho sem STOP codon, mas na dúvida, não custa nada testar as três.

Como resultado, tem-se um relatório detalhado dos possíveis domínios conservados presentes na proteína. Além de informações como o valor e o score para avaliar a relevância da similaridade encontrada, é exibido um esquema indicando onde na sua sequencia está o domínio, o alinhamento de maior similaridade com um dos membros deste grupo de domínios, além de um link para a página do mesmo com várias outras informações interessantes, como estutura tridimensional, uma descrição funcional e citações na literatura. Para ver um exemplo, veja a página do domínio FRED, que achei em um dos meus clones. Muito maneiro.

Ainda vou ficar devendo um post dedicado ao Blast2GO. Eu sou fã do Blast2GO! É realmente user-friendly. Agora eles estão no twitter, pena que eu não estou mais neste miniblog irritante. Mas a segunda ferramenta interessante e que só fui usar recentemente via Blast2GO é o banco de dados Kegg Pathways que agrupa vias de reações e interações moleculares anotadas manualmente. O BlastGO identifica o código Kegg das enzimas presentes entre as sequencias anotadas e com isso é possível baixar os mapas das vias de referência das quais a enzima participa. Muito, muito maneiro também.

Update 20/09/2009:
O banco de dados de proteínas do NCBI oferece vários formatos para acessar uma dada proteína, um deles é chamado de "graphics" e é praticamente o google earth das proteínas. Mas muito mais interativo, você pode passear pelas ruas que quiser, abrir e fechar portas, olhar pela fechadura, etc, uma realidade bioquímica virtual!  


Bookmark and Share