21 de agosto de 2009

Homologia ou Similaridade? Nem tudo é o que parece.


Um dos principais objetivos da análise de sequências de DNA e proteínas é identificar sequências homólogas. Mas o que são exatamente sequências homólogas? Quando temos uma sequencia desconhecida que queremos identificar associando-a a uma família de proteínas de funções conhecidas, comparamos esta sequência com as dos bancos de dados utilizando um algoritmo como o BLAST. Em geral, como resultado obtemos uma lista, às vezes, grande de resultados. Seriam todas estas sequências "homólogas" a nossa sequência "problema"?

Em se tratando de análise de sequências de DNA e proteínas, muitos usam o termo homologia para expressar o que na verdade é similaridade. O BLAST e algoritmos semelhantes analisam a similaridade entre as sequências e nos dão uma lista de resultados contendo diferentes genes que apresentam graus decrescentes de similaridade com a nossa sequência problema. Similaridade é simplesmente uma forma de expressar o quanto duas sequências são parecidas e, por isso, faz sentindo dizer que a nossa sequência apresenta maior similaridade com o gene X do que com o gene Y; ou que duas sequências possuem 80% de similaridade, por exemplo.

No entanto, homologia é um conceito biológico essencialmente qualitativo. Homologia significa origem evolutiva comum. Duas sequências são homólogas quando se originaram de um ancestral comum. Assim, ou duas sequências são homólogas, ou não. Não existem seqüências com, por exemplo, 80% de homologia. Ou é, ou não é! E esta informação, o BLAST não dá.

Então, para que serve a similaridade medida pelos BLASTs da vida? E como podemos identificar a homologia?

Ninguém disse que similaridade não serve para nada! Sendo uma medida numérica pode ser relacionada com probabilidade e nos ajudar a inferir homologia, mas não sem critérios. É verdade que quanto maior a similaridade entre as sequências, menor a probabilidade de que ela tenha ocorrido ao acaso, sendo mais provavél que as duas tenham um ancestral comum e sejam, portanto, homólogas.

Então, genes homólogos apresentam sempre alta similaridade? A similaridade é evidência absoluta de homologia?

Você diria que 20 sequências de espécies diferentes que apresentam apenas um aminoácido em comum são homólogas? Seguindo o raciocínio acima, não. Mas não é verdade para a proteína ribossomal L36. Para a função desta proteína, mais importante que a sequência é a estrutura! Apesar de as proteínas L36 de diferentes espécies diferirem muito na sua sequência de aminoácidos, apresentando apenas um aminoácido conservado, a sua estrutura é conservada.

Portanto, nem todos os genes homólogos apresentam altos valores de similaridade. E a similaridade estrutural é uma informação valiosa que deve ser também acessada, sempre que possível. A porcentagem de similaridade não é a única informação que temos que avaliar para inferir a homologia entre dois genes. Nos casos em que se observa baixa similaridade, devemos avaliar alguns outros aspectos:

* Existe uma região onde a similaridade é maior entre as duas sequências? Esta região é funcionalmente importante? Por exemplo, está localizada no sítio ativo da enzima ou em um domínio de ligação?

* Os poucos aminoácidos conservados são essenciais para o funcionamento da proteína?

* Os aminoácidos não conservados apresentam as mesmas características físico-químicas? E assim poderiam, apesar de diferentes, exercerem o mesmo papel na proteína?
Um exemplo, são as proteínas que se ligam a calmodulina (uma sensora dos níveis intracelulares de cálcio). Estas proteínas se ligam a calmodulina através de um domínio que não apresenta uma sequência conservada, mas uma estrutura bem definida: alfa hélices anfipáticas, onde aminoácidos hidrofílicos estão localizados em um lado e os hidrofóbicos, no outro.

Concluindo, similaridade não é sinônimo de homologia, mas constitui um dado importante para inferirmos homologia e deve ser analisada com critérios. Estes critérios nos ajudam a determinar a significância biológica da similaridade observada cuja a primeira impressão, ás vezes, nos engana! Mesmo na biologia, nem sempre tudo é o que parece...

19 de agosto de 2009

Diário de uma mestranda com a corda no pescoço - 08/2009




Ok, ainda não estou tão com a corda no pescoço. Exagerei, como sempre! Mas estou quase lá. Digamos que a corda já está no pescoço, mas ainda não começou a apertar. Meu prazo é março. Mas para fazer a seleção de doutorado em dezembro, preciso ter a dissertação escrita. Ainda tenho que fazer uma disciplina de 120 horas, extrair, sequenciar e analisar quantos clones eu puder e...escrever a bem dita dissertação! Que ainda está nas primeiras páginas...mas as primeiras linhas são as mais difíceis e estas já foram. Mas é claro que ela ainda vai ser reescrita um milhão de vezes até chegar a versão final, não tenho dúvidas. Ao menos, encontrei finalmente um kit para extração de plasmídios em placas de 96 poços com pronta entrega. Não vou ter que esperar 3 meses, como de costume para muitos kits e reagentes, no Brasil. E vou poder extrair 100 plasmídios por dia sem entrar em coma depois! Ainda estou tentando me virar com a bioinformática. Na verdade, não tenho investido muito tempo nisso. Tenho que correr mais atrás, mas é difícil, acho que vou mesmo ter que colocar Linux. Estou me sentindo analfabeta em bioinformática. Em paralelo, este semestre vou trabalhar no RACE para o p53 e MXR usandoo protocolo que já funcionou muito bem para actina e também vou voltar aos hidden breaks que, admito, tinha largado de mão. Já se foram um ano e meio de mestrado e e se foram muito rápido!