21 de abril de 2008

Bibliotecas de cDNA


A princípio, eu estava pensando em escrever aqui um pouco sobre a construção de bibliotecas de cDNA normalizadas, em particular, sobre uma abordagem de normalização desenvolvida recentemente que achei m-u-i-to elegante (que espero poder usar!).Mas, resolvi que seria melhor começar pelo básico e, assim, colocar todas as idéias em ordem.

Bom, para começo de conversa, o que é e para que serve uma biblioteca de cDNA?

Uma biblioteca de cDNA (ou de expressão) é uma coleção das seqüências expressas em um tecido ou tipo celular de um organismo, em um dado momento. Estas seqüências são representadas pelo pool de cDNA (DNA complementar) obtido através da enzima transcriptase reversa a partir do pool de RNA mensageiro isolado a partir das células ou tecido em questão. Estas seqüências de cDNA são, então, clonadas em um plasmídio ou, menos freqüentemente, também em outros tipos de vetores de clonagem como fagos, cosmids e phagemids. Portanto, uma biblioteca de cDNA é um conjunto de seqüências expressas isoladas em um vetor de clonagem, onde podem ser armazenadas de forma estável e por longos períodos e a partir do qual podem ser prontamente seqüenciadas através de primers universais.
Tipos celulares diferentes expressam genes diferentes, em intensidades diferentes e até um mesmo tipo celular pode apresentar diferentes perfis de expressão gênica ao longo do desenvolvimento e em função de variáveis ambientais. Por exemplo, uma biblioteca de cDNA construída a partir de RNA isolado de um neurônio irá conter um conjunto de seqüências distintas de uma biblioteca construída a partir de RNA de um fibroblasto.

Assim como, uma biblioteca de cDNA do fígado de um camundongo que se alimenta com dieta só de gorduras, não será igual a de um com dieta normal, contendo quantidades adequadas de lipídeos, caboridratos, proteínas...

Portanto, é preciso considerar a partir de qual, ou quais, tecidos ou células se vai construir a biblioteca de expressão, assim como as condições ambientais e estágio do desenvolvimento do organismo estudado. Embora, obviamente, existam genes que são expressos sempre e em todas as células de um organismo, se o objetivo é isolar as seqüências expressas relacionadas a um processo particular que só ocorre em um tecido específico, não há por que utilizar outro tecido como fonte de RNA.
Uma série de processos biológicos pode ser estudada através da análise da expressão gênica. Atualmente, pode-se avaliar quantitativamente os níveis de um RNA mensageiro específico assim como é possível avaliar a sua localização espacial e temporal no organismo, em um tecido ou mesmo em uma única célula. Para a viabilização destes estudos, a seqüência do RNAm de interesse deve ser conhecida e a construção de uma biblioteca de cDNA possibilita a prospecção de seqüências gênicas expressas de interesse através de algumas abordagens de triagem, como por exemplo, o PCR de colônia com primers degenerados (desenhados a partir de domínios conservados no gene de interesse).
No entanto, bibliotecas de cDNA não são construídas somente com o objetivo de isolar uma ou algumas seqüências gênicas relacionados a um processo específico ou para isolar genes que são diferencialmente expressos em função de uma condição de estudo, como no caso das bibliotecas de cDNA subtrativas (sobre as quais não vou falar aqui). O isolamento e sequenciamento, em grande escala, de clones de cDNA a partir de bibliotecas de expressão tem se tornado uma boa alternativa para o sequenciamento do DNA genômico na identificação de novas seqüências gênicas. São necessários menos recursos e a estrutura dos genes é prontamente identificada, ao contrário das seqüências genômicas que em eucariotos são interrompidas por íntrons, sendo necessário lançar mão de ferramentas de bioinformática para tentar prever a estrutura do gene e a seqüência expressa. Além disso, em uma biblioteca de DNA genômico, a maior parte dos clones não contém seqüências gênicas, sendo o isolamento destas, muito mais trabalhoso.
A caracterização em grande escala das seqüências de cDNA abre espaço para uma nova abordagem, a genômica funcional, que busca elucidar a função dos genes em uma escala genômica. Uma das principais abordagens se baseia na avaliação e comparação, em diferentes condições, dos perfis de expressão gênica, ou seja, do transcriptoma – todo o conjunto de RNAm expresso em um organismo, tecido ou célula em um determinado contexto. O estudo de transcriptomas têm sido feito principalmente por meio dos DNA arrays, ou microarranjos de DNA. Através desta tecnologia, é possível monitorar até mesmo a expressão de todos os genes de um organismo, como já foi feito para a levedura S. cerevisiae que teve seus aproximadamente 6000 genes impressos em um chip possibilitando a avaliação das alterações globais no perfil de expressão gênica em função de várias condições, como estresse oxidativo. Mas, o microarranjo de DNA e suas aplicações são assuntos para textos futuros.
Um biblioteca de cDNA de qualidade, que possibilite o isolamento de virtualmente todas as seqüências expressas no objeto de estudo, deve preencher alguns requisitos:
1) Deve ser representativa, ou seja, apresentar pelo menos uma cópia de cada RNA mensageiro expresso no tecido ou célula de onde se isolou o RNAm.
2) Deve conter seqüências completas, para que se possa fazer uma avaliação funcional da biblioteca (através da comparação das seqüências obtidas com outras já descritas depositadas nos principais bancos de dados públicos) e para se ter acesso a toda a seqüência de aminoácidos da proteína codificada.
3) Deve ter o mínimo possível de redundância (muitos clones contendo um mesmo gene), facilitando o isolamento de um maior número de seqüências distintas.
4) Deve ter o maior número possível de clones recombinantes (plasmídios contendo inserto de cDNA).

As pedras no caminho...

Estas são as características da biblioteca de cDNA dos meus sonhos! Mas, não é tão simples assim construir uma biblioteca de cDNA de qualidade. Existem várias pedras no caminho, começando pela instabilidade do RNA, constantemente sujeito a degradação por RNAses, como já falei exaustivamente por aqui, oque dificulta o isolamento de seqüências completas. Além disso, durante a retrotranscrição e amplificação do cDNA pode ocorrer a amplificação incompleta dos fragmentos e o PCR tem a tendência de amplificar seqüências curtas mais eficientemente que as longas, sendo muitas seqüências completas "perdidas" neste processo. A proporção de clones recombinantes depende da eficiência da reação de clonagem, da seleção dos clones recombinantes e de uma série de outros fatores...
Mas, o principal problema, ao meu ver, diz respeito à representatividade e, principalmente, a redundância da biblioteca. Em uma célula eucariótica típica, o RNA mensageiro representa apenas 1-5% da massa de RNA total. O número de cópias de mRNA por gene varia absurdamente. Em geral, existem três classes de nível de expressão: 1) 5-10 genes housekeeping que são altamente expressos e representam até 20% do total de RNA mensageiro; 2) 500-2000 genes que têm um nível de expressão intermediário e representam 40-60% do total de mRNA da célula; 3)10000-20000 genes que são expressos moderadamente e representam 20-40% do total de mRNA da célula.
Logo, a maior parte dos genes são expressos em níveis moderados (até apenas 1 molécula de RNAm por célula!). Isto significa que uma biblioteca de cDNA construída a partir de um pool de RNAm típico de células eucarióticas deveria apresentar uma elevada redundância (alguns poucos genes presentes em alta freqüência) e baixa representatividade. Para se ter noção das implicações disso, para se isolar um clone cuja freqüência seja 1:10000 seria necessário seqüenciar até 100000 clones! Haja dinheiro, tempo, disposição, extensão do prazo de conclusão da dissertação, etc...
Isto não é um problema se o seu objetivo é isolar o cDNA de uma actina, por exemplo, que certamente se encaixa na primeira classe de genes. Mas é um grande problema para quem quer isolar e seqüenciar um grande número de cDNA diferentes, inclusive os de expressão intermediária e baixa, para disponibilizar as seqüências expressas em organismos cujos genomas são praticamente desconhecidos.
Este era o ponto onde queria chegar para começar a falar da abordagem de normalização de cDNA que comentei no início do texto, que na verdade é uma combinação de técnicas que visam a construção de uma biblioteca de cDNA com seqüências completas, representativa e de baixa redundância. Ou seja, que chuta todas estas pedras no caminho para bem longe! Ao menos, assim espero! No próximo post, escreverei sobre isso. Arrivederci!

11 de abril de 2008

Em que devemos nos focar?


O grupo que publicou o trabalho com os roedores Ctenomys, sobre o qual falei no no último post, estava inicialmente desenvolvendo um estudo sobre a possível transcrição de uma região de DNA satélite destes animais. No meio do caminho, eles esbarraram com o padrão anormal de rRNA nos géis desnaturantes. Embora não fosse o objetivo inicial, eles investiram nisso e publicaram este trabalho legal na EMBO Journal! Embora eu ache esta revista muito boa, não estou valorizando o artigo só por que foi publicado nela, o trabalho é bem completinho mesmo e relevante, pois descreve pela primeira vez a ocorrência de uma hidden break em uma espécie de vertebrado.

Então, respondendo a questão que a Lia levantou no blog dela, eu acho que temos que ter foco, sim, mas devemos ajustá-lo para não perder a visão periférica! Por mais que a maioria das descobertas e dos trabalhos não tenham se originado por caminhos como estes, coisas interessantes sempre podem surgir de onde menos esperamos ou de onde não estávamos procurando...



"A mente que se abre a uma nova idéia, jamais voltará ao seu tamanho original"
Albert Einstein

Obs.:
Lia: tô te copiando, citando frases de impacto! :-)

10 de abril de 2008

Para onde vai o rRNA 28S dos bivalves?



Quando comecei a extrair RNA das espécies com que trabalho (moluscos bivalves), eu analisava as amostras por eletroforese em gel de agarose não desnaturante. Ás vezes, eu via duas bandas, outras, apenas uma. O curioso é que quando apareciam duas bandas, a menor sempre era bem mais intensa que a banda maior! E quanto menos intensa era banda maior, mais intensa era a menor. Ou seja, o contrário do que deveria ser uma amostra de boa de qualidade...
Bom, meu RNA deveria estar bem degradado, não é? Na verdade, não. Pois se a banda maior tivesse simplesmente degradado, deveria se formar um rastro ou bandas menores. Mas, nem uma, nem outra coisa ocorria. Apenas a banda menor aumentava de intensidade.
Quando passei a fazer o gel em condições desnaturantes, comecei a ver sempre apenas uma banda! “Perdi a mão de vez!”, pensei. Mas, novamente: uma banda apenas, sem rastros, nem nada, sem indícios de degradação! Foi quando o Mauro comentou que algo parecido acontecia com algum protozoário e sugeriu que eu pesquisasse melhor sobre isso e eu, por livre e espontânea pressão (brincadeira!), fiz algumas buscas no pubmed, meio ainda sem saber o que procurar.
Eu admito que tinha um certo preconceito com artigos velhos. O que vai ter num artigo da década de 60 que não tem numa revisão mais recente? E as figuras feias? Xerox mal scaneada? E os métodos que ninguém mais usa? Mas eu estava totalmente errada! Por mais “feios” que sejam, eles descrevem os princípios das coisas que ninguém mais, por motivos diversos, se dá ao trabalho de descrever , mas que fazem toda diferença, como o que eu estava tentando saber.

Tanto que o primeiro (e segundo, e o terceiro...) artigo relevante que eu li é bem antigo (Venkov & Hadjiolov, 1969) e falava sobre a instabilidade do RNA 28S em relação ao 18S de fígado de rato. Eles mostraram que em várias condições (de temperatura e força iônica), o RNA 28S se fragmentava em pedaços menores enquanto o 18S continuava íntegro. E, por fim, levantavam a possibilidade de isso ocorrer devido à presença de alguma hidden break, mas não explicavam bem o que era isso.
Quando li um segundo artigo, sobre o mecanismo de inserção de uma hidden break no RNA 28S de insetos (Fujiwara & Ishikawa, 1986), consegui finalmente não só entender o que é isso como ter certeza que só poderia ser esta a explicação para o que vínhamos observando no RNA dos bivalves!

O rRNA 28S dos insetos possui uma seqüência específica que funciona como um sinal para a introdução de uma hidden break, literalmente, uma quebra na cadeia de RNA. Através de um mecanismo de processamento (splicing), esta seqüência é excisada, gerando dois fragmentos de tamanhos bem próximos, uma vez que a seqüência sinal está posicionada quase que no meio da molécula. Portanto, o rRNA 28S destes organismos não é uma molécula contínua, mas in vivo, os dois fragmentos permanecem "unidos" por meio de estruturas secundárias. O RNA, por ser fita simples, tem o potencial de formar estruturas secundárias por pareamento de bases de grande complexidade, como as formadas pelos RNA ribossomais.

Após a extração do RNA, qualquer coisa que perturbe estas estruturas secundárias irá resultar na separação dos dois fragmentos. E estes, além de terem tamanhos quase idênticos, são também praticamente do mesmo tamanho do rRNA 18S!

E Isso explica perfeitamente as observações do RNA ribossomal dos moluscos bivalves:
  • Em gel não desnaturante, é possível visualizar duas bandas, pois os dois fragmentos da subunidade maior, permanecem unidos. No entanto, a estabilidade deste complexo pode não ser tão grande e, eventualmente, os fragmentos podem se dissociar mesmo em condições nativas e, neste caso, apenas uma banda é detectada, pois os dois fragmentos apresentam o mesmo padrão de migração do rRNA 18S. Mas, também pode ocorrer dissociação de apenas parte dos rRNA 28S, resultando na visualização de duas bandas, sendo a de menor tamanho mais intensa (por conter o rRNA 18S e os fragmentos do 28S).
E o nome hidden break se deve ao fato de, em geral, esta quebra não ser perceptível em condições não desnaturantes.
  • Já em um gel desnaturante, as moléculas de RNA são totalmente linearizadas, ou seja, todas as estruturas secundárias são desfeitas e se observa apenas uma banda, que contém os dois fragmentos da subunidade maior e o rRNA 18S.
Mas nem sempre, os fragmentos resultantes da hidden break são do mesmo tamanho. Em algumas espécies, são gerados fragmentos de tamanhos distintos.

A princípio, achava-se que as hidden breaks estivessem restritas a alguns grupos de protostomados (inclusive, algumas espécies de moluscos), mas, recentemente, foi descrita a ocorrência destas quebras no rRNA 28S de roedores do gênero Ctenomys (Melen et al, 1999) em um trabalho bonitinho publicado no EMBO Journal, mas que ainda não terminei der ler. Interessantemente, em quatro espécies deste grupo, a hidden break é expressa em todos os tecidos, menos nos testículos, onde um mecanismo de splicing retira o íntron que contém a seqüência sinal para a hidden break. Este é um forte indício de que a ocorrência destas quebras tenha alguma relevância biológica, o que vai de encontro com a idéia até então prevalecente de que tais quebras sejam toleradas por terem pouco efeito na estrutura do ribossomo.
Por isso, estava pensando em extrair o RNA total de todos os tecidos possíveis, de uma das espécies ao menos, e analisá-los em em condições desnaturantes, para ver se, quem sabe, há algum padrão de expressão tecido-específico destas quebras, nos moluscos também. Embora, isso não seja suficiente para demonstrar a existência de um padrão de expressão, mas poderia fornecer um indício. Outra coisa sobre a qual pensar é em como demonstrar a existência e a localização das hidden breaks, o que acho ser importante para avaliarmos a sua influência nas reações de retrotranscrição.
Mas a pergunta que não quer calar é: por que, numa molécula enorme, esta quebra tinha que ser justamente no meio dela e dar origem a fragmentos do mesmo tamanho que o 18S? Só pode ser para nos fazer quebrar a cabeça! :-)

6 de abril de 2008

Influência do pH na dosagem de ácidos nucléicos



A absorbância do RNA a 260 nm independe do pH da solução onde ele está dissolvido. Mas o mesmo não é verdade para alguns contaminantes que possivelmente podem estar presentes na solução de RNA!

Logo, embora a abs. a 260 nm permaneça a mesma, as leituras a 280 nm e 230 nm variam de acordo com o pH do meio. Por isso, analisando uma amostra de RNA em água ou soluções de pH relativamente ácido, pode-se obter razões 260/230 e 260/280 abaixo do normal sem que realmente haja tais contaminantes na amostra. O ideal é dosar o RNA em uma solução de pH levemente alcalino (7.5-8.5), como em tampão TE (pH 8.0).


Um exemplo prático


Já foram muitas as tentativas de extrair RNA da hemolinfa, quase sempre a partir da hemolinfa de apenas uma ostra e o resultado era sempre o mesmo: pouquíssimo RNA (praticamente nada) de baixíssima qualidade. No último experimento, resolvi fazer algumas modificações no protocolo:

1) Partir de um pool de hemolinfa de 4 ostras (aproximadamente, 9 mL) – onde foi muito importante a ajuda da Lia, que tira hemolinfa como ninguém (grazie! ou melhor, merci!).

2) Na etapa de precipitação:

- Além de isopropanol, adicionei 1/10 do volume de amostra de acetato de sódio (3 M), o que diminui ainda mais a solubilidade do RNA no álcool, aumentando a sua precipitação.

- Também adicionei 10 ug de glicogênio - um coprecipitante de ácidos nucléicos. O glicogênio não aumenta a precipitação do RNA, mas como ele também precipita nas mesmas condições, forma um pellet visível, o que facilita a manipulação da amostra (não sugar o RNA quando for retirar o sobrenadante!).

- Aumentei o tempo de incubação a -20ºC e da centrifugação (mas não a velocidade).


Como resultado, a quantidade de RNA obtido foi bem maior (~10 ug)! Mas as razões 260/230 e 260/280, embora tenham melhorado, ainda estavam longe do ideal.

Então, resolvi repetir a dosagem diluindo (10X) uma alíquota da amostra em tampão TE (pH 8.0) usando, obviamente, este tampão como branco. E, não é que ambas as razões e a curva do gráfico ficaram perfeitas ?!? Por isso que eu sempre digo, não há nada que o oráculo não saiba responder, basta saber perguntar!

Analisei a amostra (desnaturada em 60% de formamida, por 5 minutos a 65ºC) por eletroforese em gel de agarose 1.2% (em TAE 1X) e esta aí a imagem ao lado para comprovar.

No próximo post, eu explico o porquê de apenas uma banda, quando, comumente, se espera visualizar duas: uma da subunidade ribossomal maior e outra da menor. E não é por causa de degradação!