20 de outubro de 2008

Desenho experimental é tudo!


Todos que trabalham com ciência sabem ou deveriam saber disso. Isso porque o desenho experimental é crucial para que se consiga o tipo e a quantidade de dados que realmente podem responder a pergunta de interesse. Logo, o primeiro passo é sempre identificar que perguntas específicas serão investigadas com o experimento em questão e definir quais tratamentos (grupos experimentais) e controles utilizar, assim como quais variáveis (os “tipos de dados”) devem ser monitoradas em função dos tratamentos utilizados para que seja possível responder as perguntas estabelecidas. Uma outra questão extremamente importante é identificar as fontes de variabilidade existentes. Todas estas questões são assunto para 1 ano de posts...mas, recentemente, eu tive uma aula sobre desenho experimental na área de proteômica onde se discutiu a problemática das fontes de variabilidade e a importância das réplicas, principalmente, biológicas...questões sobre as quais eu já vinha pensando e que despertaram ainda mais meu interesse. Portanto, por enquanto, vou me focar neste ponto.

Por que identificar as fontes de variabilidade é tão relevante? Em geral, o objetivo de um experimento é avaliar os efeitos de um “tratamento”, por exemplo, a exposição a uma substância tóxica, no organismo ou modelo de estudo. Em contraste com um estudo de “observação” onde dados são obtidos e analisados sem que as condições sejam alteradas. Para determinar que os efeitos observados através de um experimento são resultado do tratamento utilizado é preciso ter o máximo de controle sobre todas as possíveis fontes de variabilidade (que não o tratamento) que podem interferir nos resultados para que desta forma se possa determinar que os efeitos observados estão de fato relacionados com o tratamento. Estas fontes podem ser tanto técnicas quanto biológicas. Em geral, as pessoas se preocupam mais com a variabilidade técnica cujo grau depende, obviamente, das técnicas utilizadas. No entanto, a variabilidade biológica também pode ser uma grande pedra no caminho, especialmente, em experimentos que avaliam alterações na expressão gênica de milhares de genes como os microarranjos de DNA e a proteômica. As fontes de variabilidade biológica são inúmeras: diferenças genéticas, de idade, sexo e de estado nutricional entre os indivíduos, no caso de cultura de células: o número de passagens, a linhagem utilizada, a densidade de células e o tempo de cultivo da linhagem (no caso de culturas primárias) são relevantes.

Para lidar com esta variabilidade a utilização de réplicas (técnicas e biológicas) é essencial. Uma réplica técnica consiste em analisar uma mesma amostra biológica independentemente mais de uma vez, enquanto que uma réplica biológica consiste em analisar amostras biológicas provenientes de diferentes indivíduos. Esta estratégia auxilia a reduzir a variabilidade não relacionada com o tratamento e, assim, a detectar variações “verdadeiras” com maior precisão, além de possibilitar que os dados sejam avaliados estatisticamente. No curso de proteômica, foi comentado que, estatisticamente, as réplicas biológicas são mais relevantes que as técnicas e que vale a pena aumentar o número de réplicas biológicas mesmo em detrimento do número de réplicas técnicas. Mas, falando de estatística eu estou entrando em terreno praticamente desconhecido para mim...ao menos por enquanto, pois pretendo e, principalmente preciso(!!!) mudar isso.
Bom, eu escrevi uma página e acho que não disse muita coisa, então, continuo na próxima vez! Ciao!

4 comentários:

Vania brasiliensis disse...

éé isso td é verdade mesmo!!
mesmo nos estudos de observação como vc disse, tem tanta variável q pode influenciar e portanto mesmo assim temos q tomar cuidado.... e é super difícil né, pq em ecologia e coisas assim é mto raro a pessoa ter um controle, então tem q se ter mt cuidado... evitar pseudo-réplicas, evitar coisas q influenciem no comportamento dos bichos por exemplo qdo no caso o que vc tá estudando é isso...enfim design experimental não é uma coisa simples como pode parecer pra quem nao entende né?
estatística nem me fale.. ui.. sábado comecei uma disciplina aqui e já tô estudando q nem uma condenada, nao só do assunto da matéria mas já de outras coisas tb, já pensando em qdo tiver q analisar meus dados... Pq lembro meu desespero em biogeografia pra aprender vários tipos de análise multivariada em 1 semana XPP... socorro... hehe nao quero q isso se repita. Temos q ter um mínimo de autonomia nessas coisas né? Concordo q é mt importante. Bjs!

Juliana Americo disse...

Pois é, Vania! No seu caso, acho que o mais difícil também é não introduzir novas variáveis, tem que ter muito cuidado para interferir o menos possível, certo?Quanto a estatística, é um "mal" (extremamente) necessário, que bom que vc já está fazendo estatística, vai te ajudar bastante! Com certeza, a gente tem que ter alguma autonomia e entender o que estamos fazendo e saber escolher o teste mais adequados para nossos dados e fazer o desenho experimental pensando nisso!
Obrigada pela comentário :)
Bjs

Mauro Rebelo disse...

Ju,
Tem duas questões importantes: A primeira é que é mais fácil (e mais barato) fazer réplica técnica do que réplica biológica. Então, apesar dessas pessoas dizerem que é pra preterir uma em função da outra, aposto que nenhuma delas faz isso.
A segunda é que as pessoas tentam sempre acabar com a variabilidade biológica e isso é ruim. A variabilidade existe e pronto! Temos que aprender a lidar com essa 'incerteza' ao invés de tentar torturá-la até que ela se transforme em certo ou errado.
Então o que você tem que fazer é deixar variabilidade suficiente para te permitir concluir alguma coisa com significância estatística (hehehe e o que isso significa você vai ter que estudar pra aprender) e não ser guloso quanto ao número de informações que você quer obter. Ou seja: POUCOS TRATAMENTOS e muitas réplicas!

Juliana Americo disse...

Entendo o que vc disse, Mauro, mas não dá para fazer uma análise estatística sem réplicas biológicas (ou com muito poucas) e não seria possível inferir se o resultado é representativo do que ocorre na população como um todo, ou seja, se tem significância estatística...Não adianta eu analisar 1 individuo(ou um número muito pequeno)5 vezes (réplicas técnicas), pois isso não me permite inferir nada sobre o que ocorre na população, e no nosso caso (biomarcadores), isso é muito importante, mas então acho que é como vc disse, usar uma quantidade de réplicas (biológicas!)suficiente para nos permitir concluir alguma coisa nesse sentido.
Uma solução para o fato réplicas biológicas serem caras é fazer um pool como pensamos...mas se perde a informação de cada indivíduo.
Eu prometo que vou estudar estatística e escrever um post decente sobre isso :)
(em algum momento do futuro)