A transcrição dos genes e a síntese protéica
Desde as experiências de Beadle e Tatum com o fungo Neurospora crassa, já se supunha que os genes determinavam os caracteres influenciando a produção de enzimas, que são proteínas capazes de catalizar reações químicas nas células. Quando ficou claro que o DNA era o material genético e que este DNA era formado por uma longa sequência de nucleotídeos, os geneticistas puderam finalmente estabelecer um modelo de como os genes determinavam as enzimas. Neste modelo, os quatro nucleotídeos seriam as quatro "letras" com as quais se escreviam as "receitas" para a produção de todas as enzimas e demais proteínas, que por sua vez controlavam todo o desenvolvimento e o funcionamento dos seres vivos. De uma forma mais "científica", podemos dizer que o DNA contém o código genético necessário para produzir o conjunto de enzimas e outras proteínas existentes em cada indivíduo.
Sabemos que todas as proteínas, inclusive as enzimas, são formadas por apenas 20 tipos de aminoácidos. Como só existem quatro bases para escrever o código genético, o código que determina cada um dos aminoácidos deve ter pelo menos três bases, pois com duas bases por "palavra" só seria possível codificar dezesseis aminoácidos. Com três bases é possível codificar 64 combinações diferentes. A tabela ao lado mostra cada uma delas, e qual é o aminoácido que cada "trinca" codifica.
Note que um mesmo aminoácido pode ser codificado por mais de uma trinca, ou códon, e por esta razão o código genético é considerado degenerado. Note também que existem três códons que não codificam aminoácido algum, ao invés disso, servem como sinais para o término (stop codons) da transcrição do gene.
O código mostrado acima é considerado universal. Isso significa que cada códon determina o mesmo aminoácido em todos os seres vivos. O Códon AAA, por exemplo, vai determinar o aminoácido fenilalanina se aparecer no genótipo de qualquer organismo, seja ele de um vírus, bactéria, fungo, planta ou o humano. Este fato é chamado de princípio da universalidade do código genético.
A questão mais importante sobre a síntese de proteínas não é o código em si, e sim como a célula consegue usar este código para montar as proteínas que necessita. Neste processo, entra em cena uma molécula muito parecida com o DNA: O RNA, ou ácido ribonucléico.
O primeiro passo para que se produza uma enzima a partir de um gene codificado no DNA é fazer uma cópia deste gene numa molécula de RNA, num processo chamado transcrição gênica. Esta molécula também é formada por nucleotídeos, que são idênticos aos do DNA exceto por três detalhes:
- A molécula de açúcar a qual a base nitrogenada se liga é uma ribose, e não uma desoxirribose como a do DNA.
- O nucleotídeo Timina do DNA não existe no RNA. Em seu lugar, pareando-se com a Adenina, entra um nucleotídeo chamado Uracila (U).
- Ao contrário do DNA, o RNA só tem uma fita.
A região do DNA contendo o gene a ser copiado é aberta, e uma enzima chamada RNA polimerase faz a montagem do RNA do gene. Por carregar a mensagem para a constução de uma proteína, este RNA é chamado de mensageiro (RNAm).
O RNAm deixa o núcleo e vai para o citoplasma, onde se liga a uma organela chamada ribossomo.O ribossomo é formado por proteínas e por três longas moléculas de um tipo especial de RNA: o RNA ribossômico. Este RNAr não codifica nenhuma proteína, mas é fundamental para o funcionamento do ribossomo, e consequentemente para a síntese proteica.
Um terceiro tipo de RNA, o transportador, é responsável por ligar-se a aminoácidos livres presentes no citoplasma e torná-los disponíveis para o trabalho do ribossomo. Existem vinte tipos de RNAt, e cada um deles se liga a um único tipo de aminoácido.
O ribossomo é capaz de reconhecer os códons (conjunto de três nucleotídeos), e para cada códon ele se liga ao RNAt contendo o aminoácido correspondente ao códon lido. O Ribossomo se liga a dois RNAt de cada vez, e consegue realizar a ligação peptídica entre os seus aminoácidos. A cadeia de proteína em crescimento vai sendo passada ao RNAt mais recentemente ligado, e o RNAt mais antigo vai sendo descartado. O processo continua até que o último códon seja lido, e o último aminoácido acrescentado. A proteína pronta é então liberada no citoplasma. A produção de uma proteína a partir do RNAm é chamada de tradução.