lunes, 16 de enero de 2012

¿Qué número le ponemos al gen?

En un post reciente comentaba que el criterio para poner el nombre a los genes no es único y que la comunidad de científicos que trabaja en cada organismo particular decide. En organismos unicelulares los genes suelen tener tres letras mientras que en organismos superiores normalmente son una palabra (que se puede abreviar), pero sin un criterio establecido que limite el número de letras. En bacterias además los genes aparecen ordenados, por lo que hay una letra que hace referencia a la posición física que ocupan. En organismos como la levadura además de las tres letras es obligatorio que lleven un número. De hecho es frecuente que genes diferentes compartan las mismas tres letras, pero que se diferencien únicamente por el número. ¿Qué significa el número? Pues la respuesta no es única, ya que puede significar varias cosas diferentes:


a) Orden en el genoma:
En eucariotas (organismos con núcleo) los genes no se agrupan físicamente por función como pasa en bacterias. Genes que participan en el mismo proceso pueden estar codificados en cromosomas diferentes, alejados físicamente entre si. No obstante si que pueden aparecer repeticiones de un mismo gen de forma consecutiva en el genoma, lo que se llama repeticiones en tándem. Normalmente cuando se caracteriza se le asigna 1 al primero, y al resto 2, 3 según el orden que ocupan en el genoma, como pasa con los genes ENA o con SNQ.


b) Similitud de secuencia:
Muchas veces un gen puede estar duplicado, pero su copia estar en otra parte del genoma. Cuando se identifican y se confirma esta similitud de secuencia es frecuente mantener el criterio de ponerles el mismo nombre, por lo que el número indicaría el orden en el que han sido identificados. Es el caso de los genes TRK.


c) Función similar:
Hay técnicas que permiten identificar genes con una función determinada. Muchas de estas técnicas permites descubrir genes nuevos. Lo normal es que a medida que aparecen genes nuevos ir poniendo un número que indicará el orden en el que han sido descubiertos. Por ejemplo, los genes que al aumentar su expresión dan tolerancia a salinidad se llaman genes HAL (por halotolerancia) y hay del 1 al 11. Genes que al dejar de funcionar la levadura presenta problemas en el transporte de proteínas a la vacuola se llaman VPS (vacuolar protein sorting) y hay más de 50 diferentes. Aquí vemos la laxitud del criterio. En los casos a) y b) tener el mismo nombre pero diferente número implicaba que la secuencia era parecida, en este caso la secuencia no tiene por que parecerse. Solo indican que han sido descubiertos de forma similar, y en principio (no siempre es el caso) que están participando en el mismo proceso o tienen una función relacionada.


d) Peso de la proteína que codifican:
Hay genes de los cuales se conoce antes la proteína que codifican que el gen. Normalmente la propiedad más característica de una proteína es su peso molecular, que se puede determinar fácilmente. Es normal utilizar las tres letras que lo describan y un número que haga referencia al peso. Luego, cuando se descubre el gen, se mantiene el mismo criterio. Por ejemplo el gen TCO89 es el único que tiene las letra TCO en el genoma. No hay otros 88 genes TCO.


e) Nada:
Poner un número es obligatorio, por lo tanto si un gen se ha identificado individualmente, llevara el número uno. Hay un montón de genes que son hijos únicos, por eso el 1 es el número más repetido en el genoma de levadura.
Igual que una quiniela fácil, el genoma de la levadura esta lleno de unos


Y por si fuera poco lío es frecuente que un mismo gen sea descubierto simultáneamente por diferentes grupos y que cada uno le ponga un nombre diferente, lo que aumenta la confusión. Con el tiempo alguno de los nombre acaba imponiéndose (normalmente el del grupo que ha sacado la publicación con mayor factor de impacto o el que publica más sobre el gen en años sucesivos). Por ejemplo tenemos el gen CRZ1, que también se llama TCN1 por haber sido descubierto independientemente por dos grupos y se llama HAL8 por que fue unos de los genes identificados por dar tolerancia a salinidad. En la base de datos oficial aparecen recogidos estos tres nombres, pero la recomendación es CRZ1, por el grupo que más publicó sobre el tema. Es menos frecuente, pero se da el caso, que genes diferentes tengan el mismo nombre. Por muy estrictos que queramos ser, siempre se lía la cosa. Todos estos ejemplos se refieren a la levadura de panadería Saccharomyces cerevisiae, pero es similar en otros organismos.

Y con este post participo en la IX edición del carnaval de Biología que se hospeda en el blog "La ciencia de la vida", de Biogeocarlos.



Y también en la XI edición del carnaval de Química que se aloja en el blog "La aventura de la ciencia".

Y ya que habló de números, ¿por qué no participar también en el Carnaval de Matemáticas, que en su edición 2.X se alberga en el blog Resistencia Numantina? si, ese que estais pensando, el de la casilla de la ciencia en la declaración de la renta.
Votar esta anotación en Bitácoras.com

3 comentarios:

  1. Muy buena tu entrada! Y complementa perfectamente a tu anterior participación en el @biocarnaval.

    Por cierto, te vi por streaming en #murciadivulga y estuviste sembrado, ¡qué "jartá" de reir me pegué oyéndote! Eres un crack. Mi mujer estaba a mi lado y ponía unas caras raras raras cada vez que me reía y cuando dijiste lo de "¿Te pagan?" ya fue el descojone, además de sentirme tremendamente identificado... jajaja. En resumen, lo dicho, eres un crack! ;)

    ResponderEliminar
  2. La verdad es que los criterios de nomenclatura y de numeración de genes son bastante variables. Y, en general, los nombres se hacen difíciles de recordar o agrupar para un uso ágil.

    Puedo recordar muchos nombres de genes (murinos o humanos), y los asocio a rutas o procesos bioquímicos concretos. Ayuda a esta memorización el haber trabajado en proyectos y escrito artículos que abordan genomas y transcriptomas globales.

    El problema me surge cuando los intento asociar a sus ortólogos de levadura, gusano, mosca o plantas. Me puedo tirar un buen rato buscando los nombres de los genes más o menos equivalentes en distintos organismos (el servicio "homologene" de NCBI, p. ej., sólo una relativa aproximación. A veces me toca hacer BLASTs - es decir, análisis de similitud de secuencia - a mansalva para ver cuáles son los potenciales ortólogos a mis genes de interés).

    Pero donde tengo problemas reales es en recordar los nombres (números) de los microRNAs, cuáles son sus dianas, en qué rutas podrían estar participando. Para mí, de momento, un mundo nuevo.

    ResponderEliminar