Un equipo del Centro Nacional de Investigaciones Oncológicas (CNIO) ha actualizado la cifra de genes que generan proteínas incluidos en el genoma humano y han reducido el listado a unos 19.000, 1.700 menos que los estimados en las últimas anotaciones y un número muy inferior a los 100.000 que se llegaron a barajar hace años.
El trabajo ha sido dirigido por el investigador Alfonso Valencia, vicedirector de Investigación Básica y jefe del Grupo de Biología Computacional Estructural del centro, y concluye que la práctica totalidad de estos genes tienen un origen anterior a la aparición de los primates hace más de 50 millones de años.
Para el estudio han utilizado análisis bioinformáticos, genéticos y proteómicos de última generación, y han contado con la colaboración del Centro Nacional de Investigaciones Cardiovasculares (CNIC), además del Welcome Trust Sanger Institute en Cambridge (Reino Unido) y de la Universidad de California Santa Cruz (Estados Unidos).
Los científicos partieron de análisis proteómicos a gran escala para determinar el mapa de proteínas humanas «a partir del cual identificar aquellos genes que las producen y de esta manera verificar que existen», explica Valencia.
Integraron los datos procedentes de siete trabajos anteriores de espectrometría de masas, la herramienta más potente para detectar moléculas, en este caso proteínas procedentes de más de 50 tejidos humanos.
Los resultados sacaron a la luz poco más de 12.000 proteínas, que casaron con las correspondientes regiones del genoma. Posteriormente analizaron miles de genes que aparecían en otras bases de datos pero no en el estudio y concluyeron que 1.700 de los genes que se consideraban como tal «no lo son por distintas razones», bien porque no generan directamente proteínas o porque la lectura de sus letras –reading frame– no es compatible con la generación de las mismas, ha añadido Michael Tress, que también ha participado en el estudio.
Una hipótesis derivada del trabajo es que más del 90 por ciento de los genes humanos que producen proteínas tienen su origen en metazoos u organismos pluricelulares del reino animal hace cientos de millones de años. La cifra es superior al 99 por ciento para aquellos genes cuyo origen es anterior a la aparición de los primates hace más de 50 millones de años.