Rosetta@casa | |
---|---|
| |
Tipo de | Predicción de Estructura de Proteínas , Computación Voluntaria e Infraestructura Abierta de Berkeley para proyectos de Computación en Red [d] |
Desarrollador | Laboratorio Baker , Universidad de Washington , Rosetta Commons |
Sistema operativo | Software multiplataforma |
Primera edición | 6 de octubre de 2005 |
plataforma de hardware | BOINC |
ultima versión | Rosetta Mini: 3.71 [1] ( 20 de enero de 2016 ) |
Estado | Activo |
Licencia | Gratis para uso académico y sin fines de lucro, licencia propietaria disponible para uso comercial [2] |
Sitio web | boinc.bakerlab.org/roset… |
Archivos multimedia en Wikimedia Commons |
Rosetta@casa | |
---|---|
Plataforma | BOINC |
Tamaño de descarga de software | 48 MB |
Tamaño cargado de datos de trabajo | 2,5 MB |
Cantidad de datos de trabajo enviados | 6-150 KB |
Espacio en disco | 130 MB |
Cantidad de memoria utilizada | 255 MB |
interfaz gráfica de usuario | hay |
Tiempo promedio de cálculo de tareas | 0,5 - 10 horas (control de tiempo posible) |
plazo | 10 días |
Posibilidad de usar GPU | No |
Archivos multimedia en Wikimedia Commons |
Rosetta@Home es un proyecto informático voluntario que tiene como objetivo resolver uno de los mayores problemas de la biología molecular: calcular la estructura terciaria de las proteínas a partir de sus secuencias de aminoácidos . Gracias al Proyecto Genoma Humano finalizado, se conocen las secuencias de aminoácidos de todas las proteínas del cuerpo humano. La investigación bajo este proyecto también ayudará en el diseño de nuevas proteínas inexistentes. Si bien gran parte del proyecto se centra en la investigación básica para mejorar la precisión y solidez de los métodos proteómicos, Rosetta@home también promueve la investigación aplicada para combatir enfermedades como el cáncer , la malaria , el Alzheimer , el ántrax y otras enfermedades genéticas y virales [3] . Foldit es un videojuego de Rosetta@Home que tiene como objetivo lograr los objetivos del proyecto con un enfoque colaborativo .
Los resultados de los cálculos de Rosetta@Home no están disponibles directamente. Además, no puede utilizar los resultados de los cálculos de su propia computadora. [4] Sin embargo, se utilizan para un gran número de publicaciones científicas. [5]
En esencia, Rosetta es un programa informático cuyas funciones principales son:
Este proyecto utiliza predicción y retroalimentación de resultados para mejorar posibles características y algoritmos de búsqueda .
la aplicación Rosetta@home y la plataforma informática distribuida BOINC , disponibles para los sistemas operativos Windows, Linux y macOS; BOINC también se ejecuta en varios otros, como FreeBSD. La participación en Rosetta@home requiere una unidad central de procesamiento (CPU) con una velocidad de reloj de al menos 500 MHz, 200 megabytes de espacio libre en disco, 512 megabytes de memoria física y una conexión a Internet. A partir del 27 de junio de 2020, la versión actual de la aplicación Rosetta Mini es 4.20. La versión actual recomendada del software BOINC es 7.16.7. El protocolo estándar de transferencia de hipertexto (HTTP) (puerto 80) se utiliza para las comunicaciones entre el cliente BOINC del usuario y los servidores Rosetta@home de la Universidad de Washington ; HTTPS (puerto 443) se utiliza durante el intercambio de contraseñas. La gestión remota y local del cliente BOINC utiliza el puerto 31416 y el puerto 1043, que pueden desbloquearse específicamente si están detrás de un firewall. Las unidades de trabajo que contienen datos sobre proteínas individuales se distribuyen desde servidores ubicados en Baker Lab en la Universidad de Washington a computadoras voluntarias, que luego calculan una predicción de estructura para la proteína asignada. Para evitar predicciones de estructuras repetitivas para una proteína determinada, cada bloque de trabajo se inicializa con un número aleatorio de semillas. Esto le da a cada predicción una trayectoria única para descender a través del paisaje energético de la proteína. Las predicciones de la estructura de proteínas de Rosetta@home son valores aproximados para el mínimo global en el panorama energético de una proteína determinada. Este mínimo global representa la conformación proteica energéticamente más favorable, es decir, su estado nativo.
La característica principal de la interfaz gráfica de usuario (GUI) de Rosetta@home es un protector de pantalla que muestra el estado actual del módulo en ejecución durante la simulación del plegamiento de proteínas. La esquina superior izquierda de la pantalla de inicio actual muestra la proteína objetivo asumiendo varias formas (conformaciones) en su búsqueda de la estructura de energía más baja. Inmediatamente a la derecha está la estructura del último recibido. La esquina superior derecha muestra la conformación de energía más baja del diseño actual; a continuación se muestra la estructura verdadera o nativa de la proteína si ya se ha determinado. Se incluyen tres gráficos en la pantalla de inicio. Cerca del medio, se muestra un gráfico para la energía libre termodinámica del modelo aceptado, que fluctúa a medida que cambia el modelo aceptado. A la derecha se muestra el gráfico de desviación estándar del modelo aceptado (RMSD), que mide la similitud estructural entre el modelo aceptado y el modelo nativo. A la derecha de la gráfica de energía recibida y debajo de la gráfica RMSD, los resultados de estas dos funciones se utilizan para graficar la energía frente a RMSD a medida que el modelo se refina gradualmente.
Al igual que todos los proyectos BOINC, Rosetta@home se ejecuta en segundo plano en la computadora del usuario, utilizando energía de la computadora inactiva, durante o antes de iniciar sesión en una cuenta en el sistema operativo del host . El programa libera recursos de la CPU a medida que otras aplicaciones los necesitan, lo que no afecta el uso normal de la computadora. Se pueden configurar muchas opciones del programa a través de la configuración de la cuenta de usuario, que incluyen: el porcentaje máximo de recursos de la CPU que el programa puede usar (para controlar el consumo de energía o generar calor desde una computadora que se ejecuta a energía constante), la hora del día en que se puede ejecutar el programa y más otro.
Rosetta, el software que se ejecuta en la red Rosetta@home, ha sido reescrito en C++ para que sea más fácil de desarrollar de lo que permitía su versión original escrita en Fortran. Esta nueva versión está orientada a objetos y se lanzó el 8 de febrero de 2008. El desarrollo del código de Rosetta está a cargo de Rosetta Commons. El software tiene licencia gratuita para la comunidad académica y está disponible para las compañías farmacéuticas mediante el pago de una tarifa.
Con la proliferación de proyectos de secuenciación del genoma , los científicos pueden deducir la secuencia de aminoácidos o la estructura primaria de muchas proteínas que realizan funciones en una célula. Para comprender mejor la función de la proteína y ayudar en el diseño racional de fármacos, los científicos necesitan conocer la estructura terciaria tridimensional de la proteína.
Actualmente, las estructuras tridimensionales de proteínas se determinan experimentalmente mediante cristalografía de rayos X o espectroscopia de resonancia magnética nuclear (RMN). El proceso es lento (puede llevar semanas o incluso meses descubrir cómo cristalizar una proteína por primera vez) y costoso (alrededor de $100 000 por proteína). Desafortunadamente, la velocidad a la que se descubren nuevas secuencias supera con creces la determinación de la estructura: de las más de 7 400 000 secuencias de proteínas disponibles en la base de datos de proteínas no reducidas (nr) del Centro Nacional de Información Biotecnológica (NCBI), hay menos de 52 000 tridimensionales. Las estructuras de las proteínas se han resuelto y colocado en el Banco de datos de proteínas, el depósito principal de información estructural sobre las proteínas [6] . Uno de los objetivos principales de Rosetta@home es predecir estructuras de proteínas con la misma precisión que los métodos existentes, pero de una manera que requiere mucho menos tiempo y dinero. Rosetta@home también está desarrollando métodos para determinar la estructura y el acoplamiento de proteínas de membrana (p. ej., receptores acoplados a proteínas G (GPCR)), que son extremadamente difíciles de analizar con métodos tradicionales como la cristalografía de rayos X y la espectroscopia de RMN, pero que representan la mayoría de los objetivos de los fármacos modernos.
El progreso en la predicción de la estructura de la proteína se mide en el experimento bianual Evaluación crítica para la predicción de la estructura de la proteína (CASP), en el que investigadores de todo el mundo intentan derivar la estructura de la proteína a partir de la secuencia de aminoácidos de una proteína. Los grupos de alto rendimiento en este experimento a veces competitivo se consideran el estándar de facto para lo que es el estado del arte en la predicción de estructuras de proteínas. Rosetta, el programa en el que se basa Rosetta @ home, se utilizó con CASP5 en 2002. En el experimento CASP6 de 2004, Rosetta hizo historia al ser la primera en lograr una predicción de estructura de proteína ab initio de resolución casi atómica en su modelo presentado para el objetivo T0281 de CASP. El modelado ab initio se considera una categoría particularmente desafiante de predicción de la estructura de la proteína porque no utiliza información de homología estructural y debe basarse en información de homología de secuencia y modelado de interacciones físicas dentro de la proteína. Rosetta@home se ha utilizado en CASP desde 2006, donde fue uno de los principales predictores en todas las categorías de predicción estructural en CASP7. Estas predicciones de alta calidad fueron impulsadas por la potencia informática proporcionada por los voluntarios de Rosetta@home. El aumento de la potencia informática permite a Rosetta@home seleccionar más regiones del espacio conformacional (posibles formas que puede adoptar una proteína) que, según la paradoja de Levinthal , se predice que crecerán exponencialmente con la longitud de la proteína.
Rosetta@home también se utiliza en la predicción del acoplamiento proteína-proteína, que determina la estructura de múltiples proteínas complejas o estructura cuaternaria. Este tipo de interacción proteica afecta muchas funciones celulares, incluida la unión antígeno-anticuerpo y la unión enzima-inhibidor, así como la importación y exportación de células. La determinación de estas interacciones es fundamental para el desarrollo de fármacos. Rosetta se utiliza en el experimento de evaluación de predicción de interacción crítica (CAPRI), que evalúa el estado del campo de acoplamiento de una proteína, de manera similar a cómo CASP mide el progreso en la predicción de la estructura de la proteína. La potencia informática proporcionada por los voluntarios del proyecto Rosetta@home se citó como uno de los principales impulsores del desempeño de Rosetta en CAPRI, donde sus predicciones de acoplamiento estuvieron entre las más precisas y completas.
A principios de 2008, se utilizó Rosetta para diseñar computacionalmente una proteína con una función nunca antes vista en la naturaleza. Esto se inspiró en parte en un resumen de un famoso artículo de 2004 que originalmente describía el diseño computacional de una proteína con actividad enzimática mejorada sobre su forma natural. Un artículo de investigación de 2008 del grupo de David Baker que describe cómo se hizo la proteína, en el que Rosetta@home se refiere a los recursos computacionales que puso a disposición, es una importante prueba de concepto para este método de ingeniería de proteínas. Este tipo de diseño de proteínas puede tener aplicaciones futuras para el descubrimiento de fármacos, la química verde y la biorremediación.
Se ha utilizado un componente del paquete de software de Rosetta, RosettaDesign, para predecir con precisión qué regiones de las proteínas amiloidogénicas tienen más probabilidades de formar fibrillas de tipo amiloide. Al tomar hexapéptidos (fragmentos largos de seis aminoácidos) de una proteína de interés y seleccionar la coincidencia de energía más baja para una estructura similar a la de un hexapéptido formador de fibrillas conocido, RosettaDesign pudo identificar péptidos con el doble de probabilidades de formar fibrillas que proteínas aleatorias. . Rosetta@home se utilizó en el mismo estudio para predecir las estructuras de beta-amiloide, una proteína formadora de fibrillas que se piensa que causa la enfermedad de Alzheimer. Se han obtenido resultados preliminares pero aún no publicados de proteínas desarrolladas por Rosetta que pueden prevenir la formación de fibrillas, aunque no se sabe si esto puede prevenir la enfermedad.
Otro componente de Rosetta, RosettaDock, se ha utilizado junto con métodos experimentales para modelar interacciones entre tres proteínas: factor letal (LF), factor de edema (EF) y antígeno protector (PA), que componen la toxina del ántrax. El modelo informático predijo con precisión el acoplamiento entre LF y PA, lo que ayudó a establecer qué dominios de las respectivas proteínas están involucrados en el complejo LF-PA. Esta comprensión finalmente se utilizó en la investigación, lo que resultó en mejores vacunas contra el ántrax.
Virus del herpes simple tipo 1
RosettaDock se utilizó para modelar el acoplamiento entre un anticuerpo (inmunoglobulina G) y una proteína de superficie expresada por el virus del herpes, el virus del herpes simple 1 (HSV-1), que sirve para degradar el anticuerpo antiviral. El complejo de proteínas predicho por RosettaDock coincidió estrechamente con modelos experimentales particularmente difíciles de obtener, lo que llevó a los investigadores a concluir que el método de acoplamiento podría resolver algunos de los problemas que tiene la cristalografía de rayos X en el modelado de interfaces de proteína a proteína.
A través de una investigación financiada por una subvención de $19,4 millones de Bill y Melinda Gates. UU., Rosetta@home se ha utilizado en el desarrollo de muchas posibles vacunas contra el virus de la inmunodeficiencia humana (VIH).
En una investigación asociada con la iniciativa Great Challenges in Global Health, Rosetta se ha utilizado para desarrollar computacionalmente nuevas proteínas de endonucleasas autodirigidas que podrían matar a Anopheles gambiae o hacer que el mosquito no pueda transmitir la malaria. La capacidad de modelar y alterar específicamente las interacciones proteína-ADN, como las de las endonucleasas autodirigidas, otorga a los métodos de ingeniería computacional de proteínas como Rosetta un papel importante en la terapia génica (que incluye posibles tratamientos contra el cáncer).
Según las estadísticas oficiales de los participantes del proyecto Rosetta@Home [7] , a octubre de 2011, el número de participantes activos era de 38 mil personas [8] . En julio de 2017, el proyecto tenía aproximadamente 300 000 usuarios activos [9] .
Voluntarios de Informática | Proyectos|
---|---|
Astronomía |
|
biología y medicina |
|
cognitivo |
|
Climatizado |
|
Matemáticas |
|
Físico y técnico |
|
De múltiples fines |
|
Otro |
|
Utilidades |
|