Protein Data Bank, PDB - un banco de datos de estructuras tridimensionales de proteínas y ácidos nucleicos . La información obtenida por cristalografía de rayos X o espectroscopia de RMN , y cada vez más por microscopía crioelectrónica , se ingresa en una base de datos por biólogos y bioquímicos de todo el mundo, y está disponible de forma gratuita a través de los sitios web de las organizaciones miembros (PDBe [1] , PDBj [2] , RCSB [3] ).
El PDB es uno de los recursos más importantes para los científicos que trabajan en el campo de la biología estructural . La mayoría de las revistas científicas y algunas fundaciones de financiación de la investigación, como los NIH en los EE. UU., requieren que los autores y los beneficiarios de las subvenciones envíen todos los datos estructurales al PDB. El banco de datos de proteínas contiene principalmente datos primarios sobre la estructura de las moléculas biológicas, mientras que hay cientos de otros bancos de datos que clasifican los datos primarios o identifican patrones entre la estructura molecular y la relación evolutiva. [cuatro]
El banco de datos de proteínas fue creado por científicos ordinarios. [4] En 1971, Walter Hamilton en el Laboratorio Nacional de Brookhaven creó un banco de datos de Brookhaven. Después de la muerte de Hamilton en 1973, PDB fue dirigido por Tom Ketztle ( nacido como Tom Koeztle ). En enero de 1994, Joel Sussman se convirtió en director del Protein Data Bank .
En octubre de 1998 [5], el banco de datos de proteínas se transfirió al Research Collaboratory for Structural Bioinformatics (RCSB) ; la transferencia de información se completó en junio de 1999 . La nueva directora es Helen M. Berman de la Universidad de Rutgers . [6] En 2003 , después de la formación de wwPDB ( English Worldwide Protein Data Bank ), Protein Data Bank se convirtió en una organización internacional. Además de RCSB, los miembros fundadores de wwPDB son Protein Data Bank en Europa (PDBe) , Protein Data Bank en Japón (PDBj) y Bilogical Margnetic Resonance Bank (BMRB) .
El banco de datos de proteínas se actualiza semanalmente (a las 0:00 UTC los miércoles). A partir del 14 de marzo de 2017, la base de datos contiene [7] :
método de investigación |
Ardillas | Ácidos nucleicos | Complejos de proteínas y ácidos nucleicos |
Otro | Total |
---|---|---|---|---|---|
difracción de rayos X | 106595 | 1820 | 5471 | cuatro | 113890 |
RMN | 10296 | 1190 | 241 | ocho | 11735 |
microscopio de electrones | 1021 | treinta | 367 | 0 | 1418 |
Mezclado | 99 | 3 | 2 | una | 105 |
Otro | 181 | cuatro | 6 | 13 | 204 |
Total: | 118192 | 3047 | 6087 | 26 | 127352 |
La parte predominante de las estructuras se obtuvo utilizando el método de difracción de rayos X, alrededor del 15%, utilizando RMN de proteínas, y solo una pequeña parte, utilizando microscopía crioelectrónica.
Durante un tiempo, la cantidad de estructuras en el PDB creció exponencialmente, pero desde 2007, el crecimiento ha disminuido un poco.
Cada estructura publicada en el PDB recibe un identificador de cuatro dígitos (una combinación de números y letras del alfabeto latino). Este código no puede servir como identificador de biomoléculas, ya que a menudo diferentes estructuras de la misma molécula, por ejemplo, en un entorno diferente, pueden tener diferentes ID de PDB.
Las estructuras se pueden ver utilizando varios programas informáticos (tanto gratuitos como de código abierto con licencia y de pago no abiertos) y complementos de navegador web . [ocho]