pandas | |
---|---|
Tipo de | Biblioteca Python [d] y programa para análisis numérico [d] |
Autor | Wes McKinney [d] [1] |
Desarrollador | Wes McKinney [d] |
Escrito en | Pitón [2] |
Sistema operativo | multiplataforma |
Primera edición | 11 de enero de 2008 |
ultima versión |
|
Licencia | BSD |
Sitio web | pandas.pydata.org _ |
Archivos multimedia en Wikimedia Commons |
pandas es una biblioteca de análisis y procesamiento de datos de Python . La manipulación de datos de Pandas se basa en la biblioteca NumPy , que es una herramienta de nivel inferior. Proporciona operaciones y estructuras de datos especiales para manipular tablas numéricas y series de tiempo . El nombre de la biblioteca proviene del término econométrico "panel de datos" utilizado para describir conjuntos de información estructurados multidimensionales. pandas se distribuye bajo la nueva licencia BSD .
El área principal de aplicación es proporcionar trabajo dentro del entorno de Python no solo para la recopilación y limpieza de datos, sino también para tareas de análisis y modelado de datos, sin cambiar a lenguajes más específicos para el procesamiento estadístico (como R y octava ).
También se está trabajando para implementar tipos de datos categóricos "nativos".
El paquete está destinado principalmente a la limpieza y evaluación primaria de datos sobre indicadores generales, como la media, los cuantiles , etc.; no es un paquete estadístico en el sentido completo, sin embargo, los conjuntos de datos DataFrame y Series se utilizan como entrada en la mayoría de los módulos de aprendizaje automático y análisis de datos ( SciPy , Scikit-Learn y otros).
Las principales características de la biblioteca:
La biblioteca está optimizada para un alto rendimiento, las partes más importantes del código están escritas en Cython y C.
El desarrollo del paquete comenzó en 2008 por AQR Capital Management [ ] Wes McKinney . Antes de dejar AQR, logró convencer a la gerencia para que permitiera que el código fuente de la biblioteca se publicara bajo una licencia gratuita.
Otro empleado de AQR, Chang She, se unió al proyecto en 2012 y se convirtió en el segundo desarrollador principal de la biblioteca. Casi al mismo tiempo, la biblioteca ganó popularidad entre los desarrolladores de Python y muchos colaboradores nuevos se unieron al proyecto. [5]
Curvas
importar pandas como pd importar matplotlib.pyplot como plt importar numpy como np df = pd . DataFrame ( np . aleatorio . randn ( 100 , 5 ), columnas = lista ( 'ABCDE' )) df = df . cumsum () # Devuelve la suma acumulada sobre un DataFrame o Series axis df . trama () plt . mostrar ()Diagrama
df = pd . DataFrame ( np . aleatorio . rand ( 10 , 5 ), columnas = lista ( 'ABCDE' )) df . trama _ bar ( apilado = Verdadero ) plt . mostrar ()Calendario
df = pd . DataFrame ( np . aleatorio . rand ( 7 , 5 ), columnas = lista ( 'ABCDE' )) df . trama _ caja () plt . mostrar ()gráfico de barras
datos = pd . Serie ( np . aleatoria . normal ( tamaño = 100 )) datos . hist ( cuadrícula = Falso ) plt . mostrar ()Pitón | |
---|---|
Comunidad | |
Implementaciones | |
Otro |
|