- ¿Qué es Python Seaborn??
- Tipos de parcelas que podemos construir con Seaborn
- Trabajar con múltiples parcelas
- Algunas alternativas para Python Seaborn
Esto parece mucho que cubrir. Comencemos ahora.
¿Qué es la biblioteca Python Seaborn??
La biblioteca Seaborn es un paquete de Python que nos permite hacer infografías basadas en datos estadísticos. Como está hecho sobre matplotlib, es inherentemente compatible con él. Además, es compatible con la estructura de datos de NumPy y Pandas para que el trazado se pueda realizar directamente desde esas colecciones.
La visualización de datos complejos es una de las cosas más importantes de las que se ocupa Seaborn. Si tuviéramos que comparar Matplotlib con Seaborn, Seaborn puede facilitar las cosas que son difíciles de lograr con Matplotlib. Sin embargo, es importante tener en cuenta que Seaborn no es una alternativa a Matplotlib sino un complemento de este. A lo largo de esta lección, también haremos uso de las funciones de Matplotlib en los fragmentos de código. Seleccionará trabajar con Seaborn en los siguientes casos de uso:
- Tiene datos estadísticos de series de tiempo para trazarlos con representación de la incertidumbre alrededor de las estimaciones
- Para establecer visualmente la diferencia entre dos subconjuntos de datos
- Visualizar las distribuciones univariadas y bivariadas
- Añadiendo mucho más afecto visual a las tramas de matplotlib con muchos temas incorporados
- Ajustar y visualizar modelos de aprendizaje automático mediante regresión lineal con variables independientes y dependientes
Solo una nota antes de comenzar es que usamos un entorno virtual para esta lección que hicimos con el siguiente comando:
pitón -m virtualenv seabornfuente seaborn / bin / activar
Una vez que el entorno virtual está activo, podemos instalar la biblioteca Seaborn dentro del entorno virtual para que se puedan ejecutar los ejemplos que creamos a continuación:
pip instalar seabornTambién puede usar Anaconda para ejecutar estos ejemplos, lo cual es más fácil. Si desea instalarlo en su máquina, consulte la lección que describe “Cómo instalar Anaconda Python en Ubuntu 18.04 LTS ”y comparta sus comentarios. Ahora, avancemos a varios tipos de parcelas que se pueden construir con Python Seaborn.
Usando el conjunto de datos de Pokémon
Para mantener esta lección práctica, usaremos un conjunto de datos de Pokémon que se puede descargar de Kaggle. Para importar este conjunto de datos a nuestro programa, usaremos la biblioteca Pandas. Aquí están todas las importaciones que realizamos en nuestro programa:
importar pandas como pdde matplotlib importar pyplot como plt
importar seaborn como sns
Ahora, podemos importar el conjunto de datos a nuestro programa y mostrar algunos de los datos de muestra con Pandas como:
df = pd.read_csv ('Pokémon.csv ', index_col = 0)df.cabeza()
Tenga en cuenta que para ejecutar el fragmento de código anterior, el conjunto de datos CSV debe estar presente en el mismo directorio que el programa. Una vez que ejecutemos el fragmento de código anterior, veremos el siguiente resultado (en el cuaderno de Anaconda Jupyter):
Trazado de la curva de regresión lineal
Una de las mejores cosas de Seaborn son las funciones de trazado inteligente que proporciona, que no solo visualizan el conjunto de datos que le proporcionamos, sino que también construyen modelos de regresión a su alrededor. Por ejemplo, es posible construir una gráfica de regresión lineal con una sola línea de código. He aquí cómo hacer esto:
sns.lmplot (x = 'Ataque', y = 'Defensa', datos = df)Una vez que ejecutemos el fragmento de código anterior, veremos el siguiente resultado:
Notamos algunas cosas importantes en el fragmento de código anterior:
- Hay una función de trazado dedicada disponible en Seaborn
- Usamos la función de ajuste y trazado de Seaborn, que nos proporcionó una línea de regresión lineal que se modeló a sí misma
No tengas miedo si pensabas que no podemos tener una trama sin esa línea de regresión. Podemos ! Probemos ahora un nuevo fragmento de código, similar al anterior:
sns.lmplot (x = 'Ataque', y = 'Defensa', datos = df, fit_reg = Falso)Esta vez, no veremos la línea de regresión en nuestro gráfico:
Ahora esto es mucho más claro (si no necesitamos la línea de regresión lineal). Pero esto no acaba de terminar todavía. Seaborn nos permite hacer diferente esta trama y eso es lo que estaremos haciendo.
Construcción de diagramas de caja
Una de las mejores características de Seaborn es cómo acepta fácilmente la estructura de Pandas Dataframes para trazar datos. Simplemente podemos pasar un marco de datos a la biblioteca de Seaborn para que pueda construir un diagrama de caja a partir de él:
sns.diagrama de caja (datos = df)Una vez que ejecutemos el fragmento de código anterior, veremos el siguiente resultado:
Podemos eliminar la primera lectura del total, ya que parece un poco incómodo cuando en realidad estamos trazando columnas individuales aquí:
# Nuevo diagrama de caja usando stats_df
sns.diagrama de caja (data = stats_df)
Una vez que ejecutemos el fragmento de código anterior, veremos el siguiente resultado:
Conspiración de enjambre con Seaborn
Podemos construir una trama de Swarm de diseño intuitivo con Seaborn. Usaremos nuevamente el marco de datos de Pandas que cargamos anteriormente, pero esta vez, llamaremos a la función show de Matplotlib para mostrar el gráfico que hicimos. Aquí está el fragmento de código:
sns.set_context ("papel")sns.swarmplot (x = "Ataque", y = "Defensa", datos = df)
plt.show()
Una vez que ejecutemos el fragmento de código anterior, veremos el siguiente resultado:
Al usar un contexto de Seaborn, permitimos que Seaborn agregue un toque personal y un diseño fluido a la trama. Es posible personalizar este gráfico aún más con el tamaño de fuente personalizado utilizado para las etiquetas en el gráfico para facilitar la lectura. Para hacer esto, pasaremos más parámetros a la función set_context que funciona exactamente como suenan. Por ejemplo, para modificar el tamaño de fuente de las etiquetas, haremos uso de font.parámetro de tamaño. Aquí está el fragmento de código para realizar la modificación:
sns.swarmplot (x = "Ataque", y = "Defensa", datos = df)
plt.show()
Una vez que ejecutemos el fragmento de código anterior, veremos el siguiente resultado:
El tamaño de fuente de la etiqueta se modificó según los parámetros que proporcionamos y el valor asociado a la fuente.parámetro de tamaño. Una cosa en la que Seaborn es experto es en hacer que la trama sea muy intuitiva para el uso práctico y esto significa que Seaborn no es solo un paquete de práctica de Python, sino que en realidad es algo que podemos usar en nuestras implementaciones de producción.
Agregar un título a las parcelas
Es fácil agregar títulos a nuestras parcelas. Solo necesitamos seguir un procedimiento simple de usar las funciones de nivel de ejes donde llamaremos set_title () funciona como se muestra en el fragmento de código aquí:
sns.set_context ("papel", font_scale = 3, rc = "fuente.tamaño ": 8", ejes.tamaño de etiqueta ": 5)my_plot = sns.swarmplot (x = "Ataque", y = "Defensa", datos = df)
my_plot.set_title ("Trama de enjambre LH")
plt.show()
Una vez que ejecutemos el fragmento de código anterior, veremos el siguiente resultado:
De esta manera, podemos agregar mucha más información a nuestras parcelas.
Seaborn contra Matplotlib
Al observar los ejemplos de esta lección, podemos identificar que Matplotlib y Seaborn no se pueden comparar directamente, pero se puede considerar que se complementan entre sí. Una de las características que lleva a Seaborn un paso adelante es la forma en que Seaborn puede visualizar datos estadísticamente.
Para aprovechar al máximo los parámetros de Seaborn, le recomendamos encarecidamente que consulte la documentación de Seaborn y descubra qué parámetros utilizar para que su parcela se acerque lo más posible a las necesidades comerciales.
Conclusión
En esta lección, analizamos varios aspectos de esta biblioteca de visualización de datos que podemos usar con Python para generar gráficos hermosos e intuitivos que pueden visualizar datos en la forma que las empresas desean de una plataforma. Seaborm es una de las bibliotecas de visualización más importantes cuando se trata de ingeniería de datos y presentación de datos en la mayoría de las formas visuales, definitivamente una habilidad que debemos tener en nuestro haber, ya que nos permite construir modelos de regresión lineal.
Comparta sus comentarios sobre la lección en Twitter con @sbmaggarwal y @LinuxHint.