Ciencia de los datos

Tutorial de Python Seaborn

Tutorial de Python Seaborn
En esta lección sobre la biblioteca Python Seaborn, veremos varios aspectos de esta biblioteca de visualización de datos que podemos usar con Python para generar gráficos hermosos e intuitivos que pueden visualizar datos en la forma que las empresas desean de una plataforma. Para completar esta lección, cubriremos las siguientes secciones:

Esto parece mucho que cubrir. Comencemos ahora.

¿Qué es la biblioteca Python Seaborn??

La biblioteca Seaborn es un paquete de Python que nos permite hacer infografías basadas en datos estadísticos. Como está hecho sobre matplotlib, es inherentemente compatible con él. Además, es compatible con la estructura de datos de NumPy y Pandas para que el trazado se pueda realizar directamente desde esas colecciones.

La visualización de datos complejos es una de las cosas más importantes de las que se ocupa Seaborn. Si tuviéramos que comparar Matplotlib con Seaborn, Seaborn puede facilitar las cosas que son difíciles de lograr con Matplotlib. Sin embargo, es importante tener en cuenta que Seaborn no es una alternativa a Matplotlib sino un complemento de este. A lo largo de esta lección, también haremos uso de las funciones de Matplotlib en los fragmentos de código. Seleccionará trabajar con Seaborn en los siguientes casos de uso:

Solo una nota antes de comenzar es que usamos un entorno virtual para esta lección que hicimos con el siguiente comando:

pitón -m virtualenv seaborn
fuente seaborn / bin / activar

Una vez que el entorno virtual está activo, podemos instalar la biblioteca Seaborn dentro del entorno virtual para que se puedan ejecutar los ejemplos que creamos a continuación:

pip instalar seaborn

También puede usar Anaconda para ejecutar estos ejemplos, lo cual es más fácil. Si desea instalarlo en su máquina, consulte la lección que describe “Cómo instalar Anaconda Python en Ubuntu 18.04 LTS ”y comparta sus comentarios. Ahora, avancemos a varios tipos de parcelas que se pueden construir con Python Seaborn.

Usando el conjunto de datos de Pokémon

Para mantener esta lección práctica, usaremos un conjunto de datos de Pokémon que se puede descargar de Kaggle. Para importar este conjunto de datos a nuestro programa, usaremos la biblioteca Pandas. Aquí están todas las importaciones que realizamos en nuestro programa:

importar pandas como pd
de matplotlib importar pyplot como plt
importar seaborn como sns

Ahora, podemos importar el conjunto de datos a nuestro programa y mostrar algunos de los datos de muestra con Pandas como:

df = pd.read_csv ('Pokémon.csv ', index_col = 0)
df.cabeza()

Tenga en cuenta que para ejecutar el fragmento de código anterior, el conjunto de datos CSV debe estar presente en el mismo directorio que el programa. Una vez que ejecutemos el fragmento de código anterior, veremos el siguiente resultado (en el cuaderno de Anaconda Jupyter):

Trazado de la curva de regresión lineal

Una de las mejores cosas de Seaborn son las funciones de trazado inteligente que proporciona, que no solo visualizan el conjunto de datos que le proporcionamos, sino que también construyen modelos de regresión a su alrededor. Por ejemplo, es posible construir una gráfica de regresión lineal con una sola línea de código. He aquí cómo hacer esto:

sns.lmplot (x = 'Ataque', y = 'Defensa', datos = df)

Una vez que ejecutemos el fragmento de código anterior, veremos el siguiente resultado:

Notamos algunas cosas importantes en el fragmento de código anterior:

No tengas miedo si pensabas que no podemos tener una trama sin esa línea de regresión. Podemos ! Probemos ahora un nuevo fragmento de código, similar al anterior:

sns.lmplot (x = 'Ataque', y = 'Defensa', datos = df, fit_reg = Falso)

Esta vez, no veremos la línea de regresión en nuestro gráfico:

Ahora esto es mucho más claro (si no necesitamos la línea de regresión lineal). Pero esto no acaba de terminar todavía. Seaborn nos permite hacer diferente esta trama y eso es lo que estaremos haciendo.

Construcción de diagramas de caja

Una de las mejores características de Seaborn es cómo acepta fácilmente la estructura de Pandas Dataframes para trazar datos. Simplemente podemos pasar un marco de datos a la biblioteca de Seaborn para que pueda construir un diagrama de caja a partir de él:

sns.diagrama de caja (datos = df)

Una vez que ejecutemos el fragmento de código anterior, veremos el siguiente resultado:

Podemos eliminar la primera lectura del total, ya que parece un poco incómodo cuando en realidad estamos trazando columnas individuales aquí:

stats_df = df.gota (['Total'], eje = 1)
# Nuevo diagrama de caja usando stats_df
sns.diagrama de caja (data = stats_df)

Una vez que ejecutemos el fragmento de código anterior, veremos el siguiente resultado:

Conspiración de enjambre con Seaborn

Podemos construir una trama de Swarm de diseño intuitivo con Seaborn. Usaremos nuevamente el marco de datos de Pandas que cargamos anteriormente, pero esta vez, llamaremos a la función show de Matplotlib para mostrar el gráfico que hicimos. Aquí está el fragmento de código:

sns.set_context ("papel")
sns.swarmplot (x = "Ataque", y = "Defensa", datos = df)
plt.show()

Una vez que ejecutemos el fragmento de código anterior, veremos el siguiente resultado:

Al usar un contexto de Seaborn, permitimos que Seaborn agregue un toque personal y un diseño fluido a la trama. Es posible personalizar este gráfico aún más con el tamaño de fuente personalizado utilizado para las etiquetas en el gráfico para facilitar la lectura. Para hacer esto, pasaremos más parámetros a la función set_context que funciona exactamente como suenan. Por ejemplo, para modificar el tamaño de fuente de las etiquetas, haremos uso de font.parámetro de tamaño. Aquí está el fragmento de código para realizar la modificación:

sns.set_context ("papel", font_scale = 3, rc = "fuente.tamaño ": 8", ejes.tamaño de etiqueta ": 5)
sns.swarmplot (x = "Ataque", y = "Defensa", datos = df)
plt.show()

Una vez que ejecutemos el fragmento de código anterior, veremos el siguiente resultado:

El tamaño de fuente de la etiqueta se modificó según los parámetros que proporcionamos y el valor asociado a la fuente.parámetro de tamaño. Una cosa en la que Seaborn es experto es en hacer que la trama sea muy intuitiva para el uso práctico y esto significa que Seaborn no es solo un paquete de práctica de Python, sino que en realidad es algo que podemos usar en nuestras implementaciones de producción.

Agregar un título a las parcelas

Es fácil agregar títulos a nuestras parcelas. Solo necesitamos seguir un procedimiento simple de usar las funciones de nivel de ejes donde llamaremos set_title () funciona como se muestra en el fragmento de código aquí:

sns.set_context ("papel", font_scale = 3, rc = "fuente.tamaño ": 8", ejes.tamaño de etiqueta ": 5)
my_plot = sns.swarmplot (x = "Ataque", y = "Defensa", datos = df)
my_plot.set_title ("Trama de enjambre LH")
plt.show()

Una vez que ejecutemos el fragmento de código anterior, veremos el siguiente resultado:

De esta manera, podemos agregar mucha más información a nuestras parcelas.

Seaborn contra Matplotlib

Al observar los ejemplos de esta lección, podemos identificar que Matplotlib y Seaborn no se pueden comparar directamente, pero se puede considerar que se complementan entre sí. Una de las características que lleva a Seaborn un paso adelante es la forma en que Seaborn puede visualizar datos estadísticamente.

Para aprovechar al máximo los parámetros de Seaborn, le recomendamos encarecidamente que consulte la documentación de Seaborn y descubra qué parámetros utilizar para que su parcela se acerque lo más posible a las necesidades comerciales.

Conclusión

En esta lección, analizamos varios aspectos de esta biblioteca de visualización de datos que podemos usar con Python para generar gráficos hermosos e intuitivos que pueden visualizar datos en la forma que las empresas desean de una plataforma. Seaborm es una de las bibliotecas de visualización más importantes cuando se trata de ingeniería de datos y presentación de datos en la mayoría de las formas visuales, definitivamente una habilidad que debemos tener en nuestro haber, ya que nos permite construir modelos de regresión lineal.

Comparta sus comentarios sobre la lección en Twitter con @sbmaggarwal y @LinuxHint.

Motores de juegos gratuitos y de código abierto para desarrollar juegos de Linux
Este artículo cubrirá una lista de motores de juegos de código abierto y gratuitos que se pueden usar para desarrollar juegos 2D y 3D en Linux. Existe...
Tutorial de Shadow of the Tomb Raider para Linux
Shadow of the Tomb Raider es la duodécima incorporación a la serie Tomb Raider, una franquicia de juegos de acción y aventuras creada por Eidos Montre...
Cómo impulsar FPS en Linux?
FPS significa Cuadros por segundo. La tarea de FPS es medir la velocidad de fotogramas en reproducciones de video o actuaciones de juegos. En palabras...