pandas

Cómo trazar datos en Pandas Python

Cómo trazar datos en Pandas Python
La visualización de datos juega un papel importante en el análisis de datos. Pandas es una sólida biblioteca de análisis de datos en python para ciencia de datos. Proporciona varias opciones para la visualización de datos con .método plot (). Incluso si es un principiante, puede trazar fácilmente sus datos utilizando la biblioteca de Pandas. Necesitas importar los pandas y matplotlib.paquete pyplot para visualización de datos.

En este artículo, exploraremos varios métodos de trazado de datos utilizando la Python de Pandas. Hemos ejecutado todos los ejemplos en el editor de código fuente de pycharm usando matplotlib.paquete pyplot.

Trazando en Pandas Python

En Pandas, el .plot () tiene varios parámetros que puede usar según sus necesidades. Principalmente, usando el parámetro 'tipo', puede definir qué tipo de parcela creará.

La sintaxis para trazar datos usando Pandas Python

La siguiente sintaxis se usa para trazar un DataFrame en Pandas Python:

# importar pandas y matplotlib.Paquetes de pyplot
importar pandas como pd
importar matplotlib.pyplot como plt
# Preparar datos para crear DataFrame
data_frame =
'Columna1': ['campo1', 'campo2', 'campo3', 'campo4',…],
'Columna2': ['campo1', 'campo2', 'campo3', 'campo4',…]

var_df = pd.DataFrame (data_frame, columnas = ['Columna1', 'Columna2])
imprimir (variable)
# trazar gráfico de barras
var_df.gráfico.bar (x = 'Columna1', y = 'Columna2')
plt.show()

También puede definir el tipo de gráfico utilizando el parámetro kind de la siguiente manera:

var_df.plot (x = 'Columna1', y = 'Columna2', tipo = 'barra')

Los objetos Pandas DataFrames tienen los siguientes métodos de trazado para trazar:

Si un usuario solo usa el método plot () sin usar ningún parámetro, entonces crea el gráfico de líneas predeterminado.

Ahora elaboraremos en detalle algunos tipos principales de trazado con la ayuda de algunos ejemplos.

Trazado de dispersión en pandas

En este tipo de graficación, hemos representado la relación entre dos variables. Tomemos un ejemplo.

Ejemplo

Por ejemplo, tenemos datos de correlación entre dos variables GDP_crowth y Oil_price. Para trazar la relación entre dos variables, hemos ejecutado el siguiente fragmento de código en nuestro editor de código fuente:

importar matplotlib.pyplot como plt
importar pandas como pd
gdp_cal = pd.Marco de datos(
'PIB_crecimiento': [6.15.8, 5.7, 5.7, 5.8, 5.sesenta y cinco.5, 5.3, 5.2, 5.2],
'Oil_Price': [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame (gdp_cal, columnas = ['Oil_Price', 'GDP_growth'])
imprimir (df)
df.plot (x = 'Oil_Price', y = 'GDP_growth', kind = 'scatter', color = 'red')
plt.show()

Trazado de gráficos de líneas en pandas  

El diagrama de gráfico de líneas es un tipo básico de trazado en el que la información dada se muestra en una serie de puntos de datos que están conectados por segmentos de líneas rectas. Con los gráficos de líneas, también puede mostrar las tendencias de la información a lo largo del tiempo.

Ejemplo

En el ejemplo que se menciona a continuación, hemos tomado los datos sobre la tasa de inflación del año pasado. Primero, prepare los datos y luego cree DataFrame. El siguiente código fuente traza el gráfico de líneas de los datos disponibles:

importar pandas como pd
importar matplotlib.pyplot como plt
infl_cal = 'Año': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Infl_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

marco_datos = pd.DataFrame (infl_cal, columnas = ['Año', 'Infl_Rate'])
marco de datos.plot (x = 'Año', y = 'Infl_Rate', kind = 'line')
plt.show()

En el ejemplo anterior, debe establecer el tipo = 'línea' para el trazado del gráfico de líneas.

Método 2 # Usando la trama.método line ()

El ejemplo anterior, también puede implementar utilizando el siguiente método:

importar pandas como pd
importar matplotlib.pyplot como plt
inf_cal = 'Año': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Inflation_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

marco_datos = pd.Marco de datos (inf_cal, columnas = ['Inflation_Rate'], índice = [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
marco de datos.gráfico.línea()
plt.title ('Resumen de la tasa de inflación de los últimos 11 años')
plt.ylabel ('Inflation_Rate')
plt.xlabel ('Año')
plt.show()

El siguiente gráfico de líneas se mostrará después de ejecutar el código anterior:

Trazado de gráfico de barras en pandas

El trazado del gráfico de barras se utiliza para representar los datos categóricos. En este tipo de parcela, las barras rectangulares con diferentes alturas se trazan en base a la información dada. El gráfico de barras se puede trazar en dos direcciones horizontales o verticales diferentes.

Ejemplo

Hemos tomado la tasa de alfabetización de varios países en el siguiente ejemplo. Los DataFrames se crean en los que 'Country_Names' y 'literacy_Rate' son las dos columnas de un DataFrame. Con Pandas, puede trazar la información en la forma del gráfico de barras de la siguiente manera:

importar pandas como pd
importar matplotlib.pyplot como plt
lit_cal =
'Country_Names': ['Pakistán', 'EE. UU.', 'China', 'India', 'Reino Unido', 'Austria', 'Egipto', 'Ucrania', 'Saudia', 'Australia',
'Malasia'],
'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

marco_datos = pd.DataFrame (lit_cal, columnas = ['Country_Names', 'litr_Rate'])
imprimir (marco_de_datos)
marco de datos.gráfico.bar (x = 'Country_Names', y = 'litr_Rate')
plt.show()

También puede implementar el ejemplo anterior usando el siguiente método. Establezca kind = "bar" para el trazado del gráfico de barras en esta línea:

marco de datos.plot (x = 'Country_Names', y = 'litr_Rate', kind = 'bar')
plt.show()

Trazado de gráfico de barras horizontales

También puede trazar los datos en barras horizontales ejecutando el siguiente código:

importar matplotlib.pyplot como plt
importar pandas como pd
data_chart = 'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame (data_chart, columnas = ['litr_Rate'], index = ['Pakistán', 'EE. UU.', 'China', 'India', 'Reino Unido', 'Austria', 'Egipto', 'Ucrania', 'Saudia' , 'Australia',
'Malasia'])
df.gráfico.barh ()
plt.title ('Tasa de alfabetización en varios países')
plt.ylabel ('Country_Names')
plt.xlabel ('litr_Rate')
plt.show()

En df.gráfico.barh (), el barh se usa para el trazado horizontal. Después de ejecutar el código anterior, se muestra el siguiente gráfico de barras en la ventana:

Trazado de gráfico circular en pandas

Un gráfico circular representa los datos en una forma gráfica circular en la que los datos se muestran en porciones según la cantidad dada.

Ejemplo

En el siguiente ejemplo, mostramos la información sobre 'Earth_material' en diferentes sectores del gráfico circular. Primero, cree el DataFrame, luego, usando los pandas, muestre todos los detalles en el gráfico.

importar pandas como pd
importar matplotlib.pyplot como plt
material_per = 'Earth_Part': [71,18,7,4]
marco de datos = pd.DataFrame (material_per, columnas = ['Earth_Part'], índice = ['Agua', 'Mineral', 'Arena', 'Metales'])
marco de datos.gráfico.pie (y = 'Earth_Part', figsize = (7, 7), autopct = '% 1.1f %% ', ángulo inicial = 90)
plt.show()

El código fuente anterior traza el gráfico circular de los datos disponibles:

Conclusión

En este artículo, ha visto cómo trazar DataFrames en Pandas Python. En el artículo anterior se realizan diferentes tipos de trazado. Para trazar más tipos como caja, hexbin, hist, kde, densidad, área, etc., puede usar el mismo código fuente simplemente cambiando el tipo de trama.

Instale el último emulador de Dolphin para Gamecube y Wii en Linux
Dolphin Emulator te permite jugar los juegos de Gamecube y Wii que elijas en computadoras personales con Linux (PC). Al ser un emulador de juegos de ...
Cómo usar GameConqueror Cheat Engine en Linux
El artículo cubre una guía sobre el uso del motor de trucos GameConqueror en Linux. Muchos usuarios que juegan juegos en Windows a menudo usan la apli...
Los mejores emuladores de consola de juegos para Linux
Este artículo enumerará el software de emulación de consola de juegos más popular disponible para Linux. La emulación es una capa de compatibilidad de...