Ciencia de los datos

Cómo crear Pandas DataFrame en Python?

Cómo crear Pandas DataFrame en Python?

Pandas DataFrame es una estructura de datos anotada 2D (bidimensional) en la que los datos se alinean en forma tabular con diferentes filas y columnas. Para facilitar la comprensión, el DataFrame se comporta como una hoja de cálculo que contiene tres componentes diferentes: índice, columnas y datos. Pandas DataFrames es la forma más común de utilizar los objetos del panda.

Pandas DataFrames se puede crear usando diferentes métodos. Este artículo explicará todos los métodos posibles a través de los cuales puede crear Pandas DataFrame en Python. Hemos ejecutado todos los ejemplos en la herramienta pycharm. Comencemos la implementación de cada método uno por uno.

Sintaxis básica

Siga la siguiente sintaxis al crear DataFrames en Pandas Python:

pd.DataFrame (Df_data)

Ejemplo: Expliquemos con un ejemplo. En este caso, hemos almacenado los datos de los nombres y porcentajes de los estudiantes en una variable 'Students_Data'. Además, usando el pd.DataFrame (), hemos creado un DataFrames para mostrar el resultado del estudiante.

importar pandas como pd
Students_Data =
'Nombre': ['Samreena', 'Asif', 'Mahwish', 'Raees'],
'Porcentaje': [90,80,70,85]
resultado = pd.DataFrame (Students_Data)
imprimir (resultado)

Métodos para crear marcos de datos de Pandas

Pandas DataFrames se puede crear usando las diferentes formas que discutiremos en el resto del artículo. Imprimiremos el resultado de los cursos del estudiante en forma de DataFrames. Entonces, usando uno de los siguientes métodos, puede crear DataFrames similares que se representan en la siguiente imagen:

Método # 01: Creando Pandas DataFrame desde el diccionario de listas

En el siguiente ejemplo, los DataFrames se crean a partir de los diccionarios de listas relacionadas con los resultados del curso de los estudiantes. Primero, importe la biblioteca de un panda y luego cree un diccionario de listas. Las claves de dictado representan los nombres de las columnas como 'Student_Name', 'Course_Title' y 'GPA'. Las listas representan los datos o el contenido de la columna. La variable 'dictionary_lists' contiene los datos de los estudiantes que se asignan además a la variable 'df1'. Usando la declaración de impresión, imprima todo el contenido de DataFrames.

Ejemplo:

# Importar bibliotecas para pandas y numpy
importar pandas como pd
# Importar la biblioteca de panda
importar pandas como pd
# Crea un diccionario de lista
dictionary_lists =
'Student_Name': ['Samreena', 'Raees', 'Sara', 'Sana'],
'Course_Title': ['SQA', 'SRE', 'IT Basics', 'Inteligencia artificial'],
'GPA': [3.1, 3.3, 2.8, 4.0]
# Crea el DataFrame
dframe = pd.DataFrame (listas de diccionarios)
imprimir (dframe)

Después de ejecutar el código anterior, se mostrará el siguiente resultado:

Método # 02: Cree Pandas DataFrame desde el diccionario de la matriz NumPy

El DataFrame se puede crear a partir del dict of array / list. Para ello, la longitud debe ser la misma que toda la narray. Si se pasa algún índice, entonces la longitud del índice debe ser igual a la longitud de la matriz. Si no se pasa ningún índice, entonces, en este caso, el índice predeterminado será un rango (n). Aquí, n representa la longitud de la matriz.

Ejemplo:

importar numpy como np
# Crea una matriz numpy
nparray = np.formación(
[['Samreena', 'Raees', 'Sara', 'Sana'],
['SQA', 'SRE', 'Conceptos básicos de TI', 'Inteligencia artificial'],
[3.1, 3.3, 2.8, 4.0]])
# Crea un diccionario de nparray
dictionary_of_nparray =
'Student_Name': nparray [0],
'Course_Title': nparray [1],
'GPA': nparray [2]
# Crea el DataFrame
dframe = pd.DataFrame (diccionario_de_nparray)
imprimir (dframe)

Método # 03: Creando Pandas DataFrame usando la lista de listas

En el siguiente código, cada línea representa una sola fila.

Ejemplo:

# Importar biblioteca Pandas pd
importar pandas como pd
# Crea una lista de listas
group_lists = [
['Samreena', 'SQA', 3.1],
['Raees', 'SRE', 3.3],
['Sara', 'Conceptos básicos de TI', 2.8],
['Sana', 'Inteligencia artificial', 4.0]]
# Crea el DataFrame
dframe = pd.DataFrame (listas de grupos, columnas = ['Student_Name', 'Course_Title', 'GPA'])
imprimir (dframe)

Método # 04: Creando Pandas DataFrame usando la lista de diccionario

En el siguiente código, cada diccionario representa una sola fila y claves que representan los nombres de las columnas.

Ejemplo:

# Importar pandas de la biblioteca
importar pandas como pd
# Crea una lista de diccionarios
dict_list = [
'Student_Name': 'Samreena', 'Course_Title': 'SQA', 'GPA': 3.1,
'Student_Name': 'Raees', 'Course_Title': 'SRE', 'GPA': 3.3,
'Student_Name': 'Sara', 'Course_Title': 'Conceptos básicos de TI', 'GPA': 2.8,
'Student_Name': 'Sana', 'Course_Title': 'Inteligencia artificial', 'GPA': 4.0]
# Crea el DataFrame
dframe = pd.DataFrame (dict_list)
imprimir (dframe)

Método # 05: Creación de pandas Dataframe a partir de dict of pandas Series

Las claves de dictado representan los nombres de las columnas y cada Serie representa el contenido de las columnas. En las siguientes líneas de código, hemos tomado tres tipos de series: Name_series, Course_series y GPA_series.

Ejemplo:

# Importar pandas de la biblioteca
importar pandas como pd
# Crea la serie de nombres de estudiantes
Name_series = pd.Serie (['Samreena', 'Raees', 'Sara', 'Sana'])
Course_series = pd.Series (['SQA', 'SRE', 'Conceptos básicos de TI', 'Inteligencia artificial'])
GPA_series = pd.Serie ([3.1, 3.3, 2.8, 4.0])
# Crear un diccionario de series
dictionary_of_nparray
\
'] = ' Nombre ': Name_series,' Edad ': Course_series,' Departamento ': GPA_series
# Creación de DataFrame
dframe = pd.DataFrame (diccionario_de_nparray)
imprimir (dframe)

Método # 06: Cree Pandas DataFrame usando la función zip ().

Se pueden combinar diferentes listas a través de la función list (zip ()). En el siguiente ejemplo, los Pandas DataFrame se crean llamando a pd.Función DataFrame (). Se crean tres listas diferentes que se fusionan en forma de tuplas.

Ejemplo:

importar pandas como pd
# List1
Student_Name = ['Samreena', 'Raees', 'Sara', 'Sana']
# List2
Course_Title = ['SQA', 'SRE', 'Conceptos básicos de TI', 'Inteligencia artificial']
# List3
GPA = [3.1, 3.3, 2.8, 4.0]
# Tome la lista de tuplas de tres listas más, combínelas usando zip ().
tuplas = lista (zip (Student_Name, Course_Title, GPA))
# Asignar valores de datos a tuplas.
tuplas
# Conversión de la lista de tuplas en pandas Dataframe.
dframe = pd.DataFrame (tuplas, columnas = ['Student_Name', 'Course_Title', 'GPA'])
# Imprimir datos.
imprimir (dframe)

Conclusión

Usando los métodos anteriores, puede crear Pandas DataFrames en Python. Hemos impreso el GPA del curso de un estudiante mediante la creación de Pandas DataFrames. Con suerte, obtendrá resultados útiles después de ejecutar los ejemplos mencionados anteriormente. Todos los programas están bien comentados para una mejor comprensión. Si tiene más formas de crear Pandas DataFrames, no dude en compartirlas con nosotros. Gracias por leer este tutorial.

Instale el último juego de estrategia de OpenRA en Ubuntu Linux
OpenRA es un motor de juego de estrategia en tiempo real libre / gratuito que recrea los primeros juegos de Westwood como el clásico Command & Conquer...
Instale el último emulador de Dolphin para Gamecube y Wii en Linux
Dolphin Emulator te permite jugar los juegos de Gamecube y Wii que elijas en computadoras personales con Linux (PC). Al ser un emulador de juegos de ...
Cómo usar GameConqueror Cheat Engine en Linux
El artículo cubre una guía sobre el uso del motor de trucos GameConqueror en Linux. Muchos usuarios que juegan juegos en Windows a menudo usan la apli...