Saltar al contenido

¿Cómo filtrar y manipular DataFrames en Pandas? Guía paso a paso para principiantes

29/04/2025
¿Cómo filtrar y manipular DataFrames en Pandas?
Compartir:
Índice de Contenido

Introducción a la manipulación de DataFrames en Pandas

Pandas es una de las librerías más populares de Python para análisis y manipulación de datos. Si eres principiante y te preguntas ¿cómo filtrar y manipular DataFrames en Pandas?, esta guía paso a paso es para ti. Aprenderás desde cómo crear un DataFrame, hasta cómo filtrar y modificar sus datos de manera eficiente.

¿Qué es un DataFrame en Pandas?

Un DataFrame es una estructura de datos bidimensional similar a una hoja de cálculo, donde puedes almacenar datos en filas y columnas. Es el formato principal con el que trabaja Pandas y permite realizar operaciones de filtrado, selección, agregación y mucho más.

Creando tu primer DataFrame

Antes de aprender cómo filtrar y manipular DataFrames en Pandas, primero necesitas crear uno. Veamos un ejemplo básico:

import pandas as pd

# Creamos un diccionario de datos
datos = {
    Nombre: [Ana, Juan, Pedro, Lucía, María],
    Edad: [23, 35, 29, 41, 30],
    Ciudad: [Madrid, Barcelona, Madrid, Sevilla, Valencia],
    Puntaje: [88, 92, 79, 95, 85]
}

# Convertimos el diccionario en un DataFrame
df = pd.DataFrame(datos)

print(df)

Filtrando DataFrames en Pandas

El filtrado de DataFrames te permite seleccionar filas que cumplen ciertas condiciones. Existen varias formas de hacerlo:

Filtrar filas por una condición

Para responder a la pregunta ¿cómo filtrar filas en un DataFrame de Pandas?, puedes usar una expresión booleana. Por ejemplo, para seleccionar las personas mayores de 30 años:

# Filtrar personas mayores de 30 años
mayores_30 = df[df[Edad] > 30]
print(mayores_30)

Filtrar por varias condiciones

Puedes combinar condiciones usando & (y) o | (o). Por ejemplo, para seleccionar personas de Madrid y mayores de 25 años:

# Personas de Madrid y mayores de 25 años
filtro = (df[Ciudad] == Madrid) & (df[Edad] > 25)
resultado = df[filtro]
print(resultado)

Filtrar usando el método query()

Otra manera de filtrar datos es usando el método query(), que permite escribir las condiciones como si fueran expresiones de Python:

# Usando query para filtrar
resultado = df.query(Ciudad == "Madrid" and Edad > 25)
print(resultado)

Seleccionar columnas específicas en un DataFrame

Además de filtrar filas, puedes seleccionar columnas de interés. Por ejemplo, para obtener solo los nombres y edades:

# Seleccionar columnas Nombre y Edad
seleccion = df[[Nombre, Edad]]
print(seleccion)
Quizás también te interese:  ¿Qué es zip() en Python y cómo combinar iterables fácilmente?

Manipulación básica de DataFrames en Pandas

Una vez que sabes cómo filtrar DataFrames, puedes pasar a la manipulación de los datos. Aquí tienes algunos ejemplos:

Agregar una nueva columna


Puedes crear nuevas columnas a partir de datos existentes. Por ejemplo, para calcular si una persona es mayor de edad:

# Crear una columna Mayor_de_edad
df[Mayor_de_edad] = df[Edad] >= 18
print(df)

Modificar valores en el DataFrame

Puedes actualizar valores específicos. Por ejemplo, para aumentar en 5 puntos el puntaje de todos:

# Aumentar el puntaje en 5
df[Puntaje] = df[Puntaje] + 5
print(df)
Quizás también te interese:  ¿Qué son los diccionarios y cómo acceder a sus valores? Guía completa para principiantes

Eliminar columnas o filas

Para eliminar una columna, utiliza drop():

# Eliminar la columna Mayor_de_edad
df = df.drop(Mayor_de_edad, axis=1)
print(df)

Para eliminar una fila por su índice:

# Eliminar la fila con índice 2
df = df.drop(2)
print(df)

Resumen: ¿Cómo filtrar y manipular DataFrames en Pandas?

Quizás también te interese:  ¿Cómo usar print() e input() en Python para entrada y salida básica? Guía fácil para principiantes

Como has visto, filtrar y manipular DataFrames en Pandas es sencillo y muy útil para el análisis de datos. Puedes:

  • Filtrar filas usando condiciones lógicas.
  • Seleccionar columnas específicas.
  • Agregar o modificar columnas para enriquecer tus datos.
  • Eliminar filas o columnas que no necesites.

La clave está en practicar estos conceptos y combinarlos para lograr un análisis de datos eficiente con Pandas.

Conclusión

Dominar cómo filtrar y manipular DataFrames en Pandas te abrirá las puertas al mundo del análisis de datos en Python. Esperamos que esta guía paso a paso para principiantes te haya resultado útil. ¡Ahora es tu turno de experimentar y profundizar en el manejo de DataFrames!

Compartir: