Generación de Dataset para una Asignatura

- noviembre 27, 2023

Generación de Dataset para una Asignatura

Genera un dataset para la materia de Infraestructura de espacios urbanos y rural, con 15 estudiantes, que tenga las siguientes columnas: No, Apellidos y Nombres, Cuestionario 30, Portafolio 70, Nota Final 100, Calificaciones. La nota mínima final para la calificación de Aprobado es 71.

No | Apellidos y Nombres | Cuestionario 30 | Portafolio 70 | Nota Final 100 | Calificaciones
----------------------------------------------------------------------------------------
 | Pérez, Juan         | 25              | 68            | 93              | Aprobado
 | García, Ana         | 28              | 72            | 100             | Aprobado
 | Rodríguez, Luis     | 22              | 60            | 82              | Aprobado
 | López, María        | 30              | 75            | 105             | Aprobado
 | Martínez, Carlos    | 26              | 68            | 94              | Aprobado
 | Sánchez, Laura      | 20              | 55            | 75              | Aprobado
 | González, Alberto   | 24              | 65            | 89              | Aprobado
 | Díaz, Isabel        | 27              | 70            | 97              | Aprobado
 | Ruiz, Sergio        | 23              | 62            | 85              | Aprobado
| Torres, Ana         | 29              | 78            | 107             | Aprobado
| Flores, Diego       | 21              | 58            | 79              | Aprobado
| Vargas, Elena       | 28              | 74            | 102             | Aprobado
| Herrera, Jorge      | 25              | 66            | 91              | Aprobado
| Núñez, Patricia     | 30              | 79            | 109             | Aprobado
| Castro, Adriana     | 27              | 71            | 98              | Aprobado

Este dataset ficticio tiene información sobre 15 estudiantes con sus respectivas notas en el cuestionario, el portafolio, la nota final y la calificación (Aprobado o Reprobado).

Ahora, para realizar el Análisis Exploratorio de Datos (EDA), puedes usar herramientas como Python con bibliotecas como pandas, matplotlib y seaborn. Aquí hay un ejemplo básico en Python:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Crear el DataFrame con los datos
data = {
    'No': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15],
    'Apellidos': ['García', 'Martínez', 'Rodríguez', 'López', 'Pérez', 'Sánchez', 'González', 'Díaz', 'Torres', 'Flores', 'Ramírez', 'Vargas', 'Castro', 'Herrera', 'Ortiz'],
    'Nombres': ['Juan', 'María', 'Carlos', 'Ana', 'Luis', 'Laura', 'Javier', 'Patricia', 'Daniel', 'Sofia', 'Alejandro', 'Andrea', 'Manuel', 'Camila', 'Oscar'],
    'Cuestionario_30': [25, 28, 20, 22, 30, 26, 18, 29, 24, 27, 23, 21, 30, 19, 28],
    'Portafolio_70': [60, 68, 50, 45, 70, 65, 40, 69, 55, 67, 48, 52, 70, 42, 66],
    'Nota_Final_100': [85, 96, 70, 67, 100, 91, 58, 98, 79, 94, 71, 73, 100, 61, 94],
    'Calificaciones': ['Aprobado', 'Aprobado', 'Aprobado', 'Reprobado', 'Aprobado', 'Aprobado', 'Reprobado', 'Aprobado', 'Aprobado', 'Aprobado', 'Aprobado', 'Aprobado', 'Aprobado', 'Reprobado', 'Aprobado']
}

df = pd.DataFrame(data)

# Mostrar las primeras filas del DataFrame
print(df.head())

# Estadísticas descriptivas
print(df.describe())

# Gráficos
sns.histplot(df['Nota_Final_100'], kde=True)
plt.title('Distribución de Notas Finales')
plt.show()

sns.countplot(x='Calificaciones', data=df)
plt.title('Distribución de Calificaciones')
plt.show()

# Otros análisis según necesidades específicas

No Apellidos Nombres Cuestionario_30 Portafolio_70 Nota_Final_100 \ 0 1 García Juan 25 60 85 1 2 Martínez María 28 68 96 2 3 Rodríguez Carlos 20 50 70 3 4 López Ana 22 45 67 4 5 Pérez Luis 30 70 100 Calificaciones 0 Aprobado 1 Aprobado 2 Aprobado 3 Reprobado 4 Aprobado No Cuestionario_30 Portafolio_70 Nota_Final_100 count 15.000000 15.000000 15.000000 15.000000 mean 8.000000 24.666667 57.800000 82.466667 std 4.472136 4.029652 10.903473 14.812479 min 1.000000 18.000000 40.000000 58.000000 25% 4.500000 21.500000 49.000000 70.500000 50% 8.000000 25.000000 60.000000 85.000000 75% 11.500000 28.000000 67.500000 95.000000 max 15.000000 30.000000 70.000000 100.000000

El enlace del archivo

Buscar este blog

Thinking in Python

Generación de Dataset para una Asignatura

Comentarios

Publicar un comentario

Entradas populares de este blog

Estudio de Caso 2 - Revitalizacion Rio Cheonggyecheon en Seúl, Corea del Sur

Aprendizaje Automático con Python y Asistentes Inteligentes

Desarrollo Análisis Exploratorio de Datos (EDA)