Generación de Dataset para una Asignatura

 Generación de Dataset para una Asignatura

Genera un dataset para la materia de Infraestructura de espacios urbanos y rural, con 15 estudiantes, que tenga las siguientes columnas: No, Apellidos y Nombres, Cuestionario 30, Portafolio 70, Nota Final 100, Calificaciones. La nota mínima final para la calificación de Aprobado es 71.

No | Apellidos y Nombres | Cuestionario 30 | Portafolio 70 | Nota Final 100 | Calificaciones
----------------------------------------------------------------------------------------
1  | Pérez, Juan         | 25              | 68            | 93              | Aprobado
2  | García, Ana         | 28              | 72            | 100             | Aprobado
3  | Rodríguez, Luis     | 22              | 60            | 82              | Aprobado
4  | López, María        | 30              | 75            | 105             | Aprobado
5  | Martínez, Carlos    | 26              | 68            | 94              | Aprobado
6  | Sánchez, Laura      | 20              | 55            | 75              | Aprobado
7  | González, Alberto   | 24              | 65            | 89              | Aprobado
8  | Díaz, Isabel        | 27              | 70            | 97              | Aprobado
9  | Ruiz, Sergio        | 23              | 62            | 85              | Aprobado
10 | Torres, Ana         | 29              | 78            | 107             | Aprobado
11 | Flores, Diego       | 21              | 58            | 79              | Aprobado
12 | Vargas, Elena       | 28              | 74            | 102             | Aprobado
13 | Herrera, Jorge      | 25              | 66            | 91              | Aprobado
14 | Núñez, Patricia     | 30              | 79            | 109             | Aprobado
15 | Castro, Adriana     | 27              | 71            | 98              | Aprobado

Este dataset ficticio tiene información sobre 15 estudiantes con sus respectivas notas en el cuestionario, el portafolio, la nota final y la calificación (Aprobado o Reprobado).

Ahora, para realizar el Análisis Exploratorio de Datos (EDA), puedes usar herramientas como Python con bibliotecas como pandas, matplotlib y seaborn. Aquí hay un ejemplo básico en Python:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Crear el DataFrame con los datos
data = {
    'No': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15],
    'Apellidos': ['García', 'Martínez', 'Rodríguez', 'López', 'Pérez', 'Sánchez', 'González', 'Díaz', 'Torres', 'Flores', 'Ramírez', 'Vargas', 'Castro', 'Herrera', 'Ortiz'],
    'Nombres': ['Juan', 'María', 'Carlos', 'Ana', 'Luis', 'Laura', 'Javier', 'Patricia', 'Daniel', 'Sofia', 'Alejandro', 'Andrea', 'Manuel', 'Camila', 'Oscar'],
    'Cuestionario_30': [25, 28, 20, 22, 30, 26, 18, 29, 24, 27, 23, 21, 30, 19, 28],
    'Portafolio_70': [60, 68, 50, 45, 70, 65, 40, 69, 55, 67, 48, 52, 70, 42, 66],
    'Nota_Final_100': [85, 96, 70, 67, 100, 91, 58, 98, 79, 94, 71, 73, 100, 61, 94],
    'Calificaciones': ['Aprobado', 'Aprobado', 'Aprobado', 'Reprobado', 'Aprobado', 'Aprobado', 'Reprobado', 'Aprobado', 'Aprobado', 'Aprobado', 'Aprobado', 'Aprobado', 'Aprobado', 'Reprobado', 'Aprobado']
}

df = pd.DataFrame(data)

# Mostrar las primeras filas del DataFrame
print(df.head())

# Estadísticas descriptivas
print(df.describe())

# Gráficos
sns.histplot(df['Nota_Final_100'], kde=True)
plt.title('Distribución de Notas Finales')
plt.show()

sns.countplot(x='Calificaciones', data=df)
plt.title('Distribución de Calificaciones')
plt.show()

# Otros análisis según necesidades específicas

No Apellidos Nombres Cuestionario_30 Portafolio_70 Nota_Final_100 \ 0 1 García Juan 25 60 85 1 2 Martínez María 28 68 96 2 3 Rodríguez Carlos 20 50 70 3 4 López Ana 22 45 67 4 5 Pérez Luis 30 70 100 Calificaciones 0 Aprobado 1 Aprobado 2 Aprobado 3 Reprobado 4 Aprobado No Cuestionario_30 Portafolio_70 Nota_Final_100 count 15.000000 15.000000 15.000000 15.000000 mean 8.000000 24.666667 57.800000 82.466667 std 4.472136 4.029652 10.903473 14.812479 min 1.000000 18.000000 40.000000 58.000000 25% 4.500000 21.500000 49.000000 70.500000 50% 8.000000 25.000000 60.000000 85.000000 75% 11.500000 28.000000 67.500000 95.000000 max 15.000000 30.000000 70.000000 100.000000


El enlace del archivo





Comentarios

Entradas populares de este blog

Estudio de Caso 2 - Revitalizacion Rio Cheonggyecheon en Seúl, Corea del Sur

Creamos un mapa computacional en procesos iterativos y de investigación con la Educación disruptiva y la Inteligencia artificial

Aprendizaje Automático con Python y Asistentes Inteligentes