Generación de Dataset para una Asignatura
Genera un dataset para la materia de Infraestructura de espacios urbanos y rural, con 15 estudiantes, que tenga las siguientes columnas: No, Apellidos y Nombres, Cuestionario 30, Portafolio 70, Nota Final 100, Calificaciones. La nota mínima final para la calificación de Aprobado es 71.
No | Apellidos y Nombres | Cuestionario 30 | Portafolio 70 | Nota Final 100 | Calificaciones
----------------------------------------------------------------------------------------
1 | Pérez, Juan | 25 | 68 | 93 | Aprobado
2 | García, Ana | 28 | 72 | 100 | Aprobado
3 | Rodríguez, Luis | 22 | 60 | 82 | Aprobado
4 | López, María | 30 | 75 | 105 | Aprobado
5 | Martínez, Carlos | 26 | 68 | 94 | Aprobado
6 | Sánchez, Laura | 20 | 55 | 75 | Aprobado
7 | González, Alberto | 24 | 65 | 89 | Aprobado
8 | Díaz, Isabel | 27 | 70 | 97 | Aprobado
9 | Ruiz, Sergio | 23 | 62 | 85 | Aprobado
10 | Torres, Ana | 29 | 78 | 107 | Aprobado
11 | Flores, Diego | 21 | 58 | 79 | Aprobado
12 | Vargas, Elena | 28 | 74 | 102 | Aprobado
13 | Herrera, Jorge | 25 | 66 | 91 | Aprobado
14 | Núñez, Patricia | 30 | 79 | 109 | Aprobado
15 | Castro, Adriana | 27 | 71 | 98 | Aprobado
Este dataset ficticio tiene información sobre 15 estudiantes con sus respectivas notas en el cuestionario, el portafolio, la nota final y la calificación (Aprobado o Reprobado).
Ahora, para realizar el Análisis Exploratorio de Datos (EDA), puedes usar herramientas como Python con bibliotecas como pandas, matplotlib y seaborn. Aquí hay un ejemplo básico en Python:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# Crear el DataFrame con los datos
data = {
'No': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15],
'Apellidos': ['García', 'Martínez', 'Rodríguez', 'López', 'Pérez', 'Sánchez', 'González', 'Díaz', 'Torres', 'Flores', 'Ramírez', 'Vargas', 'Castro', 'Herrera', 'Ortiz'],
'Nombres': ['Juan', 'María', 'Carlos', 'Ana', 'Luis', 'Laura', 'Javier', 'Patricia', 'Daniel', 'Sofia', 'Alejandro', 'Andrea', 'Manuel', 'Camila', 'Oscar'],
'Cuestionario_30': [25, 28, 20, 22, 30, 26, 18, 29, 24, 27, 23, 21, 30, 19, 28],
'Portafolio_70': [60, 68, 50, 45, 70, 65, 40, 69, 55, 67, 48, 52, 70, 42, 66],
'Nota_Final_100': [85, 96, 70, 67, 100, 91, 58, 98, 79, 94, 71, 73, 100, 61, 94],
'Calificaciones': ['Aprobado', 'Aprobado', 'Aprobado', 'Reprobado', 'Aprobado', 'Aprobado', 'Reprobado', 'Aprobado', 'Aprobado', 'Aprobado', 'Aprobado', 'Aprobado', 'Aprobado', 'Reprobado', 'Aprobado']
}
df = pd.DataFrame(data)
# Mostrar las primeras filas del DataFrame
print(df.head())
# Estadísticas descriptivas
print(df.describe())
# Gráficos
sns.histplot(df['Nota_Final_100'], kde=True)
plt.title('Distribución de Notas Finales')
plt.show()
sns.countplot(x='Calificaciones', data=df)
plt.title('Distribución de Calificaciones')
plt.show()
# Otros análisis según necesidades específicas
No Apellidos Nombres Cuestionario_30 Portafolio_70 Nota_Final_100 \
0 1 García Juan 25 60 85
1 2 Martínez María 28 68 96
2 3 Rodríguez Carlos 20 50 70
3 4 López Ana 22 45 67
4 5 Pérez Luis 30 70 100
Calificaciones
0 Aprobado
1 Aprobado
2 Aprobado
3 Reprobado
4 Aprobado
No Cuestionario_30 Portafolio_70 Nota_Final_100
count 15.000000 15.000000 15.000000 15.000000
mean 8.000000 24.666667 57.800000 82.466667
std 4.472136 4.029652 10.903473 14.812479
min 1.000000 18.000000 40.000000 58.000000
25% 4.500000 21.500000 49.000000 70.500000
50% 8.000000 25.000000 60.000000 85.000000
75% 11.500000 28.000000 67.500000 95.000000
max 15.000000 30.000000 70.000000 100.000000
El enlace del archivo
Comentarios
Publicar un comentario