En realidad no es que haya ninguna demostración de este hecho, por lo menos que yo sepa, pero sí es cierto que podemos usar algunos “entes” matemáticos para darnos cuenta de las dificultades que entraña el proceso de calificación, y así de paso los damos a conocer en esta entrada. Estos seres matemáticos de los que voy a hablar son la campana de Gauss y la paradoja del montón de arena. ¡Pues vamos a ello!

Fuente de la imagen: http://es.wikipedia.org/wiki/Campana_de_Gauss
La campana de Gauss es la gráfica de una función, la función gaussiana, que, entre otras cosas, podemos decir que aparece, de manera muy significativa, en diferentes contextos sociales, naturales… Técnicamente se dice que las funciones gaussianas aparecen como la función de densidad de la distribución normal o ley normal.
En palabras más llanas (y espero no equivocarme), la función de Gauss es una función que nos ayuda a comprender la probabilidad de que se den determinados valores dentro de una variable dada… Pongamos un ejemplo: si evaluamos la altura de los individuos de una determinada región y representamos en el eje horizontal las medidas obtenidas y en el eje vertical el número de veces que se repite ese valor, obtendremos una gráfica parecida a las de la figura, es decir, los valores medios tienden a ser los más abundantes, mientras que los valores extremos son mucho menos frecuentes. Es más fácil encontrar a una persona que mida 1,67, como yo, que una que mida 2 metros ó 1,5.
Esta campana de Gauss “aparece” en muchas otras situaciones, pero no en todas, claro. Algunas otras son, como podemos ver en la entrada para Distribución normal de la Wikipedia:
- Caracteres morfológicos de individuos
- Caracteres fisiológicos como el efecto de un fármaco
- Caracteres sociológicos como el consumo de cierto producto por un mismo grupo de individuos
- Caracteres psicológicos como el cociente intelectual
- Nivel de ruido en Telecomunicaciones
- Errores cometidos al medir ciertas magnitudes
- Valores estadísticos muestrales como la media
Pero bueno, ¿qué relación tiene esta campana con las calificaciones? Dejemos que Claudi Alsina nos ilumine desde su libro Vitaminas matemáticas (2008):
Recientemente, el educador matemático André Antivi ha publicado un curioso libro sobre la constante macabra. En el libro, Antivi constata que en la mayoría de evaluaciones escolares cuando se mira la distribución de notas aparece reiteradamente en cada clase, de cualquier lugar y cualquier año, la ley normal: pocos suspensos 0, 1, 2… pocos notables y excelentes 8, 9, 10 y una mayoría de notas alrededor del aprobado 5. Y Antivi nos invita a reflexionar: ¿qué razones hay para que la distribución sea siempre normal? ¿No sería más lógico que pudieran darse a veces notas muy altas, a veces muchos suspensos, es decir, variaciones en las distribuciones de notas? Si siempre es la ley normal y no hay razones teóricas que soporten dicho modelo, ¿no será que los propios profesores manipulan sus evaluaciones para que el resultado acabe adaptándose a esta distribución? Un tema interesante. En los planteamientos clásicos estadísticos las distribuciones son el resultado de una recolección de datos y un posterior estudio. Pero Antivi plantea un caso inverso donde la ley es una autoimposición apriorística y luego se ponen enunciados y se cuadran correcciones para que los resultados sigan fielmente la distribución dada. El complejo mundo de la evaluación educativa precisa de este tipo de reflexiones, pues la supuesta objetividad raras veces tiene lugar. Intervienen multitud de factores y entre ellos los resultados socialmente bien vistos.
Y creo que no tengo nada que añadir a las palabras de Alsina, así que pasemos al otro ente matemático: la paradoja sorites o del montón de arena. En la Wikipedia se nos dice:
La paradoja del montón (o la paradoja sorites, sorites en Griego significa “pila, montón” ) es una paradoja que aparece cuando la gente utiliza el “sentido común” sobre conceptos vagos.
Más específicamente, la paradoja se produce porque mientras el sentido común sugiere que los montones de arena tienen las siguientes propiedades, estas propiedades son inconsistentes:
1. Dos o tres granos de arena no son un montón.
2. Un millón de granos de arena sí son un montón.
3. Si n granos de arena no forman un montón, tampoco lo serán (n+1) granos.
4. Si n granos de arena son un montón, también lo serán (n−1) granos.

Fuente de la imagen: http://analizarte.es
Estos enunciados generan inevitablemente contradicciones: Si un millón de granos de arena sí son un montón, entonces, por la propiedad 4, 999.999 granos de arena también… Aplicando reiteradamente la propiedad 4 llegamos a que dos o tres granos de arena también son un montón, en contradicción con la propiedad 1… O también, si tomamos como válida la propiedad 1 y aplicamos reiteradamente la 3, llegamos a que un millón de granos de arena no son un montón, en contradicción con la propiedad 2.
Opino que esta misma paradoja se puede ver en las calificaciones… Se supone que el 5 es el límite entre el aprobado y el suspenso, pero como los profesores no son máquinas perfectas, surge una gran confusión a medida que nos acercamos a ese número 5. Veamos dónde está la paradoja. Seguramente el lector esté de acuerdo conmigo en que las siguientes proposiciones se dan como válidas en la mente de los profesores (y de los estudiantes):
- Un 0 o un 1 no es un aprobado
- A partir del 5 es aprobado
- Si una nota es aprobado, también lo será si le quitamos una décima
- Si una nota es suspenso, también lo será si le añadimos una décima
Si tomamos como válidas estas proposiciones llegamos irremediablemente a contradicciones: si un 5 es aprobado, también lo es un 4,9… y un 4,8… y así llegamos a que un 1 también es aprobado… o también, si un 1 es suspenso, un 1,1 sigue siendo suspenso, y un 1,2… y así un 5 también es un suspenso, y ya puestos un 10 también.
¿Qué ocurre? Es evidente que no se pueden tomar todas las proposiciones como válidas, pero es muy difícil salir de esta paradoja. Cada uno se libra como puede de ella, o por lo menos lo intenta. Así encontramos diferentes posturas e intentos de acabar con ella:
- Bajando el aprobado hasta el 4,5; 4; 3,5… pero así nos volvemos a encontrar irremediablemente con la paradoja. ¿Qué profesor dudaría de que algo de razón tiene el estudiante que se queja de que por un 3,4 ó 3,45 no le va a suspender si aprueba a uno con un 3,5?
- Haciendo distinciones entre unos alumnos y otros, teniendo en cuenta su aparente participación, motivación, esfuerzo y todas esas cosas… Pero aquí también surgen problemas, porque eso es bastante subjetivo. También aquí aparecerán estudiantes muy enfadados por que con un 4,5 no han sido aprobados mientras que “Pepito Grillo” sí lo ha sido con la misma nota.
- Siendo tajantes con el 5: un 4,9 es suspenso… y aquí me viene a la cabeza cómo el profesor es capaz de tener tanta precisión (y no digamos ya si aproximamos hasta las centésimas), cómo es capaz de saber que realmente esa es la nota del estudiante y no un 5,1. Claro, aquí el llamado examen tipo test parece salvarnos del problema, pero, la verdad, me sigue pareciendo un poco absurdo, porque creo que todos, en los exámenes de ese tipo, contestamos a ciertas preguntas a boleo… y puede que una persona, por ser más lanzada contestando o menos, apruebe o suspenda un examen, aún teniendo los mismos conocimientos. Es más, me atrevería a decir que muchas veces el aprobado o el suspenso depende de la inteligencia con que “hagamos la jugada”, mirando cuántas preguntas podemos contestar a boleo sin arriesgarnos a suspender o cuántas contestar para aprobar… Aunque desde luego, reconozco que esta solución es la que menos quebraderos de cabeza causa a los profesores: el examen parece objetivo y el estudiante no puede discutir para que le suban unas décimas… así que si tienes un 4,9 despídete de aprobar.
Entonces, ¿cuál es la solución? Pues no tengo ni idea, me imagino que estos problemas seguirán rondando en las cabezas de profesores y estudiantes hasta que se opte por otra forma de evaluar que no se base únicamente en simples numeritos, pero si no estamos dispuestos a dar ese paso, pues bueno, tendremos que seguir lidiando con la paradoja y quizás con la campana de Gauss… De todas formas, algo bueno tiene esta forma de calificar: me ha permitido escribir este post y hablar de matemáticas



Uy! No había visto este post, menos mal que lo has enlazado desde el de Teseo.
No me pronuncio respecto a los montones de arena, pero sí voy a hacerlo sobre las calificaciones, porque, a mi entender, no es tal la paradoja.
En primer lugar, dudo que el punto 4 sea cierto. En muchas ocasiones se sube una décima “para que aprueben”. Sí es más cierto el punto 3 (aunque parezca igual al 4), pero con algunos matices. La paradoja surje si olvidamos el punto 2. En caso contrario, el punto 3 quedaría algo como “Si un 5 es aprobado, también puede serlo si le faltan unas decimas”. es decir, que se puede aprobar con un 4’5, pero en ningún momento se dice que esa norma se pueda extrapolar (ya sabemos de los peligros de la extrapolación en todas las situaciones, y esta no es una excepción), ni tampoco que se aplique siempre, con lo que el aprobado pasaría a situarse en el 4’5.
Según esto, estaríamos en el caso que comentas en que un alumno puede aprobar con un 4’5 y otro, con la misma nota, no, dependiendo de otros factores que dices son subjetivos. No estoy muy seguro de que el cuaderno de clase, la participación, la realización de tareas, etc, sean elementos subjetivos pero, aunque lo fueran, son evaluables. Un profesor no puede (ni debe, según pienso) limitarse a evaluar el examen, y mucho menos en una evaluación continua como la actual.
Hablo, por supuesto, de notas de evaluación. Las notas de un examen… será que soy de matemáticas, pero para mi un 4’9 es un 4’9 y un 5 es un 5. Ninguno de los dos es aprobado ni suspenso, son sólo números. La valoración de aprobado o suspenso sólo la hago en las evaluaciones, teniendo en cuenta todo lo demás.
Saludos.
Se agradecen mucho comentarios como el tuyo, da-beat, de esos que hacen reflexionar y enriquecen los posts. Y sí, este me ha hecho reflexionar (aunque no tantos días como parece, pero es que la conexión me “viene y me va” y leo los comentarios con retraso).
Desde luego no hay paradoja, pero es que el montón de arena tampoco entraña ninguna paradoja: sólo cuando se dan por válidas todas las premisas surge la misma… En este sentido igual me equivoco, pero pienso que muchas personas damos por válidas dichas premisas (las de las notas) todas a la vez, y de ahí surge la paradoja; o bien unos dan por válidas unas y otros otras, y como no hay manera de saber quién tiene la razón… Y desde luego esta paradoja se da sólo si tenemos en cuenta las notas de los examenes. Aunque bueno, creo que también se da siempre que todos los aspectos a evaluar los califiquemos (incluida la participación…) y no tengamos en cuenta la evaluación continua: si hacemos una media con todos ellos y no tenemos en cuenta nada más creo que la paradoja sí se da. En este sentido no hay nada exterior a lo que atenerse (porque ya todo va incluido en ese número) para “aprobar” o “suspender” al sujeto (no creo que su cara bonita sea requisito suficiente para aprobarlo
) y creo que muy bien se puede tener en cuenta la afirmación que hago en el punto 3 tal como la puse. Ahora, estoy absolutamente de acuerdo contigo en que la evaluación continua u otros aspectos que tengamos en cuenta, pero que no hayamos usado en la calificación, nos pueden ayudar a decidirnos por el aprobado o el suspenso. Aquí también pueden surgir discrepancias y malentendidos si el profesor no ha llevado a cabo un análisis más o menos detallado de esos aspectos.
Quizás debería haber tenido más cuidado y no extrapolar esa paradoja a todos los casos… Lo cierto es que mientras la escribía estaba pensando más que nada en la Universidad, en la que hay muchos profesores y profesoras que sólo se basan en la nota del examen y la evaluación continua no aparece por ningún lado. En estos casos al menos sí creo que se da la paradoja. Muchos profesores, además, intentan librarse de problemas con un examen tipo test, que parecen muy objetivos pero que a mí personalmente no me lo parecen tanto.
Por ello creo que debería haber titulado el post como “Demostración” de la ineficacia de las calificaciones en determinadas circunstancias.
¡Ah! A pesar de ello creo que estaríamos mejor sin calificaciones, que, aunque no lo puedo demostrar, creo que no traen más que quebraderos de cabeza tanto para estudiantes como para profesores. Sí que estaría más de acuerdo con un documento personalizado en el que aparecieran las competencias que el estudiante ha ido desarrollando (como en Primaria, pero más amplio todavía) y las aptitudes que parece demostrar… y mejor todavía si fuera el propio estudiante el que hiciera su propia evaluación. En el fondo creo que si este mundo estuviera montado de otra manera no harían falta calificaciones y las evaluaciones las haría cada uno a sí mismo: si tu único interés es aprender, ¿para qué se necesita un documento que indique lo que sabes?… Ya, ya lo sé, se necesita para trabajar, pero vuelvo a creer que si todo esto estuviera montado de otra manera todos tendríamos el trabajo que nos gustara y para el que estuviéramos capacitados… y eso sin hacer uso de papelitos y títulos ni engaños.
Se me ha ocurrido una versión de la paradoja más general, de tal manera que, si lo he razonado bien (que es probable que no, pero para eso estáis vosotros, los lectores activos, para corregirme), se “prueba” lo injusto que es cualquier sistema en el que haya aprobados y suspensos, independientemente de la forma de evaluar, calificar… Vamos allá:
Imaginémonos que existe un ser superior capaz de saber de una forma justa qué personas deberán aprobar y qué otras no (tiene en cuenta todo lo que haya que tener en cuenta para saberlo: exámenes, participación, evaluación continua…). En ese caso estaremos de acuerdo que hay distintos grados tanto entre los que aprueban como entre los que suspenden. Para no meter notas ni nada de eso por medio, imaginémonos que cada persona recibe un vaso lleno de agua; en las personas suspensas el vaso no rebosa y en las personas aprobadas sí. Pero puede ocurrir que haya una persona suspensa a la que si echáramos una sola gota más en su vaso, el agua contenida en él rebosaría. ¿Podemos considerar justo su suspenso? Desde luego, si nos basamos en la premisa más que razonable de que si uno está aprobado con un número determinado de gotas, una gota menos también significa un aprobado, estaríamos cometiendo una injusticia, y por lo tanto habrá personas que habrán sido calificadas injustamente, probando que no existe tal ser superior (y por lo tanto un profesor tampoco lo será
).
Yo creo que el conflicto en este caso surge porque hay mucha diferencia entre el “castigo” que se les da a los que suspenden y el “premio” que se les otorga a los que aprueban. Los que suspenden tienen que repetir la lección, pero los que aprueban no (además de reprimendas de los padres, etc., etc.), pero tanto las personas que rozan el aprobado como las que rozan el suspenso tienen unos niveles de conocimientos muy parecidos, a pesar de la gran diferencia que nos encontramos, sin embargo, en lo que a cada uno se le ofrece.
Lo único que se me ocurre que no encaje en este razonamiento es que no es factible mirar el “grado” de aprobado o de suspenso de los estudiantes, pero realmente no es lo mismo un aprobado que otro y tampoco es lo mismo un suspenso que otro.
Sara, ese documento personalizado en el que aparecen las competencias… ¿no son las notas? Es decir, el profesor tendría que evaluar si un alumno ha alcanzado o no una competencia. Pero eso, ¿sería numérico? ¿Qué ocurre con las alumnos que casi las han alcanzado, ¿no se podría decir que las han alcanzado? Y los que las alcanzan por los pelos, ¿su diferencia con los anteriores no sería mínima? En cambio, la diferencia entre los “castigos” y “premios”, ¿no sería también demasiado grande?
Para mi el problema está en meter a todos los alumnos de la misma edad en la misma clase y hacerles estudiar a todos lo mismo al mismo tiempo. El ejemplo que siempre pongo es montar en bicicleta. Todo el mundo sabe, pero unos aprendieron a los 4 años, otros a los 6, otros a los 7, incluso a los 8 o más, pero a nadie le importa. Lo importante es que todos saben. En cambio, en la escuela, se les “obliga” a aprender a hacer ecuaciones de segundo grado a los 13 años. Si no, “suspenden”, con todos los efectos secundarios relacionados con la autoestima (y la estima de los demás sobre uno) que eso conlleva.
Curiosamente (o paradójicamente), todos sabemos montar en bicicleta pero muy pocos recuerdan como se hace una ecuación de segundo grado o una raíz cuadrada. Y los que lo recordamos es porque trabajamos con ellas, pero apenas recordamos los nexos coordinados disyuntivos, o la tercera declinación de dux-ducis. ¿Está fallando algo?
Ya me había dado cuenta de que ese documento por el que abogaba, en el fondo, nos lleva al mismo asunto paradójico, aunque aquí aparezca de manera más sutil y sea, a mi parecer, algo mejor.
Estoy totalmente de acuerdo contigo en que el problema está en que todos los alumnos de una misma edad tengamos que aprender lo mismo a un mismo tiempo. Por ejemplo: yo aprendí a andar muy pronto (comparándolo con el resto, claro); sin embargo, el hablar me costó más que a la mayoría; pero el hecho es que al final aprendí tanto a hablar como a andar y, desde luego, ahora mismo no se nota ni que aprendiera antes que los demás a andar ni que aprendiera más tarde a hablar. El hecho es que aprendí las dos cosas y que nadie me puso un suspenso por no saber hablar perfectamente cuando “debería”. En concordancia con esto, y profundizando un poco más, el problema creo que está en los suspensos y aprobados. Para mí no tendría que existir ese corte tan drástico. Cada uno debería aprender a su ritmo, como tú bien dices con el asunto de la bicicleta, pero sin esos estigmas que a veces pueden crear las calificaciones.
Pero claro, de alguna manera hay que valorar ese aprendizaje para saber si seguir insistiendo en él o no, y eso, creo, es bastante relativo, porque, ¿cuándo el conjunto de granos de arena se convierte en montón? O igual no hace falta esta valoración, no lo sé. En realidad, tampoco sé cuándo se puede decir que aprendí realmente a andar en bicicleta (¿cuando me sostenía en ella todavía un poco tambaleante?, ¿cuándo era capaz de subir y bajar montículos sin caerme?, ¿cuándo podía pasarme varias horas encima de la misma?) Me imagino que eso no importa demasiado, porque cada vez que vuelvo a subir en ella, ese aprendizaje lo perfecciono. De todas formas, opino que el problema también está en que las competencias, habilidades… a adquirir, muchas veces están muy alejadas de la vida cotidiana de los alumnos. Si estuvieran próximas, la propia vida “evaluaría” si esa competencia se ha adquirido, y si no se ha hecho, ya se ocuparía el propio alumno de conseguirla por su bien. En ese caso creo que el interés del alumno estaría centrado en aprender y no en aprobar (aunque luego igual se haya aprendido bien poco o se olvide a los dos días), como parece estar centrado ahora.
No sé, quizás la solución esté en diluir cada vez más las barreras entre escuela y vida cotidiana; en aprender a cada momento lo que es relevante en ese momento para el buen desenvolvimiento de la persona en su mundo y, desde luego, esto varía con cada persona…
No sólo sería dar cosas en clase que existan en “su mundo”. A veces me da la impresión de que lo que se da en clase, automaticamente, entra en el saco de “lo que no sirve”, aunque no sea cierto. Estoy pensando, por ejemplo, en los porcentajes. ¿Por qué con 5 años saben programar un DVD Grabador con DivX pero con 16 todavía les cuesta entender un tanto por ciento? Las dos cosas existen en su vida cotidiana (anuncios, rebajas, revistas, 100% funny…), pero el DVD lo aprenden rápido (o eso parece) y los porcentajes los aprenden a base de repetirlos, y repetirlos… ¿No será que las instrucciones del DVD no se explican en clase y, por lo tanto, no se evalúan?
No sé, sería cuestión de hacer una prueba y enseñarles en 1º de Primaria a manejar un móvil y hacerles un examen en el que tuvieran que enviar un mensaje MMS, programar la alarma diaria o cambiar el PIN. Si se demostrara que entonces dejaban de saber hacerlo, entonces llegaríamos a alguna conclusión. Mientras tanto, seguiremos con dudas.
Sara, un saludo, y perdón por quitarte tiempo de estudio.
Ahí le has dado. Creo que tienes toda la razón en ese punto.
Y por el tiempo de estudio no te preocupes; se agradecen tus comentarios.
hola la foto esta piola pero no se si es verdad
hola soy otra ves yo es que nadie me abla por chat
y me aburo viste estava comiendo y en tonses me vine y queri escribir
chauuuuu!!!!!
Hola, Dana.
Creo que la foto sí es verdad o por lo menos puede serlo. Alguna vez he visto “esculturas” de este tipo en las playas.
Por cierto, puedes escribir cuando quieras, pero recuerda que esto no es un chat
.
Hola, buenas tardes. Me gustaría saber cuál es su opinión sobre que se aplique a un grupo de alumnos una proporción de de notas basada en la campana de Gauss. Es decir, en todas las asignaturas habrá un par de personas que saquen sobresaliente, otras dos que saquen notable, tres o cuatro que saquen un bien, cinco o seis que aprueben y un par de ellas que suspendan.
El director del Máster impone esta proporción de las notas desde el principio a toda la clase.
Muchas gracias.
JM, perdona por mi tardía respuesta.
Bueno, mi humilde opinión es que esa forma de proceder no es correcta, pero es una opinión de una persona aficionada a las matemáticas y que además no tiene muchos conocimientos (aún) de estadística y probabilidad (quizá dentro de unos meses te pueda contestar con más claridad). Lo que sí tengo son más conocimientos de didáctica.
Te digo lo que pienso y he leído:
-Que yo sepa no hay razones para apoyar que las notas tengan que seguir este tipo de distribución. Todo depende de lo que entendamos por educación y formación. Si lo que pretendemos es que sea un medio de selección, pues puede que sí, pero se supone que lo que pretendemos con la educación es que el mayor número de personas se formen (entre muchas otras cosas). ¿Por qué sería incorrecto que en una clase hubiera una mayor proporción de sobresalientes que de otras notas, por ejemplo? Es como andar. Todos, más o menos, hemos aprendido a andar. Sería absurdo que pusiéramos notas a las personas según sepan andar mediante una distribución normal, porque creo que la mayoría estarían en el sobresaliente, ¿no? Pues se supone que lo que hay que aprender en clase es algo a lo que todo el mundo puede llegar y con “agilidad”.
Pero imaginemos que las notas sí tuvieran que seguir esta distribución:
-No me parece muy razonable hacer “chanchullos” para que las cosas cuadren al milímetro. En la naturaleza tampoco es así, es decir, si tenemos 30 personas lo más normal es que haya muchas con una altura media, por ejemplo, pero no siempre tiene por qué ser así, y la fiabilidad es menor cuantas menos personas haya… Es como lanzar una moneda al aire 10 veces y que tenga que salir, por narices, 5 veces cara y 5 cruz. Las clases pueden ser muy diferentes de unos años a otros. Algunos años puedes tener muchos “buenos” alumnos y otros no, por ejemplo. No sería justo. Imagínate que en tu curso hay varios de estos “buenos” alumnos, entonces vete despidiéntode de tener una buena nota. Imagínate que no hay “buenos” alumnos o sólo uno. En ese caso puede que haciendo el mismo esfuerzo que en el caso anterior tengas una muy buena nota. A mí no me parece justo, porque no depende sólo de lo que tú hagas, sino de los que hay a tu alrededor.
-Aunque la distribución de notas siguiera la ley normal, ¿quién dice que la “mitad” tiene que estar en el aprobado? Es decir, podría estar en el notable, por ejemplo, y así habría muchas buenas notas y muy pocas malas. Todo vuelve a ser una convención social que no se sostiene.
Bueno, esa es mi idea, quizá redactada de una forma un poco confusa… Probablemente estaría bien que leyeras el libro de Antivi, si te puedes hacer con él.
Que gran post, la de asignaturas en Ingeniería que se saltan lo de la campana de Gauss y el mínimo del 10%..