martes, 21 de octubre de 2008

Para Leer - Anguo Rasco

----------------------- Page 1-----------------------

Material extraído de : “Teoría y desarrollo del currículum”
Editorial Aljibe, Málaga.1994.
J. Félix Angulo / Nieves Blanco
(Coordinadores)


TEORÍA Y DESARROLLO DEL CURRICULUM


EDICIONES
ALJIBE


¿A QUE LLAMAMOS EVALUACION?: LAS DISTINTAS ACEPCIONES DEL TÉRMINO «EVALUACIÓN»
O POR
QUÉ NO TODOS LOS CONCEPTOS SIGNIFICAN LO MISMO1


J. Félix Ángulo Rasco
Universidad de Málaga


“Ni siquiera estoy seguro de que
la enseñanza con éxito sea un criterio
de la buena enseñanza


1
Tengo que agradecer a J. Contreras Domingo, Miguel Sola y Nieves Blanco sus comentarios y
aportaciones alas versiones previas de este trabajo; pero muy especialmente a mis alumnos/as de
Doctorado (año 1994), a quienes presenté y con quienes discutí la penúltima versión del mismo.

----------------------- Page 2-----------------------

Hirst, P.H. (1977,322)


Por razones que no tienen nada que ver con el lenguaje, el concepto de “evaluación" posee más
sinónimos de los que un buen diccionario de la lengua española podría soportar. En este trabajo quisiera
despejar algunas confusiones y proponer, de paso, un concepto de evaluación bastante distinto
probablemente al que subyace a muchas de las prácticas que, a veces con cierta ligereza, denominamos
prácticas de evaluación.
En castellano es frecuente utilizar el término evaluación para toda una gama de procesos: evaluación de
curricula, de centros, alumnos/as y de profesores/as, e incluso, lo que en psicología se denomina
“evaluación conductual”. Además cuando se hace referencia a los alumnos/as, encontramos otros
términos asociados al mismo, utilizados en la misma práctica, como los de “control”, “pruebas”,
“calificación”, “rendimiento” y “exámenes” (Alvarez Méndez, 1985; Gimeno Sacristán y Pérez Gómez y
1992).
Sin embargo, en los países anglosajones se suele hacer una distinción entre «evaluation» y
«assessment». Mientras el primer término puede traducirse en español sencillamente por ‘evaluación’, la
2
traducción del segundo abriga problemas casi insuperables . Pero podemos aclaramos si abordamos
ambos conceptos y otros relacionados, pero igualmente importantes. haciendo uso de dos enfoques: uno
procesual y otro estructural, que recogen lo establecido en la literatura pertinente.


a)Enfoque procesual.



Según este enfoque, evaluar es formular un j uicio sobre la actuación de un individuo o grupo de
individuos o un curso de acción, un programa o una realidad educativa, en cuyo caso podemos hablar,
con propiedad, de evaluación educativa y no sólo de evaluación a secas (Angulo, Contreras, Santos
Guerra, 1991; Airasian, 1994); por el contrario, el concepto de assessment se refiere, única y
exclusivamente, al proceso a través del cual se recoge, sintetiza y analiza la información pertinente para
formular el juicio de la evaluación, es decir, para evaluar (Airasian, 1994).


b)Enfoque estructural.


Desde este enfoque, la diferencia entre dichos conceptos se realiza en relación a su sentido y su objeto
correspondiente. El sentido de evaluacion hace referencia a todo proceso orientado al conocimiento de la
calidad de/servicio educativo prestado, mientras que assessment lo haría con respecto al “impacto’”y las
3 4
“repercusiones" que dicho servicio ha tenido sobre los receptores . Teniendo en cuenta el objeto, la
evaluación se ocupa de la influencia en la calidad educativa que puedan tener los distintos y diversos
componentes de los procesos de enseñanza/aprendizaje (curriculum, metodología, experiencias de
aprendizaje, organización de los centros de enseñanza, administración educativa -provincial,
autonómica, estatal-, los docentes y los mismos alumnos/as); mientras que ‘assessment’ se orientada
única y exclusivamente a los individuos o grupos de individuos receptores del servicio (alumnos/ as)
(MacDonald, 1976, 1988a; Angulo,1990; Sriven, 1991).


2
El término "assessment" deriva según Conner (1 (1991) de la expresión latina "assidere" que significa “sentarse al lado de”,
aunque en el diccionario latin/español sólo aparece la palabra “assideo” que además de significar “estar sentado junto a”, acepta


como traducción la de “asediar”. En los diccionarios español/Inglés dicho concepto viene traducido como evalu ación y como
tasación. Siendo un tanto críticos, la utilizacion de dicho concepto en los países anglosajones, teórica y prácticamente, está más
cerca de la última, “ tasación”, que de evaluación. Con lo que "Assessment" supondria sensu stricto ” tasar algo”. Pero nadie estaría


dispuesto, ni siquiera los anglosajones, a aceptar semejante traducción.


3
Una fórmula muy empleada por algunos docentes para desembarazarse de responsabilidades es la de afirmar, en este sentido,
que se trata de “aprovechamiento”, en lugar del mencionado en el texto “repercusiones”.


4
Así es como se ha concebido en Estados Unidos de Norteamérica el “National Assessment of Educational Performance”
(Evaluación Nacional de la Actuación /Logro/Educativa), yen el Reino Unido el “Assessment of Performance Unit” (Unidad de
Evaluación de la Actuación /Logro/). Es interesante constatar que en España se suele traducir, de modo desafortun ado,
«performance» y »achievement» por “rendimiento”.

----------------------- Page 3-----------------------

Podríamos afirmar que ambos enfoques son, en realidad, complementarios. La ventaja del primero
estriba en situar la evaluación correctamente en el terreno de los juicios, dejando al concepto de
“assessment” en el de la metodología, los “instrumentos”, en una palabra, la indagación necesaria para
sustentar cualquier juicio que queramos realizar. Sin embargo, este enfoque acarrea la dificultad de no
diferenciar claramente entre el sentido y el objeto; con lo que propicia la reducción, cuando no la
equiparación errónea, del concepto de evaluación a otros más discutibles y limitados como los de
calificación, test, prueba objetiva y exámenes, por ejemplo. Con ello, diluye, de alguna manera, la
frontera entre instrumento y juicio, pero ademas, suprime una importante diferencia que es necesario
situar desde el principio y que juega un papel clave en los procesos educativos: evaluar es algo mas que
recoger datos e informaciones sobre una realidad educativa.
Por lo tanto, el primer enfoque –procesual- introduce un elemento muy importante . Lo que aquí podemos
denominar genericamente evaluacion, supone siempre la formulacion de un juicio, formulacion que
sostiene y justifica en razon de cierta informacion obtenida sobre la entidad o el ambito, sea este cual
fuere, que evaluamos. Pero si utilizamos lo especificado por el segundo enfoque, tenemos que en el
primer caso el juicio se realiza sobre la calidad del servicio y en el segundo sobre el aprovechamiento o
impacto sobre los receptores del mismo. En estos casos los parametros del juicio son distintos:
considerablemente amplio en el primero, particularmente reducido y estrecho en el segundo.
Podemos acordar, pues, desde estas distinciones dos acepciones del termino evaluacion: una acepcion
amplia que corresponderia al proceso por el cual conocemos y valoramos la calidad del servicio y el
papel de los distintos componentes en el mismo y otra acepcion estrecha (o reducida)que señalaria al
proceso o procedimiento por el que averiguamos su “calidad “ unicamente a traves de la “repercusion” de
dicho servicio en individuos o grupos de individuos receptores del mismo, restringiendo la comprension
5
de calidad a su incidencia sobre los receptores (alumnos/as) . En ambos casos, repito, formulamos un
juicio pero con la importante diferencia de que en el segundo, el juicio es una atribucion a individuos o
grupos de individuos o, en todo caso, a las actividades (por ejemplo sus aprendizajes) que hayan
realizado; mientras que en el primero la atribucion se realiza sobre una actividad social o una institución
compleja, incluyendo acciones, decisiones, propuestas, experiencias, circunstancias, opiniones, y juicios
tanto individuales como colectivos’.


5
Barbier (1993, 17). reformula esta distinción en lo que denomina tipos funcionales de
evaluación: la evaluación de agentes y la evaluación de acciones.

----------------------- Page 4-----------------------

Existen dos cuestiones problemáticas que pueden enunciarse a partir de lo que hasta ahora llevamos
visto: En primer lugar, y haciendo referencia al título de este apanado, es necesario preguntarse ¿a qué
llamamos evaluación? Acabamos de ver que evaluar, sea cual sea la acepción que adoptemos, supone
siempre Ja formulación de un juicio; por ello, recoger información sobre lo evaluado o evaluable, aunque
necesario, es insuficiente para conformar un proceso o una práctica de evaluacion. Como la contestación
a este problema, una vez planteado, requiere la explicación de otros conceptos que suelen utilizarse
como sustitutos del de evaluación, tendremos que esperar un poco más. Veamos la otra problemática.
En segundo lugar, un error importante que suele cometerse con respecto a estas dos acepciones, estriba
en tomarlas de modo intercambiable; es decir, centrarse metodológicamente en el plano de la acepción
6
estrecha para formular juicios en el plano de la acepción amplia . Esto suele ocurrir cuando, para valorar
o enjuiciar ciertos curricula, innovaciones o reformas educativas, utilizamos información sobre el
“impacto” y “repercusión” de las mismas en sus receptores, normalmente el alumnado. El salto
subrepticio que aquí se realiza, de una plano a otro, constituye un craso error, al que lamentablemente
nos estamos acostumbrando. La información sobre los receptores y la valoración del impacto que ciertas
innovaciones tiene en ellos es un elemento clave para conocer el valor del servicio que dichas iniciativas
han prestado, pero no es necesariamente el único que nos ayuda a comprender esa compleja
interrelación que se produce en los ambientes institucionales de la escolaridad en los que dicha iniciativa
se adopta (MacLaughlin, 1985; Fullan y Stiegelbauer, 1991).
Pero podemos dar la vuelta a esta segunda problemática que venimos tratando del modo siguiente.
Teniendo en cuenta la acepción estrecha, la evaluación del alumnado supondría, casi exclusivamente, la
recogida de información sobre su trabajo en la clase: el contenido asimilado, los trabajos realizados, la
participación, en el mejor de los casos, o simplemente sus respuestas a ciertas pruebas y exámenes, en


6
Un claro ejemplo de este error tan extendido lo encontramos en Rossi y Freeman (1982), que paramayordecepción se refieren,
retóricamente, a laevaluación en su acepción amplia:
“Lainvestigación evaluativaes la aplicación sistemáticade procedimientos de investigación
social para ‘medir’ la conceptualización y el diseño, la implementación y la utilidad de programas de intervención social. En otras
palabras la investigación evaluativa implica el uso de metodologías de investigación socia para juzgar y mejorar la planificación,
control, efectividad y eficiencia de programas en sanidad, educación, bienestar y olros servicios sociales” (pág. 20).

----------------------- Page 5-----------------------

el peor. Con la acepción amplia, sin embargo, su evaluación tendría que situarse en relación con la
calidad de las experiencias que el docente ha planificado y realizado, la calidad del material (libros de
textos, materiales curriculares, experiencias de laboratorio) seleccionadas y con la calidad de la
enseñanza misma y la atención pedagógica que el docente ha prestado al alumnado a lo largo del
período de tiempo establecido. Con este breve ejemplo, podemos darnos cuenta que lo que hemos
denominado “acepción estrecha”, lo es en razón de que se olvida que lo que “impacta”, lo que genera
consecuencias y repercute en la vida escolar del alumnado, es un servicio y que, como tal servicio -su
calidad intrínseca y su calidad práctica- se encuentra directamente imbricado con la calidad del impacto
en los receptores. Dicho de otro modo, cuando evaluamos al alumnado pasamos por alto que la calidad
de sus “aprendizajes" está relacionada tanto con la calidad de nuestras decisiones, concepciones y
acciones docentes como con la calidad “contexto escolar” en el que se realizan. Probablemente, sin el
conocimiento de dichas concepciones, decisiones y acciones y sin el conocimiento de las características
del contexto, resulta difícil (si no imposible) explicar y situar dichos aprendizajes, o la información que
sobre los mismos obtenemos. Lo que, volviendo a la terminología utilizada, viene a decirnos que la acep-
ción estrecha de evaluación reduce los parámetros de nuestro juicio al omitir, o dar por descontado, la
calidad del servicio ofertado y del contexto de actuación. ¿Qué valor educativo y profesional tiene,
entonces, lo que hagamos siguiendo una acepción estrecha si no tenemos en cuenta lo que podríamos
hacer y conocer adoptando una acepción amplia de evaluación?
Dejemos esta pregunta en suspenso y analicemos a continuación dos conceptos que suelen aparecer
relacionados, cuando no confundidos, con el de evaluación en su acepción estrecha. Me refiero a los de
‘calificación’ y “test” o “prueba”.


Evaluación versus Calificación.


7
Como todos sabemos, calificar es traducir a una escala, usualmente numerica , un juicio de valor. La
escala no sólo traduce, sino que, mucho más importante, permite cuantificar los criterios que subyacen a
todo juicio.
Pero no podemos traducir nada hasta que no tengamos datos de la realidad “evaluada”. Por ejemplo,
calificar el aprendizaje matemático de un alumno/a, implica poder determinar si es capaz de resolver
determinados problemas matemáticos y sí domina ciertos conceptos que creemos básicos y
fundamentales. Para ello necesitamos un instrumento (o una prueba) que nos proporcione datos a partir
de los cuales situar su aprendizaje en la escala utilizada. Este proceso vale incluso cuando utilizamos
`calificadores´ como los de “suspenso”, aprobado, notable, sobresaliente» o el más ‘novedoso’ de
«progresa adecuadamente».
Puestas así las cosas, la calificación es un concepto muy parecido al de cuantificación. Este no es un
proceso que podamos realizar con ligereza, al menos porque no siempre es posible establecer una
definición cuantitativa de modo directo de un concepto o de un constructo. En estos casos, que suelen
ser los más comunes en ciencias sociales, la definición se realiza incluyendo en ella otras variables
cuantitativas. Por ejemplo, la velocidad de un objeto es igual al espacio recorrido en relación al tiempo
empleado. Podemos medir el tiempo y el espacio directamente porque ya disponemos de escalas
numéricas precisas para ello, cuya relación matemática nos ayuda a medir la velocidad. Un ejemplo en
educación -bastante discutible por cierto viene representado por la ecuación de rendimiento utilizada
expresamente para la evaluación de la reforma de las Enseñanzas Medias (Alvaro Page et al. 1988,26 y
ss.). Según sus autores, el rendimiento está en función del tipo de enseñanza, definido por relaciones
aditivas y multiplicativas entre variables aptitudinales, actitudinales, personales, familiares, contextuales y
didácticas. (Véase cuadro n0 1). Aquí, y una vez aceptada dicha ecuación, falta seleccionar los


instrumentos de medición que traduzcan cuantitativamente todas y cada una de las variables seleccio-
nadas.


7
La escala puede ser nominal (a través de etiquetas como progresa adecuadamente), U ordinal (por ejemplo, ‘el primero de la
clase o el ‘último de la clase’): no obstante, son las escalas numéricas (o cardinales) las que se aplican previamente a cualquiera
de las otras escalas: y, en este sentido, parecen mucho más básicas y fundamentales.

----------------------- Page 6-----------------------

R= f (E)


R= f (Ap + Ac + Pe + Fa + Co + Di.


R= f (Ap + Ac + Pe + Fa + Co + Di) + (Ap, Ac) + (Ap, Pe) +
(Ap, Co) + (Ap, Di) + (Ac, Pe) + (Ac, Fa) + (Ac, Co) +
(Ac, Di) + (Pe,Fa) + (PeFa) + (Pe, Co) + (Pe, Di) +
(Fa, Co) + (Fa, Di) + (Co, Di).


R= Rendimiento Ap= V. Aptitudinales Ac= V.Actitudinales


E= Tipo de Enseñanza Pe =V.Personales Fa=V.Familiares
Co=V. Contextuales, Di = V. Didácticas


Cuadro n0 1. Ecuación de Rendimiento utilizada en la Evaluacion de la


Reforma de Enseñanzas Medias.


Así pues, las definiciones cuantitativas se constituyen como reglas por las que asignamos
acontecimientos fácticos, empíricos y observables, a la variable definida. O como dice Bunge, un
concepto, una cualidad “recibe interpretación objetiva cuando se establece una regla que asigna a un
signo un objeto físico (cosa, proceso, etc.) tanto si el objeto está o no bajo la observación como si la
relación de referencia la satisface actualmente la pareja signo-objeto” (1972, 116).
Pero la cosa todavía es más complicada. Basta con darnos cuenta que no podemos cuantificar un
concepto o una variable, a menos que no sepamos o hayamos delimitado las ‘variables numéricas que
se relacionan’ con lo cuantificable. La cuantificación, por lo tanto, precede a la medición (Bunge,
1969,769); la primera, antes que nada, es una operación conceptual, en la que está implicada la delimita-
ción del concepto u objeto evaluado, e incluso teorías relacionadas con el mismo y valores subyacentes,
mientras que la segunda es una ‘operación empírica’.
Sin embargo, cuando sustituimos la evaluación por la calificación, estamos haciendo dos cosas
discutibles: Primero, estamos obviando la necesaria clarificación conceptual que toda calificación
supone, centrándonos exclusivamente en la operación empírica. Si, por ejemplo, aceptamos que los
juicios admisibles para la evaluación (en su acepción estrecha) son los que corresponden a una escala
numérica que va del suspenso al sobresaliente (como en la fig. n0 2), se requiere que podamos


establecer ‘conceptualmente’ a qué llamamos suspenso o a qué llamamos ‘sobresaliente’. La respuesta,
y he aquí el problema, suele ser: “llamamos suspenso a una puntuación inferior a cinco según la prueba
(o exámen o control) X”. Con ello, tergiversamos el juicio de valor, reduciéndolo al dato o a la medición
empírica y soslayamos lo que debería ser una de las responsabilidades docentes fundamentales en la
evaluación del alumnado: el análisis conceptual de lo que significa adquirir conocimiento en la escuela.
Algo que nos llevaria, con toda seguridad, no sólo a discutir, entre otras cosas, la idea de aprendizaje
que subyace a nuestro proceso de ‘evaluación’ sino también la idea de enseñanza y de conocimiento con
los que se relaciona 8.


Esta es una cuestión que puede aplicarse a la ecuación de rendimiento arriba citada. Como puede
comprobarse, ella misma supone una visión de la escolaridad; aunque dicha visión no aparezca
sustentada conceptual y argumentativamente sino oculta en el entramado cuantitativo. Esto quiere decir
que, cuando se ha evaluado la reforma de las EE.MM. haciendo uso de dicha ‘definición cuantitativa’ y


8
Esta cuestión ha sido criticada abiertamente por Barbier (1993,65): “Ese carácter "factual" de los datos de referencia tiene como
consecuencia importante fundamentar buena parte del discurso, y sobre todo de la ideología producida, en torno a la evaluación.
Por razones de ocultación de las apuestas sociales presentes en el acto de evaluación, esta ideología se ha constituido
ampliamente como una ideología de los hechos, de la objetividad. Un Indice de esa ideología es, por ejemplo, el desarrollo, a
propósito de la evaluación, de importantes instrumentos metodologicos, esencialmente estadisticos, de constitución de los datos,
aun cuando su interés y función operatoria no son siempre evidentes. A nuestro juicio, el desarrollo de tal ideología, tan contraria a
los actos reales de evaluación, no es posible de hecho más que apartirde esestatusde los datos de referencia de la “evaluación”.

----------------------- Page 7-----------------------

de unos instrumentos de medición compatibles con la misma, probablemente se ha estado utilizando un
modelo de reforma y de enseñanza secundaria, no necesariamente relacionado con lo que los docentes,
el alumnado, los centros y los ‘apoyos’ administrativos y los documentos de reforma, han planteado y
desarrollado en la práctica. En la medida en que quienes han ideado dicha ecuación de rendimiento no
hacen explícitos los fundamentos conceptuales que les subyacen, la afirmación anterior es incontestable.
En segundo lugar, al utilizar un instrumento o una prueba como definición cuantitativa, o dicho de otra
manera, como el único sustrato razonable de la calificación, confundimos evaluar con administrar una
prueba o utilizar un instrumento; y esto es algo que, desde luego, hacemos cotidianamente cuando, por
ejemplo, aceptamos que conocer matemáticas, en un momento determinado de la escolaridad, significa
superar o contestar correctamente a ciertas preguntas o problemas en una prueba matemática que
hemos elaborado. Pero aquí ya es necesario entrar a analizar el concepto de “test", suficientemente
genérico como para englobar a los de prueba y examen.
Evaluación versus test.


Es bien conocido que un test no es más que un instrumento psicométrico de medida9, aunque en


educación puede ser entendido como la selección de cuestiones o situaciones (ítems) de un dominio de
contenido o de un universo de interés (Madaus, 1988). Desde sus orígenes a finales del siglo XIX, los
tests han sido considerados como los instrumentos más objetivos, válidos y fiables, es decir, científicos,
de medición de características psicológicas y dominios educativos como la inteligencia o los
conocimientos académicos (Gould, 1984; Madaus, 1985a, 1985b, 1988; MacDonald, 1988b).


9
Cronbach (1972, 49) señala que un ‘test’ “es una técnica sistemática que compara la conducta de dos o más personas”; esta
definición más orientada a la psicometria psicológica, también es válida igualmente para educación, porque existe una marcada
tendencia a comparar los resultados del alumnado, ya sea para identificar el Indice de dificultad de la prueba, o, más socialmente,
para clasificarlos jerárquicamente.

----------------------- Page 8-----------------------

Gran parte de la tecnología que los docentes utilizan para obtener información sobre el aprendizaje del
alumnado puede ser denominada ‘tests’, aunque en ocasjones se utilicen otras como examen, prueba de
evaluación y control. Lo que une a estas denominaciones se encuentra en quella lógica general de su
‘construcción’ es idéntica. Supongamos que queremos elaborar una prueba o un ‘test’ aritmético para
‘medir’ el aprendizaje matemático que nuestros alumnos/as han podido realizar en el primer ciclo de
primaria. Sabemos que las dimensiones básicas de la aritmética trabajadas han sido la suma, la resta, la
multiplicación y la división; pues bien, lo que corresponde, siguiendo dicha lógica de construcción es
0
seleccionar ciertos ítems-problemas de cada dimensión, por ejemplo cinco, como muestra la figura n 3.
No obstante, existe una diferencia notable. Al contrario que las pruebas estandarizadas, especialmente
diseñadas para ordenar a los estudiantes o indicar su posición en una población en relación a una habilidad mental


o unos conocimientos académicos, las pruebas que se elaboran en el trabajo cotidiano de clase son
especialmente diseñadas para asegurar si el alumno/a ha adquirido (domina) una serie de objetivos de
enseñanza (formulados como aprendizajes concretos). Estas suelen ser denominadas pruebas criteriales
(Romberg, 1992).
A pesar de su constante y creciente utilización, los tests y las pruebas en general, plantean una serie de
dificultades que es necesario tener en cuenta. No me extenderé aquí en todas ellas, pero si quisiera
abordar algunas de las queme parecen más importantes, en tomo a tres conjuntos de dificultades.
(Véase infra).
En primer lugar, ciertas dificultades tienen que ver con la lógica de la construcción. Como acabamos de
ver retomando el ejemplo anterior, no se trata simplemente de seleccionar, sino de asegurarnos que la
selección es representativa del universo de problemas y conocimientos aritméticos que conforman la
aritmética matemática (general si se trata de una prueba estandarizada; particular, si es criterial), pero
esto es sólo un apartado de la validez de un test10. Como ha señalado Messick (1989a), la validez no


está asegurada a menos que no tengamos en cuenta otras cuestiones importantes en su interpretación y
su utilización, como las implicaciones valorativas del mismo, las consecuencias sociales y la utilidad


10
Dicho de modo más técnico: la validez de un test estriba en" ‘el gradoen elque unainferencia ¡particular y cualquier descripción o
decisión resultante sobre un individuo o institución, hecha
en razónde losresultados es apropíada o significativa. Noexiste-añade Madaus- unavalidez general de los test, ni un test es válido
en abstracto’ (Messick 1989b págs. 32-33). No siempre lavalidez hasido el criterio de rigormás importante: durante gran parte de
lahistoria de la psicometría hasido lafiabilídad (constanciaen lamedida) laque ha ocupado un lugar privilegiado. Por otro lado, la
validez no siempre ha sido concebida de la misma manera.

----------------------- Page 9-----------------------

concreta. Lo que nos lleva al siguiente grupo de problemas.
En segundo lugar, aunque las preguntas que seleccionemos puedan ser representativas, la concepción
de conocimiento matemático u otro tipo de conocimiento, puede llegar a ser perfectamente inadecuada.
Como han señalado algunos autores, pruebas típicas de este tipo como las de elección múltiple y ciertas
formas de exámenes escritos, parecen estar directamente diseñadas para suprimir el pensamiento
complejo y la creatividad, fomentando la reproducción y la memorización episódica, en lugar de la
organización significativa e interrelacionada de los conceptos y los contenidos; además de, incluso, llevar
a confusión e implantar esquematismos rígidos en la mente del alumnado (Stake, 1973; Romberg, 1992;
0
Newmann, 1992). Un buen ejemplo de ello se encuentra en las tres preguntas criteriales del cuadro n 2,
que hablan por sí mismas.
En tercer lugar, a veces olvidamos, arrastrados por la costumbre o por la aparente objetividad de ciertas
pruebas que se nos ofrecen11 que un test o una prueba o exámen no son más que instrumentos de


medición, que recogen información muy determinada y limitada sobre un individuo o un grupo de
individuos. No nos señalan, ni pueden, las causas que subyacen a las respuestas (positivas o negativas)
del alumnado, es decir, las razones educativas por las que ciertas puntuaciones son altas o bajas, ni nos
informan u orientan sobre la solución o mejora de los problemas que puedan detectarse. El fracaso de un
alumno/a en un examen de matemáticas no informa sobre las causas ni sobre la manera a través de la
cual podamos evitar dicho fracaso; tan sólo nos dice que no ha respondido correctamente a los
problemas y preguntas planteadas... y nada más.


¿A qué llamamos Evaluación?


Después de este breve repaso a dos conceptos que con mayor o menor intensidad se encuentran en el
vocabulario práctico de muchos docentes, ya podemos indicar algunas conclusiones. Como decíamos
antes, construir y administrar una prueba no es necesariamente sinónimo de evaluación y tampoco lo es
utilizar dicha prueba como operación empírica con la que juzgar el aprendizaje de un alumno/a. Si en su
acepción estrecha evaluar significa juzgar la calidad del servicio educativo (un curso escolar en
matemáticas, por ejemplo) a través del impacto y la repercusiones en los receptores del mismo, entonces
requerimos algo más que instrumentos o escalas numéricas para detectar dichas repercusiones y dicho
impacto. Es necesario que los docentes realicen un análisis profundo de lo que entienden por


11
Lamentablemente, tenemos tendencia a primar, o incluso confundir, a objetividad sobre la imparcialidad. Por otro lado, como ha
afirmado Cronbach (1980,11> “La cualidad cientifica no es el estándar más importante; una evaluación debería ser comprensible,
correcta, completa y creíble a todos los participantes e implicados”.

----------------------- Page 10-----------------------

Cuadro n 0 2. Ejemplos de preguntas planteadas en pruebas de evaluación criterial para la


enseñanza primaria. Tomado de F. Rivas y P. Alcatud (1989,498,600,609).


conocimiento, aprendizaje y enseñanza y es necesario también, el análisis del contexto escolar en el que
se desarrolla el alumnado. Pero incluso, todo ello, puede ser insuficiente en razón de que cuando
hablamos de incidencia en los receptores olvidamos, con frecuencia, que aquí también se encuenta
implicada la calidad propia del servicio, algo que depende de los docentes, en primera instancia, aunque
no solamente de ellos/as. No basta pues con mejorar nuestro conocimiento sobre el contexto ecológico y
la evolución del alumno con respecto al conocimiento, es imprescindible un análisis serio sobre la calidad
de enseñanza que los docentes mismos ofrecen. “Para evaluar hay que comprender. Cabe afirmar que
las evaluaciones convencionales del tipo objetivo no van destinadas a comprender el proceso educativo.
Lo tratan en términos de éxito y de fracaso... el docente debería ser un crítico y no un simple calificador”
(Stenhouse, 1984,156).

----------------------- Page 11-----------------------

Es necesario conocer lo que va a ser juzgado, pero el conocimiento es insuficiente. Porque formular un
juicio de valor, y no un juicio numérico, es un proceso cognitivo mucho más complejo que relacionar,
como decíamos antes, puntuaciones con calificaciones. Ambos conceptos o accíones se encuentran en
planos intrínsecos distintos. Creer que las puntuaciones (calificaciones) son los únicos elementos nece-
sarios para formular un juicio de valor, supone desconocer u ocultar la participación normalmente
inconsciente de otros elementos como los valores que sustentamos, nuestras concepciones educativas y
docentes. La información de la que podamos disponer sirve para enriquecer nuestro juicio, no para
sustituirlo o hacerlo supérfluo. Sin embargo, no se trata de aumentar la información disponible, o no sólo.
Es un error creer que la cantidad de información sobre el alumnado constituye una condición suficiente
del juicio, cuando en realidad es únicamente una condición necesaria.
Está claro que el juicio se alimenta y nutre de informaciones, pero no es la información disponible.
Formular unjuicio debería ser entendido como un proceso social de construcción, articulado en el
diálogo, la discusión y la reflexión, entre todos los que, directa o indirectamente se encuentran implicados
en y con la realidad evaluada (Angulo, Contreras, Santos 1991). Sólo así podemos esperar que la eva-
luación misma se convierta en un proceso de aprendizaje, que como dice Cronbach, constituye el
auténtico éxito. “El evaluador es un educador; su éxito debe serjuzgado por lo que otros aprenden”
(Cronbach 1980, 11).
Puede que el primer paso en esta dirección se encuentre en no confundir, en nuestro lenguaje yen
nuestro entendimiento, los distintos conceptos que hasta aquí hemos ido explicando, tal como señala la
0
fig. n 4. Pero es en última instancia a nuestra acciones ‘evaluadoras’ donde debemos remitirnos para
juzgamos a nosotros mismos, y descubrir el valor educativo de lo que hagamos.

----------------------- Page 12-----------------------

EVALUACIÓN EDUCATIVA Y PARTICIPACIÓN DEMOCRÁTICA 12


J.Félix Angulo, José Contreras y Miguel A. Santos13


Universidad de Málaga; Universidad de Barcelona


“Una Evaluación que pretenda ser formativa respecto a un Programa en desarrollo, así como informativa
con audiencias externas, tiene que desarrollar una relación con el Programa que sea colaborativa, crítica
y constructiva.
Una gran parte de su potencial formativo se basa en la calidad del diálogo
entre participantes y evaluadores; es decir, en un intercambio de información e interpretaciones abierto,
igual, tolerante y responsable.
En semejante clima, la evaluación puede tanto ser educativa como puede, a su vez, ser educada”.
B.MacDonald e l. Stronach(1988)


INTRODUCCION.


Si bien en nuestro país evaluación ha significado hasta ahora, en lo que se refiere al mundo de la
educación, aquello que tenía que ver con las formas de averiguar y sancionar el aprendizaje de los
alumnos, cada vez más nos estamos encontrando con un significado nuevo, reflejo de una actividad que,
aunque en otros países cuenta ya con una cierta tradición’, en el nuestro es aún un terreno de novedad.


Nos estamos refiriendo a la evaluación educativa, entendida como evaluación de los programas o de las
actividades y contextos educativos. En este sentido, la evaluación educativa, como algo que va más allá
de la evaluación de alumnos, remite, por tanto, a la evaluación de la educación14.


Que hasta ahora no haya sido ésta una forma de entender el significado de este término, ni una actividad
muy desarrollada, no quiere decir que vaya a seguir así. Debido entre otras razones al particular
momento socio-político en el que nos encontramos, los procesos de evaluación educativa que se han
realizado y que se van a realizar empiezan a cobrar una popularidad y una expectación general, de la
que hasta ahora no habían gozado en nuestro país, y no sólo porque la evaluación venga especialmente
señalada en los documentos de trabajo de la Reforma educativa, sino porque historicamente ésta se
encuentra conectada de forma íntima a cualquier proyecto de racionalización social (del que dicha


12 0
Este texto fue publicado por primera vez en Cuadernos de Pedagogía, n 195, septiembre 1991, pp.74-79.


13
Lo que nuestros planteamientos deben a los trabajos de Robert Stake, Barry MacDonald
y Ernest House, es más de lo que podríamos agradecerles.
‘Es evidente que lo educativo no tiene por qué reducirse a lo escolar. Englobaría, más bien,
a toda actividad, contexto o programa que tiene implicaciones educativas.


14
De hecho, es a este campo al que aquí nos queremos referir al que en el ámbito anglosajón se le denomina evaluación
(«evaluation»), refiriéndose a la medición de los aprendizajes de los alumnos con el término «assessment», término éste al que es
realmente difícil buscarle un equivalente cómodo en nuestro idioma (“tasación” o “medición” podrían ser los más parecidos, pero
nunca “valoración”, como alguna vez se ha llegado a afirmar). En cualquier caso, la cuestión no es doblegarse a la nomenclatura
anglosajona, sino reconocer que el campo de la evaluación educativa, en cuanto que evaluación de la educación, no tiene por qué
identificarse con la evaluación de los alumnos.

----------------------- Page 13-----------------------

Reforma educativa es únicamente una parte) y engarzada a su vez con los intereses, necesidades y
requisitos de las sociedades capitalistas occidentales.
Pero la evaluación no es una actividad neutral, por más que sean los así llamados expertos y
especialistas quienes la realicen y la lleven a cabo. La evaluación, además de legitimar ciertas políticas
educativas y desacreditar otras, puede llegar a convertirse en uno de los mecanismos más poderosos de
control social y educativo.
Tradicionalmente, los procesos de evaluación se han puesto al servicio de intereses que, encubiertos en
la retórica del bien común y social, no han hecho más que imponer necesidades y preferencias
particulares -crudamente tecnocráticas15- paralizando, burocratizando y simplificando, en muchas


ocasiones, la propia realidad


educativa, con el costo añadido de reducir hasta su desaparación las propuestas educativas más
creativas e innovadoras y obviando, prescindiendo de y anulando la voz de aquéllos que están
directamente implicados en las mismas realidades evaluadas. Las administraciones educativas y las
administraciones públicas en general nunca se han visto libres de la tremenda tentación de utilizar las
evaluaciones de esa manera. No estamos seguros, desde luego, de que la administración educativa
española vaya a ser la excepción.
Sin embargo, nosotros creemos que la evaluación educativa puede tener otro sentido y otra realidad,
orientada hacia el aprendizaje social, hacia la toma de conciencia, la participación, el conocimiento y la
responsabilidad de todos y cada uno de los que ayudan, contribuyen y colaboran a la construcción del
sistema educativo y de la sociedad en general.


1. ¿QUÉ ENTENDEMOS POR EVALUACIÓN EDUCATIVA?


Entendemos por evaluación educativa la formulación de un j uicio sobre el valor educativo de un centro,
un proyecto curricular, la organización de un aula, un libro de texto, o de cualquier otra realidad. Es decir,
una evaluación siempre se interroga e intenta explicitar el valor educativo que una realidad, como las
señaladas, posee o ha ido desarrollando.
Normalmente, nos sentimos realmente intranquilos16 ante cualquier propuesta de evaluación de nuestras


actividades, pues los temores, a veces sólidamente fundados, nos indican que dichos juicios pueden no
ser más que una serie, en ocasiones difícilmente justificable, de afirmaciones categóricas e irrefutables
sobre lo bueno y lo malo de un programa, una actividad o una institución, es decir, sobre nosotros
mismos y la realidad que hemos contribuido a crear.
Quién debe ser el responsable de la formulación de esos juicios y en qué basarlos, es el doble problema
que nos asalta desde el principio cuando se maneja y defiende una definición de evaluación educativa
como la arriba presentada. Démonos cuenta de que no son dos problemas independientes. Vistos en su
profundidad real las respuestas que podamos encontrar para uno de ellos, nos lleva a tomar de-
terminadas posturas con respecto al otro. La contestación a ambas cuestiones aparecerá, por
consiguiente, necesariamente entrelazada.


15
Sin entrar en otras consideraciones de mayor calado, queremos referirnos aquí con tecnocracia a aquella manera de regir la
vida politica en donde los argumentos no se justifican en su valor ideológico (ya sea un futuro deseado, o una concepción de
asociedad ), sino en su procedencia del mundo de los especialistas. De este modo, al presentarse como argumentos técnicos,
parecen estar desprovistos de intereses y preferencias, para ser necesarios y neutrales. Véanse al respecto los trabajos de House
(1978,1986), Popkewitz (1981) y los más especializados de House (1974, 1979 y 1988b), Noble (1977), Silva y Slaughter (1984)
yAngulo (1989,1991)sobre el papel de los expertos, el modelo de ingeniero y la estructura del pensamiento tecnocrático en
general, así como su repercusión en la educación, en particular Véanse también MacDonald (1976), House (1980,1 988a), Norris
(1990).


16
Como ha señalado no sin cierla ironía House (1973)," ‘evalúen el trabajo de unevaluador y vean cómo reacciona.”

----------------------- Page 14-----------------------

Intentemos dar respuesta al primer problema: ¿Quién es el responsable de la formulación del juicio?
Supongamos que, por unas u otras razones, atribuimos tal potestad a personas o grupos. como por
ejemplo, un ‘equipo externo de evaluación’ o ‘los promotores de laevaluación 17.


En el primer caso, siempre podemos decir, que quién más cualificado que los mismos evaluadores
‘externos’ e ‘independientes’ para emitir dicho juicio; en el segundo, podemos afirmar, que al fin y al
cabo, una vez obre el informe en su poder, deberían ser los responsables ‘máximos’ (esto es, los
patrocinadores18) los que tendrían la encumbrada misión de ‘enjuiciar’.


Nosotros creemos que dando una u otra respuesta, estaríamos aceptando demasiadas cosas sin
discutirlas, o al menos sin ponerlas en cuestión. Veamos.
En primer lugar, podríamos confundir el poseer un punto de ‘observación’ privilegiado con respecto a
otros sujetos y su actividad, con la capacidad de formular juicios de valor. Está claro, y en alguna medida
ésta es su misión original, que los evaluadores tendrían que desarrollar dicho punto de vista ‘privilegiado’
a través de las observaciones, las entrevistas, las discusiones informales con la gente, los cuestionarios.
etc., pero no deberíamos confundir este hecho con la cuestión mucho más compleja de enjuiciar.
Un juicio, al contrario que un experimento, no es algo que pueda ser calificado simplemente como
‘verdadero’ o ‘falso’; un juicio de valor puede, y debe, aspirar a la credibilidad y, al convencimiento. Las
observaciones, las entrevistas, en fin, los datos que un equipo de evaluación hayan podido recoger, son
elementos importantes para la formulación del juicio; son, por decirlo de una manera muy gráfica, las
piezas del juego de ajedrez, pero no el juego en sí.
Un juicio de valor (y aquí se nos entrelaza ya el segundo problema asumido: en qué basar el juicio), se
alimenta de dichos datos, pero nunca unjuicio ‘es’ los datos que maneja, porque la formulación de un
juicio no es un proceso demostrativo ni es el resultado de una demostración. Es, por el contrario, el
proceso por el que apreciamos y discernimos el valor (en este caso educativo) de acciones y
realizaciones; un proceso profundamente humano que se nutre y se articula en el diálogo, la discusión y
la reflexión de todos aquellos que están implicados directa o indirectamente en la realidad evaluada.
De otra parte, las actividades humanas no se reparten fácilmente en categorías tan simples como ‘bueno’
o ‘malo’ y ni siquiera en categorías intermedias que podamos ponderar con facilidad. Y ello no se debe
tanto a que la realidad social sea más compleja que la realidad ‘natural’, como a que las personas, los
actores sociales, nos diferenciamos unos de otros, entre otras razones, por la forma y el contenido con el
que valoramos, sentimos, y apreciamos las distintas actividades y empresas humanas, ya que no todos
percibimos nuestra realidad, nuestras acciones y realizaciones de la misma manera, ni todos vemos,
desde luego, lo mismo en ellas.
Por último, podríamos estar confundiendo también el hecho, en relación con lo anterior, de poseer
autoridad y responsabilidad administrativa con la capacidad de ‘enjuiciar’. Con ello borraríamos de un
plumazo algo absolutamente esencial: los grupos humanos, las organizaciones, los procesos sociales de
relación e interacción, están, como decíamos arriba, fuertemente determinados por la multitud de puntos
de vista, intereses, deseos y necesidades que configuran cualquier proceso social. Al menos en este
sentido, las realidades sociales son ‘pluralistas’19.


Cuando confundimos ‘autoridad’, ‘jerarquía’ y ‘reponsabilidad’ con capacidad de juicio, estamos pasando
por encima no sólo de esa multitud de ‘pequeños juicios’ que merecerían ser oídos, sino que estamos
subvirtiendo la capacidad que los mismos grupos humanos tienen para comprender y cambiar su
realidad de forma colectiva, sin delegar esta capacidad en otros. Tampoco resulta tan evidente que un
grupo de evaluadores, de expertos, por el sólo hecho de serlo, posean las categorías o los criterios
‘correctos’ y ‘mágicos’ de valoración, que estipulen con validez y rigor el valor de las cosas, acciones,


17
Para nuestra argumentación resulta del todo indiferente si incluimos cualquier otro grupo
humano implicado en el programa, ya sea éste de profesores, alumnos, padres de alumnos, directores de centro, coordinadores, u
otro cualquiera.


18
Dicho de otra manera: los que han contratado y pagado por la evaluación; casi siempre la administración educativa.
19
Esto es algo que ya advirtió MacDonald (1976) en referencia al modelo de evaluación por objetivos: “La teoria y la práctica del
modelo de evaluación por objetivos están, de este modo íntimamente ligados al punto de vista americano de la sociedad, y a una fe
americana en la tecnología. Las sociedades pluralistas encontrarán que es dificil utilizar este modelo, Las sociedades unificadas lo
usarán y descubrirán que son pluralistas (pág. 471).
La importancia de promover el ‘aprendizaje social’ a través de la evaluación ha sido claramente señalado por Cronbach et al
(1985).

----------------------- Page 15-----------------------

interacciones, logros y fracasos, de las instituciones, los grupos o los individuos.
Creemos que el juicio sobre la calidad de una realidad social no puede ser ni delegado ni sustraído a los
sujetos implicados; el juicio es, en última instancia y como sugeríamos arriba, un proceso de
construcción, y la riqueza de dicha construccion estriba, a su vez, en que se convierta en un aprendizaje
colectivo, en un diálogo y una reflexión conjunta, un proceso a través del cual los sujetos puedan adquirir
la capacidad y la responsabilidad para cambiar y decidir sobre la realidad inmediata’.
Una evaluación educativa debería contribuir y animar a que alumnos, profesores, responsables,
coordinadores, patrocinadores, padres de alumnos, en fin, todos aquellos que directa e, incluso,
indirectamente estén implicados en la realidad evaluada, encuentren un espacio teórico y ético en el que
discutir, dialogar y profundizar aún más, si cabe, en su compleja, rica y en ocasiones sorprendente
realidad socio-educativa.


2. ¿POR QUÉ UNA EVALUACIÓN INDEPENDIENTE Y EXTERNA?


Cualquier realidad educativa, ya sea un centro escolar, unos cursos de formación de profesorado, un
aula, un centro de profesores, una universidad, el trabajo de un profesor, o cualquier otra, tiene por
objetivo absolutamente básico servir ala sociedad, papel que deberían cumplir con independencia de que
el origen de su financiación esté en fondos públicos o privados. Como servicio a la sociedad, resulta
susceptible a las exigencias y demandas de conocimiento público sobre la calidad (esto es, el valor) del
servicio que está prestando. Los ciudadanos, cualquier ciudadano, de esta manera, están en su perfecto
derecho, en una sociedad democrática, de pedir razones y explicaciones sobre la calidad, las
aspiraciones y los logros del servicio que se esté realizando20.


Explícita e históricamente, ésta ha sido la justificación para proponer evaluaciones externas que, se
supone, tendrían que mostrar la ‘calidad del servicio’ analizado, con lo que se podría, entonces,
determinar no sólo los cambios pertinentes, sino también la posibilidad de cortar, reducir, o ampliar las
subvenciones y el apoyo económico, técnico y humano. Visto así, las ‘evaluaciones externas han podido
cumplir un papel que, como decíamos antes y en calidad de ‘trabajo de expertos’, se encuentran
implicadas en una concepción fuertemente tecnocrática del cambio social.
No queremos entrar a discutir en profundidad tal concepción, además de lo que arriba hemos apuntado;
pero nos gustaría afirmar que las demandas y exigencias, en una sociedad democrática, por la calidad
del servicio que se está brindando a los ciudadanos, es claramente legítima y necesaria, aún
21
reconociendo que en su nombre se ha podido cometer más de un desaguisado .
Por ello estimamos que la realización de evaluaciones externas e independientes cuyos evaluadores no
estén directamente implicados en las circunstancias y desarrollos de la realidad evaluada pueden, a la
vez, dentro de las dificultades metodológicas y humanas conocidas, cumplir con dichas demandas y
exigencias democráticas y sociales genéricas; es decir, movilizar preguntas, cuestiones, informaciones y
reflexiones sobre la realidad analizada, en coordinación y colaboración con los implicados, que es otra
manera, no menos importante, de responder a las demandas y exigencias sociales, situándola, además,
fuera de los parámetros tecnocráticos.
Pensamos, pues, que la realización de evaluaciones externas e independientes puede asegurar el
funcionamiento democrático de una necesidad social de primer orden como es la de conocer el valor del
servicio que las instituciones y los grupos humanos están prestando al conjunto de la sociedad.
Dicho esto, habría que apuntar ciertas matizaciones: Primero, la sola calificación a una evaluación de
‘externa’ e ‘independiente’, sin mayores especificaciones. no asegura absolutamente nada con respecto
a la ‘calidad’ y ‘ética’ de la misma evaluación. Estamos convencidos de que los adjetivos ‘externo’ e
independiente’ no dicen nada si al menos no se explicita su significado. En lo que a nosotros respecta,
dichos adjetivos deben ser traducidos en forma de los criterios de evaluación que más abajo se indican22.


20
Demandas y exigencias que pueden orientarse a otros servicios sociales, además del educativo, como por ejemplo el sanitario,
el judicial, la policía y seguridad ciudadana o los transportes


21
Tenemos que referirnos aqui tambien a las obras de McLaughling (1975) y House (1 988a).


22
Un evaluador puede vender la retórica externos e ‘independiente’ al mejor postor, a lo que viene aserio mismo, a aquellos que
tienen poder para sesgar, manipular y comprarla evaluación. Con ello, también un evaluador ‘exierno’ e independiente se puede
corromper y corromper su trabajo.

----------------------- Page 16-----------------------

Segundo, y teniendo en cuenta lo anterior, quisiéramos enfatizar el carácter de ‘externalidad’ e
‘independencia’ del evaluador, habida cuenta de que la tendencia en los países occidentales con mayor
tradición que el nuestro en este tema, se ha escorado fuertemente, en los últimos años, hacia
‘evaluaciones internas’, que las propias administraciones realizan con la utilización de sus propios
23
‘expertos’ . En este tipo de evaluaciones en las que se confunden peligrosamente el promotor (y
financiador) de la innovación, por ejemplo, con el evaluador de la misma, las tentaciones de todo tipo que
se producen, aunque especialmente de legitimidad política, pueden llevar a la larga, no sólo al descrédito
(algo a lo que cualquier evaluador está expuesto) sino, lo que es mucho más grave, a la corrupción
misma del proceso.
Entre otras cosas, los intereses políticos y económicos puestos en juego suelen ser tan importantes que
las administraciones (o los patrocinadores privados) no están, normalmente, dispuestos a perder un
ápice de aceptación política, obligando a que el informe de evaluación muestre una imagen interesada
(positiva o negativa) de la realidad evaluada.
Tercero, la defensa que hacemos de evaluaciones ‘externas’ e ‘independientes no ha de ser entendida
como desacreditación de las necesarias auto-evaluaciones que los protagonistas de las propias
realidades educativas puedan llevar a cabo; porque podría parecer que al insistir en evaluaciones
externas estamos queriendo afirmar que las realidades evaluadas y los individuos en ellas
comprometidos son incapaces de conocer, comprender, analizar y criticar sus acciones y decisiones con
corrección e imparcialidad.
Nosotros creemos que la elección entre una y otra es falsa, como es contraproducente convertir en mito
la evaluación externa, en razón de una falsa concepción según la cual las realidades educativas carecen
de la autonomía, la preparación y la capacidad para realizar autoevaluaciones de su trabajo. Es
necesario reconocer que cada una tiene distintos cometidos, momentos y ritmos, así como cada una
posee y pone en funcionamiento orientaciones y valoraciones propias.
La realización de una evaluación independiente no exime de la práctica de auroevaluaciones porque una
de las cosas a las que aspira la evaluación educativa que proponemos es, como ya hemos afirmado, a
facilitar los procesos de auto-aprendizaje y, por lo tanto, de autoevaluación, a crear los vínculos y
canales que mejoren las formas de intercambio entre distintos sectores, ya proporcionar y ayudar a crear
procedimientos de análisis y valoración que mejoren la comprensión y el juicio de los participantes.
La evaluación educativa, externa e independiente que defendemos en este escrito, debería tener como
uno de sus resultados sociales más importantes la implantación y el desarrollo de procesos de
autoevaluación allí donde se lleve a cabo24.


Pero también aspira, y esto no debe ocultarse, a que aumente el conocimiento público de los programas
y actividades que desarrollan las instituciones públicas. Pensamos que las instituciones educativas no
debieran quedar al margen de ello, tanto por su responsabilidad contraída con la sociedad como por la
responsabilidad que, en contrapartida, la sociedad contrae en relación a su mejora, atención y pro-
moción, en aras del propio desarrollo social.


3. CARACTERÍSTICAS DE LA EVALUACIÓN EDUCATIVA.


Según lo dicho, podemos señalar las siguientes características como definidoras del tipo de evaluación
educativa que proponemos:
a) Es una evaluación que entiende que ni la verdad ni la valoración correcta están en posesión de grupos
o personas privilegiadas, ya sean los evaluadores, los patrocinadores o los sujetos implicados en la
realidad evaluada. La verdad y la valoración es asunto de construcción democrática de todos, porque en


23
Este fenómeno ha sido claramente señalado por House (1990) quien afirma, no sin cierta ironía: “durante la década de los
ochenta... la evaluación ha llegado a ser demasiado importante como para dejarla en manos de los evaluadores, por lo que los
grandes aparatos burocráticos han desarrollado sus propias agencias de evaluación (pág. 24).


24
Esto puede venir facilitado si la iniciativa de que se lleve a cabo una evaluación externa parte de los propios protagonistas e
implicados. Este hecho favorece la exploración del investigador y la prolundización en el análisis de Ja realidad a través de la
discusión democrática entre evaluadores y ‘participantes’.

----------------------- Page 17-----------------------

25
su búsqueda no puede haber más que participantes .


b)Es una evaluación en la que no es el evaluador el que juzga, sino que facilita que sean los implicados
los que lo hagan. Desde esta perspectiva, una evaluación se hace preguntas sobre el sentido y el valor
de las realidades objeto de evaluación, con el fin de orientar la recolección de las evidencias,
informaciones y puntos de vista que permitan a los interesados ampliar y matizar su comprensión,
profundizar en su reflexión, elaborar apreciaciones más informadas y dirigir sus actuaciones futuras de
forma colectiva y en colaboración.
e)Es una evaluación que no pretende convertir las complejidades naturales en simplificaciones que
falsifiquen la realidad, con la justificación de que simplificando es más fácil establecer conclusiones o
emitir juicios (lo que no es del todo cierto). Si bien la simplificación parece que hace más fácil la
valoración, también lo es que la hacen más errónea e injusta.
d)Es una evaluación que no pretende caer en la mística de los números o de las estadísticas26 aunque


pueda utilizar mediciones y procedimientos estadísticos de análisis de datos. Es consciente de que la
tecnología psicométrica es muy pobre con respecto a las esperanzas y responsabilidades de todo tipo,
pero especialmente políticas y de selección, que pretenden legitimarse en ella27. Mediciones cuantitativas


y análisis estadísticos pueden contribuir a comprender las realidades evaluadas, pero no pueden evitar
simplificar, en muchas ocasiones hasta el absurdo, la riqueza y profundidad de los procesos educativos
de enseñanza y aprendizaje.
e)Es una evaluación que se siente más comprometida con la utilización de procedimientos
metodológicos sensibles a la riqueza, complejidad estructural e interacciones que se producen en toda
realidad social, así como con procedimientos suficientemente sensibles como para captar las
valoraciones, aspiraciones, interpretaciones e intereses de las personas tal como son expresadas por
ellas mismas, sin presuponerlos de antemano28.


f)Es una evaluación que parte de la clara explicitación de los criterios éticos que conformarán los límites
de su desarrollo. Con ello pretende no sólo asegurar su aplicación democrática, sino mantener en lo
posible el difícil equilibrio entre el derecho a la privacidad y la necesidad de conocimiento y
responsabilidad social de aquellos que están implicados en la realidad evaluada. Quiere mantener
también con ello el nivel de justicia democrática necesario con respecto a la entidad evaluada; nivel que
no depende únicamente de la corrección formal de los procedimientos o de las interpretaciones


25
Esto es algo que ha señalado claramente Habermas (1963, pág. 48). Existe una leyenda persa que afirma que los dioses en el
comienzo de los tiempos repartieron la verdad entregando a cada ser humano una par-te de ella, de formaque para reconstruirla es
preciso poner en común la parte de verdad que cada uno tiene.


26
Siedman ha afirmado (1977, pág. 415): ‘Nuestra búsqueda de la racionalidad científica y evidencia factual nos ha llevado a una
reverencia irracional por la autoridad de los números, raramente cuestionada. La cuantificación ha llegado a ser ‘de buen tono
porque contar es confortable, y la predicción es una necesidad “cientifica”. Los números parecen tangibles e innegables. Es
inevitable, entonces, que preguntas como ‘¿en qué cantidad?’ y ‘¿cuánto?’ reemplacen a preguntas sobre el ¿por qué?’, como
cuestiones clave del análisis’. Véase también el excelente artículo de Bogdan y Ksander (1980) sobre las repercusiones sociales de
las puntuaciones’ y, en general, la fascinante obra de Gould (1981).


27
Tenemos que recordar, siguiendo a Madaus (1988, págs. 31), que un test es una representación, en muchas ocasiones
extremadamente pobre, de un dominio o universo de contenido (como la física o la geografía) o de un ámbito de interés (como la
personalidad). Por ello, y esta vez siguiendo a Stake (1989), un test no nos indica lo que un alumno sabe o no sabe (excepto dentro
de los límites estrechos de la representación’ misma del test), y, por supuesto, nada dice sobre lo que un profesor tendría que
hacer en vista de los resultados, ni sobre la ‘calidad’ de la educación que los alumnos están recibiendo. Véase también sobre el
mismo tema Stake (1973).


28
La literatura al respecto es bastante considerable pero pueden consultarse en español los siguientes textos: Schwartz y Jacobs
(1984), Goetz y LeCompte (1984), Taylor y Bogdam (1984), Walker (1985), Santos Guerra (1990). No obstante, es necesario
aclarar, en contra de lo que viene siendo costumbre, que una evaluación educativa no es una ‘etnografía’. El uso de técnicas
etnográficas ha de estar siempre al servicio de las exigencias de la evaluación. En última instancia, la pregunta sobre ‘¿para qué se
emprende?’ una evaluación es mucho más importante que la pregunta sobre el ‘¿cómo?’ metodológico con el que se realiza:
además de las respuestas dadas a la primera pregunta determinan poderosamente las respuestas posibles a la segunda.

----------------------- Page 18-----------------------

generadas 29 .


g)Es una evaluación que tiene como objetivo material la publicidad de sus informes, rechazando
cualquier imposición para mantenerlos en secreto o el ocultamiento de información valiosa. Y no sólo por
el derecho de la sociedad en general a conocer el valor de las instituciones y acciones educativas, sino
porque la publicidad de los informes puede contribuir a un conocimiento más informado y menos
demagógico. Aceptar y alentar informes secretos, parciales y sesgados no alimenta más que el engaño,
el beneficio privado (aunque su receptor sea el estado y la administración pública) y la arbitrariedad
autoritaria.
h)Es una evaluación que cuidará que el lenguaje de sus informes sea accesible no sólo a los
directamente implicados en la realidad evaluada, sino a cualquier otro ciudadano interesado en el
conocimiento de dicha realidad. Por ello, no acepta que los tecnicismos formales, la mística de los
numeros, o las conceptualizaciones academicistas empobrezcan y limiten, cuando no tergiversen, la
compresión del informe. La calidad del trabajo de los evaluadores no puede cifrarse en la ilegibilidad o
dificultad de comprensión de un informe sino en la capacidad -a través del mismo- de situara los lectores
en la realidad evaluada, sus logros, sus errores, sus dificultades y sus aspiraciones.
i)Es una evaluación que se pretende educativa, de dos maneras:
1)Porque se pregunta por, e indaga, el valor educativo del programa, porque significa que el mismo
programa, a través de su conocimiento y la reflexión sobre su desarrollo, sus características, sus
circunstancias materiales, humanas y políticas,sus logros y errores, es uno de los más importantes y
directos beneficiarios de la evaluación. Pero la interrogación e indagación sobre el valor educativo de un
programa, una institución o una actividad de enseñanza, no puede basarse únicamente en la cantidad y
la calidad de los aprendizajes de los alumnos, aunque, claro es, no puede prescindir de este tipo de
información. El valor educativo depende también de un conjunto de circunstancias humanas, técnicas,
políticas y materiales que van más allá del aprendizaje de los alumnos o de los receptores del programa
30


2)Porque busca favorecer la reflexión y el debate de los implicados y su aprendizaje a partir de su propia
experiencia. Con esto queremos decir que una evaluación no puede orientarse únicamente a la toma de
decisiones políticas a gran escala, si es que alguna vez lo ha conseguido. El contenido de un informe de
evaluación ha de servir como punto de referencia para dicha discusión, alimentando y proponiendo
dudas, interpretaciones, hechos y recomendaciones para dicha reflexión y aprendizaje. Pero un informe
no debería sustituir la capacidad de juicio de los implicados, sino consolidarla y profundizarla 31.


j)Es una evaluación que reconoce que un informe de evaluación no es solamente un contenido que se
hace público; un informe de evaluación también puede crear una estructura social de relación y
participación. Es decir, la manera en que un informe se hace público y el grado de participación de los
implicados en la realidad evaluada es un elemento de primer orden para afianzar ‘socialmente la
reflexión y el aprendizaje de aquéllos.
Un informe no es la conclusión inapelable y taxativa de la evaluación; un informe crea procesos y
dinámicas sociales o las anula. En la medida en que los evaluadores sean conscientes de ello y acepten
el compromiso de que el informe y la evaluación en su conjunto deberían ayudar a la introducción y
generalización de procesos y dinámicas democráticas de conocimiento y reflexión, no sólo estarán
sirviendo a la sociedad, y enriqueciendo a los participantes, sino que estarán ellos mismos aprendiendo.


29
Sobre criterios éticos en la evaluación, véanse los trabajos de Kemmis y Robottom (1981), Simons (1989b), y el más genérico de
House (1980).


30
La reflexión en colaboración a través de lo que una evaluación ofrece, permite a los implicados pensar sobre ’cuestiones
educativas’, lo que no tiene que signiticar ’pensar’acerca de cuestiones sobre el rendimiento instructivo, la eficiencia y la eficacia de
los aprendizajes en los programas, proyectos y realidades educalivas. Toda esta problemática pertenece a una concepción
tecnocrática, muy extendida actualmente, que busca el valor educativo de un programa en las acumulaciones y reacciones
comportamentales o cognitivas en las que se estipulan los rendimientos. Nosotros creemos que este tipo de cuestiones y ‘valores’
no pueden ser aceptables a menos que, al mismo tiempo, aceptemos la visión simplista y fuertemente burocrática que introducen
(House 1974 y 1978; MacDonald 1976, Angula 1991). Sin embargo, conocer la calidad y cantidad de los aprendizajes es un
elemento del que la evaluación no puede prescindir, reconociendo, no obstante, como señalábamos arriba, los límites de la
tecnologia de medición disponible y sus repercusiones sociales.


31
De ahí, también, la importancia del punto anterior h).

----------------------- Page 19-----------------------

k)Es una evaluacion que se siente comprometida con la sociedad en general y con el desarrollo y la
profundización de la democracia política. Por ello, no es una perspectiva neutral, sino que orienta su
trabajo hacia la creación de espacios teórico-éticos en los que los ciudadanos que trabajan en la
educación y en la administración educativa puedan comprender y asumir sus responsabilidades mutuas
a la luz de las informaciones, datos, interrogaciones hechos e interpretaciones que la evaluación aporta.
En este compromiso con la sociedad en general se encuentra uno de los fundamentos de la
independencia de los evaluadores.
La realización y el cumplimiento de estas propuestas no es cuestión fácil ni baladí32 Se requiere voluntad


de realización y tiempo para profundizar y mejorar todas y cada una de las propuestas. Pero pensamos
que vale la pena aceptar este compromiso político y social, y que es preciso, y probablemente necesario
intentarlo.


32
Los firmantes de este escrito han trabajado y estan trabajando en el cumplimiento de las ideas aquí expuestas, en una serie de
evaluaciones, algunas ya realizadas (Evaluacion de un programa de Educacion para Diabeticos, en la Evaluacion del Curso para la
obtencion del Certificado de Aptitud Pedagogica ), y algunas en periodo de realizacion (Evaluacion del M.I.R. en Medicina Familiar
y Comunitaria y Evaluacion de un Centro de Profesores ). Para las dificultades de la introduccion y el desarrollo de una evaluacion
educativa como la que proponemos puede verse Simons (1987).