Aspectos destacados:
Confiar en la intuición puede ser empoderador, pero, al igual que un funambulista necesita una red de seguridad, la intuición se fortalece con el respaldo de la evidencia. ¿Hasta qué punto confías en tu intuición a la hora de evaluar el progreso o el deterioro de tus clientes? Un metaanálisis de Miller et al. (2015) sugiere que las decisiones clínicas relativas a la mejora de los clientes que se basan únicamente en la intuición no son tan precisas como las que se basan en evaluaciones psicométricas.
La intuición puede verse reforzada por el rigor y la precisión del análisis estadístico, lo que permite detectar tendencias importantes. Basarse únicamente en la intuición puede llevar a pasar por alto aspectos que se escapan a la vista y dificultar la reducción de los síntomas, especialmente en el caso de los pacientes que inicialmente no muestran mejoría (Lambert et al., 2003). La atención basada en la medición en psicoterapia, que implica la administración periódica de evaluaciones estandarizadas, complementa la intuición clínica y se reconoce cada vez más como esencial (Meyer et al., 2001). En NovoPsych, nos esforzamos por evaluar con precisión los cambios —mejora o empeoramiento— en la salud mental de un cliente mediante la integración de diversos métodos empíricos y proporcionando a los clínicos una idea sólida de lo que constituye un cambio clínicamente significativo.
Medir el cambio: no es tan sencillo
Un método rudimentario y, en ocasiones, engañoso para determinar las puntuaciones de cambio consiste en revisar los descriptores de gravedad para cuantificar si una persona ha cambiado de categoría de gravedad. Sabemos por experiencia que muchos profesionales clínicos utilizan este método. Por ejemplo, el manual de la Escala de Depresión, Ansiedad y Estrés (DASS-21) delimita categorías distintas como «leve», «moderada», «grave» y «extremadamente grave» (véase la figura 1) (Lovibond y Lovibond, 1995). Algunos clínicos determinan entonces simplemente si un cliente ha mejorado (o empeorado) evaluando si ha pasado a una categoría de clasificación de gravedad diferente. Por ejemplo, podríamos determinar que un cliente ha mejorado si estaba en la categoría «grave» cuando empezó a acudir a nuestra consulta, pero ahora está clasificado como «moderado».

Figura 1. Tabla de clasificación de la gravedad del DASS-21, en la que se muestran los rangos de puntuación de la puntuación total y de las subescalas en cinco categorías.
Sin embargo, un problema fundamental de estos descriptores de gravedad es que algunos de los intervalos definidos son bastante amplios, lo que dificulta el seguimiento sistemático de la mejora y el empeoramiento dentro de estas categorías. Por el contrario, un paciente podría mostrar un cambio mínimo y mejorar solo en un punto, pero pasar de una clasificación de gravedad a otra. Se trata de limitaciones fundamentales. Por lo tanto, es necesario un método para determinar cambios significativos en la puntuación, en lugar de centrarse en los cambios en los descriptores de gravedad.
Índice de Cambio Fiable (RCI)
Uno de estos métodos es el Índice de Cambio Fiable (RCI), que evalúa si los cambios en las puntuaciones de las escalas psicológicas de una persona antes y después del tratamiento son estadísticamente significativos, teniendo en cuenta las fluctuaciones naturales, con el fin de determinar si se trata de una mejora o un empeoramiento reales (Jacobson et al., 1984). El RCI es un criterio riguroso y empírico para evaluar el cambio, y a menudo se describe como el «estándar de referencia».
NovoPsych puso de manifiesto el uso eficaz del RCI al analizar más de 90 000 evaluaciones del DASS-21 para determinar el nivel de cambio necesario para que se considere un «cambio fiable», e incluyó esta información en nuestros informes con el fin de facilitar la interpretación a los profesionales clínicos. Calculamos los RCI utilizando el método de Jacobson-Truax y las fiabilidades internas (Jacobson y Truax, 1991) con el fin de categorizar el cambio con descriptores significativos, tales como mejoras significativas (es decir, una reducción de 7 o más puntos en la puntuación del DASS-21), lo que ayuda a los clínicos a evaluar la eficacia del tratamiento. Estos umbrales de mejora (o deterioro) se basan en las diferencias entre las puntuaciones iniciales y las más recientes, y proporcionan puntos de referencia claros para evaluar el bienestar psicológico.
El paquete de análisis de datos de resultados de NovoPsych, denominado Insights, utiliza el RCI para determinar la proporción de clientes que han experimentado un cambio. De este modo, un centro puede determinar, con rigor estadístico, la evolución de los síntomas de un grupo de clientes antes y después del tratamiento.
La siguiente figura muestra que, en una consulta típica, el 54,8 % de los pacientes presenta una mejora significativa en las puntuaciones del DASS-21, según el RCI (véase la figura 2).
Figura 2. Resultados de los clientes según el Índice de Cambio Fiable (RCI)
Esto pone de manifiesto que se considera que una gran proporción de personas (36,3 %) no presenta cambios significativos, según el umbral del RCI de 7 puntos. El 54,8 % de los pacientes de esta consulta logró una mejora significativa. Por otro lado, si se utiliza una valoración simplista del cambio, determinada por una variación de tan solo un punto en el DASS-21, los mismos datos muestran una mejora del 75,1 % (Figura 3). Esto pone de manifiesto cómo los diferentes métodos de cálculo del cambio a nivel de grupo pueden influir en la interpretación general.
Figura 3. Resultados de los clientes utilizando el criterio de cambio de un punto
Al incorporar esto a las interpretaciones de NovoPsych, evitamos que los profesionales clínicos tengan que aprender los cálculos matemáticos que subyacen al RCI (Fórmula 1):
Fórmula 1. Método de Jacobson y Truax para la clasificación de la relevancia clínica (Jacobson y Truax, 1991). Nota: xpre = puntuación de los clientes en la prueba previa;xpost = puntuación de los clientes en la prueba posterior;s1 = desviación estándar del grupo previo al tratamiento;rxx = fiabilidad interna de la escala (según Bauer et al., 2004).
Ejemplo 1. Consideremos el caso de un cliente hipotético cuya puntuación en el DASS-21 ha disminuido de 59 a 40 (véase la figura 4). A pesar de que tanto la puntuación total inicial como la nueva se sitúan dentro del rango «Extremadamente grave», se ha producido una mejora clínicamente significativa de 19 puntos. Aunque esta mejora es claramente evidente en el gráfico de NovoPsych que muestra las puntuaciones a lo largo del tiempo (Figura 4), si un profesional clínico se fijara únicamente en el descriptor de gravedad, parecería que el cliente no ha mejorado. Además del gráfico, NovoPsych destacará en el texto interpretativo (véase la Figura 5) que este cliente ha mejorado significativamente en cuanto a su angustia general.
Figura 4. Gráfico lineal que muestra la disminución de la puntuación del DASS-21 de 59 a 40 a lo largo del tiempo.
Mediante este método de cálculo, basado en modelos estadísticos sólidos, ofrecemos a los profesionales clínicos una visión más detallada de los cambios en la salud mental.
Figura 5. Texto interpretativo de NovoPsych que destaca una mejora significativa a pesar de que la categoría de gravedad no ha variado.
Ejemplo 2. A pesar de los cambios mínimos en la puntuación, el gráfico de la figura 6 muestra que los descriptores de gravedad pueden variar debido a los umbrales de corte predefinidos. Los métodos estadísticos avanzados de NovoPsych garantizan que las ligeras variaciones en la puntuación, a pesar de un cambio en el descriptor, se reconozcan con precisión en el texto interpretativo como indicativas de que no se ha producido ningún cambio significativo (véase la figura 7).
Figura 6. Gráfico que muestra cómo pequeños cambios en la puntuación pueden modificar los descriptores de gravedad debido a los umbrales de corte.
Figura 7. La interpretación de NovoPsych identifica con precisión que no se ha producido ningún cambio significativo, a pesar del cambio en los descriptores.
Una evaluación eficaz de los resultados del tratamiento depende de clasificaciones claras y estandarizadas que orienten a los profesionales a la hora de valorar el progreso de los pacientes. NovoPsych integra estas clasificaciones a la perfección en herramientas como el DASS-21, aprovechando el RCI para establecer umbrales que permitan detectar cambios significativos.
La diferencia mínimamente importante (MID)
El RCI no siempre está disponible, ya sea porque aún no se ha establecido en los estudios o porque puede que no haya datos suficientes de NovoPsych para calcularlo (en caso de que se añada una nueva evaluación). Por lo tanto, una alternativa al RCI podría resultar útil para los profesionales clínicos.
Aunque existen varias alternativas al RCI para el seguimiento de los resultados, la «diferencia mínimamente importante» (MID) destaca como un método sencillo pero empíricamente sólido (Turner et al., 2010). La MID representa el cambio más pequeño en el resultado de un tratamiento que los clientes perciben como beneficioso o clínicamente significativo. Según una revisión realizada por Norman et al. (2003), que examinó 38 estudios sobre diversas afecciones e instrumentos, los cambios cercanos a media desviación estándar (aproximadamente 0,5 DE) indicaban de forma sistemática un cambio significativo. Su investigación subraya la fiabilidad y la relevancia de la MID en entornos clínicos, abogando por su adopción generalizada.
El uso del MID para hacer un seguimiento de los resultados en materia de salud mental ofrece varias ventajas. En primer lugar, el MID establece un umbral definitivo para un cambio significativo utilizando la media y la varianza de una muestra representativa, lo que elimina la necesidad de que la investigación realice un seguimiento longitudinal de los resultados para obtener un índice de cambio relativo (RCI). En segundo lugar, mejora la sensibilidad, lo que permite detectar cambios sutiles pero importantes en el estado del cliente (Toussaint et al., 2020). Por último, el MID promueve un enfoque centrado en el cliente al alinear los objetivos del tratamiento con cambios que son perceptibles y significativos para los clientes, lo que mejora la implicación y la satisfacción (Jayadevappa et al., 2017).
Ejemplo 3. NovoPsych utiliza el MID para evaluar los cambios en las puntuaciones del Inventario de Burnout de Oldenburg. Este enfoque garantiza que, incluso cuando los pacientes se mantienen en la misma categoría de gravedad (por ejemplo, «Burnout elevado», como se muestra en la figura 8), la interpretación ponga de relieve cambios significativos en sus puntuaciones (véase la figura 9). Proporciona a los profesionales clínicos una evaluación precisa del progreso del paciente que va más allá de los descriptores de gravedad convencionales.
Figura 8. Gráfico de puntuaciones del Inventario de Burnout de Oldenburg , que muestra la evolución dentro de la categoría «Burnout elevado»
Figura 9. Interpretación de NovoPsych de las puntuaciones de agotamiento, en la que se destacan los cambios significativos mediante el enfoque MID.
La ciencia psicométrica, representada por métodos como el Índice de Cambio Fiable (RCI) y la Diferencia Mínimamente Importante (MID), desempeña un papel importante en la interpretación del cambio de los clientes en el tratamiento de la salud mental. El RCI y el MID son los métodos preferidos por NovoPsych para determinar los umbrales de cambio y se utilizan en numerosas evaluaciones diseñadas para el seguimiento de los resultados. El RCI es una métrica de cambio más estricta y conservadora en comparación con el MID, por lo que el RCI mostrará que menos clientes han cambiado en comparación con el MID. Por ejemplo, los datos de NovoPsych muestran que, según el RCI del DASS-21, el 49 % de los clientes en terapia presentan una mejora significativa en la angustia total, pero al aplicar el MID a los mismos datos se observa que el 56 % de los clientes mejoraron. Dicho de otro modo, el RCI requiere una diferencia de 7 puntos para clasificarse como mejora significativa, mientras que el MID solo requiere una diferencia de 5 puntos.
NovoPsych integra estos rigurosos métodos estadísticos en la interpretación de nuestras evaluaciones, de modo que los profesionales sanitarios puedan combinarlos con su conocimiento del proceso terapéutico del paciente para ayudar a trazar un panorama de la recuperación basado en las estadísticas y en la intuición clínica. NovoPsych ayuda a los profesionales sanitarios a tomar decisiones fundamentadas que mejoran la eficacia y la personalización de la atención al paciente. Este enfoque refuerza la fiabilidad de la evaluación y pone de relieve los cambios cuantificables y significativos en los resultados de salud mental.
Referencias
Jacobson, N. S., y Truax, P. (1991). Significación clínica: un enfoque estadístico para definir el cambio significativo en la investigación sobre psicoterapia. Journal of Consulting and Clinical Psychology, 59(1), 12-19. https://doi.org/10.1037/0022-006X.59.1.12
Jacobson, N. S., Follette, W. C. y Revenstorf, D. (1984). Investigación sobre los resultados de la psicoterapia: métodos para informar sobre la variabilidad y evaluar la relevancia clínica. Behavior Therapy, 15(4), 336-352. https://doi.org/10.1016/S0005-7894 (84) 80002-7
Jayadevappa, R., Cook, R. y Chhatre, S. (2017). Diferencia mínima importante para inferir cambios en la calidad de vida relacionada con la salud: una revisión sistemática. Journal of Clinical Epidemiology, 89, 188-198. https://doi.org/10.1016/j.jclinepi.2017.06.009
Lambert, M. J., Whipple, J. L., Hawkins, E. J., Vermeersch, D. A., Nielsen, S. L. y Smart, D. W. (2003). ¿Ha llegado el momento de que los profesionales clínicos hagan un seguimiento sistemático de los resultados de los pacientes? Un metaanálisis. Clinical Psychology (Nueva York, N.Y.), 10(3), 288–301. https://doi.org/10.1093/clipsy.bpg025
Lovibond, S. H. y Lovibond, P. F. (1995). Manual de la Escala de Depresión, Ansiedad y Estrés (2.ª ed.). Sídney: Psychology Foundation (Disponible en The Psychology Foundation, Sala 1005 del Edificio Mathews, Universidad de Nueva Gales del Sur, NSW 2052, Australia).
Meyer, G. J., Finn, S. E., Eyde, L. D., Kay, G. G., Moreland, K. L., Dies, R. R., Eisman, E. J., Kubiszyn, T. W. y Reed, G. M. (2001). Pruebas psicológicas y evaluación psicológica: una revisión de la evidencia y las cuestiones relevantes. The American Psychologist, 56(2), 128–165. https://doi.org/10.1037/0003-066X.56.2.128
Miller, D. J., Spengler, E. S. y Spengler, P. M. (2015). Un metaanálisis sobre la confianza y la precisión del juicio en la toma de decisiones clínicas. Journal of Counseling Psychology, 62(4), 553-567. https://doi.org/10.1037/cou0000105
Norman, G. R., Sloan, J. A. y Wyrwich, K. W. (2003). Interpretación de los cambios en la calidad de vida relacionada con la salud: la notable universalidad de media desviación estándar. Medical Care, 41(5), 582-592. https://doi.org/10.1097/01.MLR.0000062554.74615.4C
Toussaint, A., Hüsing, P., Gumz, A., Wingenfeld, K., Härter, M., Schramm, E. y Löwe, B. (2020). Sensibilidad al cambio y diferencia mínima clínicamente importante del Cuestionario de Trastorno de Ansiedad Generalizada de 7 ítems (GAD-7). Journal of Affective Disorders, 265, 395–401. https://doi.org/10.1016/j.jad.2020.01.032
Turner, D., Schünemann, H. J., Griffith, L. E., Beaton, D. E., Griffiths, A. M., Critch, J. N. y Guyatt, G. H. (2010). El cambio mínimo detectable no puede sustituir de forma fiable a la diferencia mínima importante. Journal of Clinical Epidemiology, 63(1), 28–36. https://doi.org/10.1016/j.jclinepi.2009.01.024