El Cuestionario de Fortalezas y Dificultades (SDQ) es una herramienta de cribado conductual y emocional compuesta por 25 ítems, destinada a niños y jóvenes de entre 2 y 17 años (Goodman, 1997). Evalúa cuatro ámbitos problemáticos (síntomas emocionales, problemas de conducta, hiperactividad/falta de atención y problemas en las relaciones con los compañeros), además de una quinta escala de comportamiento prosocial.
Un suplemento de impacto (Goodman, 1999) amplía el cuestionario con ítems sobre cronicidad, angustia, interferencia en la vida cotidiana y carga para los demás, que se administra únicamente cuando el encuestado indica que el niño presenta dificultades en el ítem de cribado del suplemento. El SDQ está disponible en formatos de informe de los padres, informe del profesor e autoinforme del joven para todos los grupos de edad, desde la primera infancia hasta la adolescencia, con versiones de seguimiento para registrar los cambios a lo largo del tiempo. Es una de las medidas breves de la salud mental infantil y adolescente más utilizadas en todo el mundo, aplicada en entornos clínicos, educativos y de investigación.
Las dificultades conductuales y emocionales en la infancia y la adolescencia son frecuentes y afectan aproximadamente al 10 % de la población general en un momento dado (Goodman et al., 2000; Polanczyk et al., 2015). La detección precoz de estas dificultades se asocia a mejores resultados; sin embargo, muchos niños con problemas graves no son identificados hasta que las dificultades se han arraigado. Los instrumentos de cribado breves y validados desempeñan un papel clave a la hora de facilitar la identificación temprana en entornos comunitarios, educativos y clínicos. El SDQ es uno de los instrumentos más utilizados para este fin, con traducciones a más de 80 idiomas y un uso generalizado en encuestas epidemiológicas, servicios clínicos y programas de seguimiento de resultados a nivel internacional. En la página web del SDQ se encuentra disponible una amplia gama de materiales de apoyo: https://www.sdqinfo.org/
El SDQ consta de cinco subescalas (25 ítems) que se incluyen en todas las versiones, con una redacción ligeramente modificada en función del encuestado.
Las versiones estándar del SDQ en NovoPsych incluyen un suplemento sobre el impacto, que evalúa en primer lugar si el encuestado cree que el niño tiene alguna dificultad y, en caso afirmativo, le pregunta desde cuándo se presentan, si le causan malestar, si interfieren en su vida cotidiana (vida familiar, relaciones de amistad, aprendizaje en el aula, actividades de ocio) o si suponen una carga para los demás.
El suplemento «Impact» aporta un contexto clínico importante al distinguir entre los niños con puntuaciones elevadas en los síntomas que se desenvuelven bien y aquellos cuyas dificultades les provocan un deterioro significativo.
A diferencia de la versión estándar, que se centra en el comportamiento durante los últimos seis meses, las versiones de seguimiento se centran en «el último mes» para facilitar la detección de cambios a lo largo del tiempo. Las versiones de seguimiento, que también incluyen el Suplemento de Impacto, omiten la pregunta sobre la cronicidad de los problemas e incluyen dos preguntas adicionales en las que se pide al encuestado que valore el cambio en los problemas del niño desde que acudió al servicio y en qué medida le ha resultado útil acudir al servicio.
En NovoPsych hay disponibles catorce versiones del SDQ, que se basan en la traducción al «inglés (australiano)» y en los umbrales normativos correspondientes. Todas las versiones de NovoPsych incluyen el Suplemento de Impacto y están disponibles tanto en el formato estándar como en el de seguimiento. Abarcan tres tipos de informantes y varios grupos de edad.
El SDQ está concebido como un instrumento de cribado de primera línea y no pretende ser la única base para el diagnóstico clínico (Goodman et al., 2000). Las puntuaciones elevadas indican aspectos que suscitan preocupación y que requieren una evaluación más exhaustiva.
Entre los usos clínicos habituales se incluyen:
Todas las versiones del SDQ en NovoPsych siguen la misma estructura de puntuación y generan puntuaciones en tres niveles: la puntuación total de dificultades, las puntuaciones de las cinco subescalas y una puntuación de impacto. Una puntuación más alta indica una mayor dificultad en todas las áreas, excepto en la de «Comportamiento prosocial», donde una puntuación más alta indica una mayor fortaleza prosocial.
Cada versión del formulario está disponible como formulario estándar (normalmente para la administración inicial o de referencia; periodo de recuerdo: últimos seis meses o curso escolar actual) y un formulario de seguimiento (normalmente para una nueva administración con el fin de realizar un seguimiento de los cambios; periodo de referencia: el último mes).
La puntuación total de dificultades (20 ítems; rango de 0 a 40) refleja el nivel general de dificultades conductuales y emocionales y es la suma de las cuatro subescalas de dificultades (5 ítems cada una; los ítems marcados con (R) se puntúan a la inversa):
Una quinta subescala, «Comportamiento prosocial» (ítems 1, 4, 9, 17 y 20; rango de 0 a 10), evalúa los atributos sociales positivos. Se trata de una escala de fortalezas, que no se incluye en la puntuación total de dificultades, y cuya interpretación es inversa: las puntuaciones bajas indican un menor número de comportamientos prosociales, mientras que las puntuaciones altas indican fortalezas prosociales.
La puntuación de Impact se calcula a partir del Suplemento de Impact, que se aplica tanto en la versión estándar como en la de seguimiento. El Suplemento comienza con una pregunta inicial en la que se pregunta al encuestado si percibe que el niño tiene alguna dificultad en el ámbito emocional, de la concentración, del comportamiento o del funcionamiento social.
Cuando el encuestado responde «No»: no se administra el suplemento y no se calcula la puntuación de impacto. La tabla de resultados muestra «N/A – No se han comunicado dificultades» en la fila de impacto, y en la descripción interpretativa se indica que el encuestado no ha comunicado ninguna dificultad general.
Cuando el encuestado responde «Sí»: la puntuación de impacto es la suma de un ítem de malestar y varios ítems de interferencia. Cada ítem utiliza una escala de respuesta de cuatro puntos: «En absoluto» (0), «Solo un poco» (0), «En medida moderada» (1) y «En gran medida» (2). Por lo tanto, solo las respuestas que indican al menos «En medida moderada» de malestar o interferencia contribuyen a la puntuación.
El número de elementos de interferencia y el rango de puntuación resultante varían según la versión del informante:
Elementos del Suplemento de Impacto no incluidos en la puntuación de Impacto. Hay dos elementos que aparecen en el Suplemento de Impacto, pero que no contribuyen a la puntuación de Impacto.
Redacción: Para el grupo de edad de 2 a 4 años, tres ítems tienen una redacción diferente a la de las versiones de 4 a 17 años: el ítem 18 («A menudo discute con los adultos» sustituye a «A menudo miente o hace trampas»), el ítem 22 (««Puede ser rencoroso con los demás» sustituye a «Roba en casa, en el colegio o en otros lugares»), y el ítem 21 se suaviza («Es capaz de detenerse a pensar las cosas antes de actuar» sustituye a «Piensa las cosas antes de actuar»). Por lo demás, la puntuación es idéntica. Se aplican umbrales normativos distintos para el grupo de edad de 2 a 4 años frente al de 4 a 17 años.
Versiones de seguimiento: Las versiones de seguimiento piden a los encuestados que evalúen los ítems en relación con el último mes, en lugar de los últimos seis meses o el último curso escolar que se utilizan en las versiones estándar; omiten el ítem relativo a la duración (cronicidad) e incluyen, en su lugar, dos preguntas adicionales en las que se pide al encuestado que evalúe cómo han cambiado los problemas del niño desde que acudió por primera vez al servicio y en qué medida le ha resultado útil acudir a él. Las valoraciones textuales de los encuestados sobre estos dos ítems se citan en la narrativa interpretativa.
Todas las partituras se clasifican según el sistema de cuatro bandas aprobado por el autor (véase https://www.sdqinfo.org/):
La subescala de «Comportamiento prosocial» requiere una interpretación específica, ya que funciona de manera opuesta a las subescalas de «Dificultades». Una puntuación alta en «Comportamiento prosocial» es positiva e indica que el niño es considerado, servicial y amable. Una puntuación baja en prosocialidad puede indicar dificultades en la interacción social, la cooperación o el comportamiento de ayuda, y justifica una exploración más profunda. La subescala de prosocialidad no se incluye en la puntuación total de dificultades, por lo que un niño puede tener una puntuación total de dificultades baja (pocos problemas) pero, aun así, presentar una puntuación en prosocialidad que requiera atención.
La puntuación de impacto contextualiza las puntuaciones de los síntomas al indicar si las dificultades identificadas están causando un deterioro funcional. Por ejemplo, un niño puede obtener una puntuación en el rango «Alto» o «Muy alto» en una o más subescalas de dificultades, pero tener una puntuación de impacto «Cercana a la media», lo que sugiere que las dificultades están presentes, pero aún no causan un malestar o una interferencia significativos. Por el contrario, un perfil de síntomas «Ligeramente elevado» con una puntuación de impacto «Alta» puede indicar que incluso las dificultades moderadas están teniendo un efecto desproporcionado en el funcionamiento del niño. La puntuación de impacto debe interpretarse junto con las subescalas de síntomas, en lugar de de forma aislada.
Las 14 versiones del SDQ incluyen una pregunta opcional de respuesta libre (P26) que pregunta: «¿Tiene algún otro comentario o inquietud?». Esta pregunta ofrece al encuestado un espacio para añadir información complementaria, describir dificultades que las preguntas de puntuación no han reflejado o plantear inquietudes que el profesional sanitario podría querer abordar en una conversación de seguimiento. No es obligatoria y no forma parte de ninguna escala puntuada. No contribuye a la puntuación de «Dificultades totales», a la puntuación de «Impacto», a ninguna de las cinco subescalas ni a la categorización en cuatro bandas. Cuando el encuestado introduce texto, la respuesta se presenta dentro del texto interpretativo y se reproduce textualmente en una sección denominada «Respuesta de texto abierto» al final de la sección «Respuestas del cliente» del informe. La respuesta de texto libre se presenta únicamente con fines clínicos.
Primera administración. En la primera administración para un informador determinado, el informe muestra un gráfico de barras de «Dificultades totales» junto a un gráfico de barras de «Impacto» (uno al lado del otro), cada uno con un sombreado de fondo que indica los límites de las cuatro bandas. Cuando la respuesta a la pregunta de acceso es «No», no se administra el «Suplemento de impacto» y solo se muestra el gráfico de «Dificultades totales». A continuación, un gráfico de barras de «Puntuaciones de subescalas» muestra las cinco puntuaciones de subescalas en un único gráfico, con las cuatro subescalas de dificultad utilizando el sombreado estándar de cuatro bandas y la subescala Prosocial utilizando un sombreado de bandas invertido en el mismo gráfico, lo que refleja su papel interpretativo distintivo como fortaleza en lugar de como dificultad. Este diseño permite a los clínicos comparar la contribución relativa de cada dominio de un solo vistazo. En las versiones estándar, una leyenda debajo del gráfico de Impacto indica desde cuándo se han manifestado las dificultades según los informes.
Administraciones repetidas. Cuando existen más de una administración para el informante cuyo informe se está generando (independientemente de si se trata de una versión estándar o de seguimiento), los gráficos de líneas de administraciones múltiples sustituyen a los gráficos de barras de la primera administración: un gráfico de líneas de «Dificultades totales» junto a un gráfico de líneas de «Impacto» (uno al lado del otro), un gráfico de líneas de «Comportamiento prosocial» y una cuadrícula de 2×2 con los gráficos de líneas de las cuatro subescalas de dificultad en una página posterior. Todos los gráficos muestran las puntuaciones brutas a lo largo de los puntos temporales con el umbral de gravedad de cuatro bandas sombreado en el fondo, lo que permite a los clínicos realizar un seguimiento de las trayectorias de cambio.
Las evaluaciones estándar y de seguimiento realizadas por el mismo evaluador se muestran como una única serie temporal a lo largo del tiempo. De este modo, se combinan en un mismo gráfico la evaluación inicial (periodo de referencia: últimos seis meses/curso escolar) y las evaluaciones de seguimiento posteriores (periodo de referencia: último mes). Las comparaciones de puntuaciones brutas siguen siendo válidas según las convenciones de puntuación de Goodman, pero a la hora de interpretar los cambios se debe tener en cuenta la diferencia en el periodo de referencia entre las evaluaciones estándar y de seguimiento.
Los cambios de banda (por ejemplo, una subescala que pasa de «Alto» a «Ligeramente elevado») y la estabilidad de la banda entre las distintas administraciones (por ejemplo, «se mantiene en el rango Cerca de la media») se indican en el texto interpretativo. En el gráfico de Impacto, las administraciones en las que el encuestado respondió «No» a la pregunta de filtro se marcan con una «x» para distinguirlas de aquellas en las que se registró una puntuación de Impacto de cero.
Las descripciones de los cambios en la narrativa interpretativa se refieren a dos puntos de referencia en el nivel de «Dificultades totales e impacto»: (i) la evaluación inmediatamente anterior, para respaldar la toma de decisiones clínicas a corto plazo, y (ii) la primera evaluación (línea de base), para reflejar el cambio acumulado. Ambas comparaciones se presentan cuando existen más de dos evaluaciones. Las descripciones de los cambios a nivel de subescala (Síntomas emocionales, Problemas de conducta, Hiperactividad, Problemas con los compañeros, Comportamiento prosocial) hacen referencia únicamente a la administración inmediatamente anterior.
Transiciones entre grupos de edad. Cuando un cliente ha pasado del grupo de edad de 2 a 4 años al de 4 a 17 años (por ejemplo, el niño tiene 4 años en la primera evaluación, pero cumple 5 años en una evaluación posterior), una línea vertical discontinua marca la evaluación en la que cambió el grupo de edad, y un pie de foto sobre los gráficos explica esta convención. Las comparaciones de puntuaciones brutas entre administraciones siguen siendo válidas, pero las etiquetas de los grupos de edad se interpretan en función de los umbrales específicos de cada administración. Cuando hay más de 20 administraciones, cada gráfico se divide en dos mitades (la más reciente primero) para que los puntos de datos individuales sigan siendo legibles.
Informes de múltiples informantes. La combinación de las perspectivas de varios informantes mejora la precisión de la evaluación y pone de manifiesto diferencias específicas del contexto en el comportamiento del niño (Goodman et al., 2004), lo que constituye un caso de uso clínico fundamental del SDQ. Cuando un mismo cliente ha sido evaluado por más de un informante (por ejemplo, tanto por un padre como por un profesor), el informe muestra primero los resultados del informante actual (tabla de resultados, gráficos, narrativa interpretativa y respuestas del cliente) y, a continuación, añade una sección complementaria para cada informante adicional al final del informe. Una única administración por parte de un informador complementario se presenta como una tabla de resultados independiente en su propia página; las administraciones múltiples se presentan como gráficos de resultados a lo largo del tiempo (Total, Impacto, Prosocial y las cuatro subescalas de dificultad). Cada sección complementaria se evalúa en función de los umbrales normativos propios de ese informador.
Suplemento de seguimiento. En las versiones de seguimiento, las valoraciones del encuestado sobre la evolución de los problemas del niño desde que acudió por primera vez al servicio (de «Mucho mejor» a «Mucho peor») y sobre la utilidad de haber acudido al servicio (de «Muchísimo» a «Para nada») se citan en la descripción interpretativa y se recogen en el «Suplemento de seguimiento», dentro de la sección de respuestas de los clientes, al final del informe. Estas valoraciones son respuestas categóricas de un solo ítem, en lugar de escalas puntuadas, por lo que no se muestran en la tabla de resultados ni en los gráficos.
El SDQ fue desarrollado por Goodman (1997) como una alternativa breve a los cuestionarios de Rutter para evaluar las dificultades conductuales y emocionales en los niños. Los 25 ítems iniciales se elaboraron para abarcar cinco ámbitos (síntomas emocionales, problemas de conducta, hiperactividad/falta de atención, problemas con los compañeros y comportamiento prosocial), con cinco ítems por ámbito seleccionados sobre la base de análisis factoriales y relevancia clínica. En el estudio de validación original, se evaluó a 403 niños de entre 4 y 16 años en entornos clínicos dentales y psiquiátricos. El SDQ demostró una precisión de cribado comparable a la de los cuestionarios de Rutter, más extensos, con valores del área bajo la curva ROC (AUC) de 0,87 para los informes de los padres y de 0,85 para los informes de los profesores (Goodman, 1997).
La versión «ampliada», que incorpora el Suplemento de Impacto, fue introducida por Goodman (1999) para mejorar la identificación de dificultades clínicamente significativas. El Suplemento de Impacto evalúa el malestar general, la cronicidad, la interferencia en los distintos ámbitos funcionales y la carga que supone para los demás. En una muestra comunitaria de 467 niños y una muestra clínica de 232 niños (de 5 a 15 años), la presencia de casos según el impacto fue un predictor más sólido del estado clínico que la presencia de casos según los síntomas por sí sola (Goodman, 1999).
La consistencia interna de las subescalas del SDQ se ha evaluado en múltiples muestras de gran tamaño. En las encuestas combinadas sobre salud mental infantil y adolescente en el Reino Unido (B-CAMHS 1999 y 2004; N = 18 222 padres, 14 263 profesores, 7678 jóvenes, de 5 a 16 años), los coeficientes alfa de Cronbach se situaron casi todos entre 0,65 y 0,85 en todas las subescalas y para todos los informantes (Goodman et al., 2010). Las dos subescalas más débiles fueron las de «Problemas con los compañeros», según lo informado por los padres (alfa = 0,58) y los jóvenes (alfa = 0,44). En una muestra comunitaria australiana (N = 1.359, edades de 4 a 9 años, informe de los padres), los alfas oscilaron entre 0,59 (Problemas con los compañeros) y 0,80 (Hiperactividad), con la puntuación de Dificultades totales demostrando una fuerte consistencia interna (alfa = 0,82) y la puntuación de Impacto una fiabilidad adecuada (alfa = 0,79) (Hawes y Dadds, 2004). Una revisión sistemática de 48 estudios (N = 131 223; edades de 4 a 12 años) confirmó una consistencia interna satisfactoria para las versiones de padres y profesores, mostrando la versión de los profesores, en general, una mayor fiabilidad (Stone et al., 2010).
Se ha evaluado la fiabilidad test-retest en una muestra comunitaria de 34 padres con un intervalo de 3 a 4 semanas, lo que ha dado como resultado coeficientes de correlación intraclase de 0,85 para las «Dificultades totales» y de 0,63 para la puntuación de «Impacto» (Goodman, 1999). En la muestra australiana, las correlaciones de estabilidad a 12 meses oscilaron entre 0,61 (problemas con los compañeros) y 0,77 (hiperactividad), con un valor de 0,77 para las dificultades totales y de 0,63 para el impacto (Hawes y Dadds, 2004). Dado el intervalo de 12 meses, estos valores reflejan tanto la estabilidad de la medición como un cambio evolutivo genuino.
La estructura hipotética de cinco factores se ha evaluado en múltiples muestras mediante un análisis factorial confirmatorio. En los datos del B-CAMHS, el modelo de primer orden de cinco factores alcanzó un ajuste aceptable para los datos de los padres (CFI = 0,90, TLI = 0,95, RMSEA = 0,05), los profesores (CFI = 0,92, TLI = 0,97, RMSEA = 0,08) y los jóvenes (CFI = 0,86, TLI = 0,90, RMSEA = 0,06) tras algunas modificaciones menores (Goodman et al., 2010).
La estructura de cinco factores se ha replicado a nivel internacional. Una revisión sistemática reveló que 15 de 18 estudios confirmaron la estructura hipotética mediante métodos exploratorios o confirmatorios (Stone et al., 2010). En la muestra australiana basada en informes de los padres (N = 1359, edades de 4 a 9 años), la solución de cinco factores se vio respaldada tanto para los niños como para las niñas, y la mayoría de los ítems presentaban una carga de moderada a fuerte en sus factores previstos (Hawes y Dadds, 2004). Sin embargo, se han observado de forma sistemática en todos los estudios cargas cruzadas para el ítem «Generalmente obediente» (que carga en Prosocial en lugar de en Conducta).
El SDQ ha demostrado una buena validez convergente en comparación con las medidas de las entrevistas diagnósticas. Utilizando la Evaluación del Desarrollo y el Bienestar (DAWBA) como criterio, las cinco subescalas predijeron de forma monótona sus correspondientes diagnósticos derivados de la DAWBA, pero los análisis multitrait-multimethod mostraron una validez discriminante deficiente entre las subescalas de comportamiento, hiperactividad y prosocialidad en muestras de bajo riesgo (Goodman et al., 2010), especialmente en puntuaciones más bajas. En la muestra australiana, las puntuaciones de las subescalas del SDQ se correlacionaron significativamente con las puntuaciones de gravedad de la entrevista diagnóstica DISCAP correspondientes, oscilando entre 0,33 (Síntomas emocionales con trastornos de internalización) y 0,51 (Hiperactividad con diagnósticos de hiperactividad) (Hawes y Dadds, 2004).
The SDQ also shows good convergence with the Child Behavior Checklist (CBCL). In a head-to-head comparison of 132 children aged 4 to 7 from London psychiatric and dental clinics, equivalent SDQ and CBCL scales correlated strongly (Total Difficulties with Total Problems r = .87; Conduct with Externalising r = .84; Emotional with Internalising r = .74; Hyperactivity with Attention Problems r = .71; Peer with Social Problems r = .59) and ROC areas under the curve were approximately .95 for Total and Externalising scores on both questionnaires, with no significant difference between the two. The SDQ outperformed the CBCL for detecting inattention and hyperactivity against the Parental Account of Childhood Symptoms interview (SDQ r = .43 vs CBCL r = .15, p < .02) and was at least as good for internalising and externalising problems (Goodman & Scott, 1999).
La precisión de cribado del SDQ se ha evaluado en varios estudios a gran escala. En una muestra comunitaria del Reino Unido (N = 7.984, edades comprendidas entre los 5 y los 15 años), un enfoque del SDQ basado en múltiples informantes alcanzó una sensibilidad del 63,3 % (IC del 95 %: 59,7-66,9 %) y una especificidad del 94,6 % (IC del 95 %: 94,1-95,1 %) para cualquier trastorno psiquiátrico, con un valor predictivo positivo del 52,7 % y un valor predictivo negativo del 96,4 % (Goodman et al., 2000). La sensibilidad fue mayor para los trastornos de conducta (76,2 %), los trastornos de hiperactividad (86,1 %) y la depresión (74,6 %), pero menor para las fobias específicas (30,9 %) y la ansiedad por separación (45,5 %).
En un estudio realizado con niños acogidos en el sistema de protección de la infancia (N = 539, edades comprendidas entre los 5 y los 17 años), el SDQ alcanzó una sensibilidad del 85 % y una especificidad del 80 % (Goodman et al., 2004). En la muestra australiana, los niños que se situaban en el 10 % superior en la puntuación total de dificultades tenían una razón de probabilidades de 11,7 para cualquier diagnóstico del DSM-IV en comparación con el 90 % restante (Hawes y Dadds, 2004).
El SDQ utiliza un sistema de clasificación de cuatro niveles para clasificar las puntuaciones:
Este sistema fue desarrollado por los autores del SDQ (Goodman, 2015a) basándose en la distribución empírica de las puntuaciones obtenidas en las encuestas B-CAMHS (Goodman et al., 2010), con umbrales calibrados de tal manera que aproximadamente el 80 % de los niños se sitúe en la banda «Cerca de la media», el 10 % en «Ligeramente elevado», el 5 % en «Alto» y el 5 % en «Muy alto». Sustituyó a un sistema anterior de tres bandas (Normal, Límite, Anormal) que utilizaba una división del 80 %/10 %/10 % (Goodman, 1997).
Bandes de umbral de Australia frente a las del Reino Unido. Los umbrales aplicados en la puntuación del SDQ de NovoPsych son los umbrales publicados por autores ingleses (australianos) (Goodman, 2015a, 2015b), que son numéricamente idénticos a los umbrales ingleses (del Reino Unido) con una excepción: la revisión del Reino Unido corrige el límite superior del impacto del profesor en la banda «Muy alto» de 3-10 al valor matemáticamente correcto de 3-6. Dado que la puntuación del impacto del profesor tiene un límite máximo de 6, esta corrección es de carácter documental más que sustantivo.
Bandes de umbral de Australia frente a EE. UU. Los autores del SDQ también publican umbrales específicos para EE. UU. Los puntos de corte de «Dificultades totales» de EE. UU. se sitúan aproximadamente entre 1 y 2 puntos por debajo de los valores del Reino Unido en cada límite de banda, y los puntos de corte de «Prosocialidad» de EE. UU. se sitúan aproximadamente 1 punto por debajo de los valores del Reino Unido en las dos bandas inferiores; los puntos de corte de las demás subescalas son, en líneas generales, similares. La implicación es que, en igualdad de condiciones, los umbrales de EE. UU. clasifican a un número ligeramente mayor de niños en las bandas elevadas que los umbrales del Reino Unido y Australia, lo que refleja las puntuaciones medias más bajas observadas en la muestra normativa de EE. UU. más que cualquier diferencia en el constructo subyacente.
Umbrales provisionales para las edades de 2 a 4 años. Se proporcionan umbrales distintos para cada tipo de informante (padres, profesores, autoinforme), lo que refleja las diferentes características de distribución de las puntuaciones entre los distintos informantes. El grupo de edad de 2 a 4 años utiliza umbrales provisionales distintos, calibrados por los autores del SDQ a partir de una muestra de 11 592 cuestionarios SDQ cumplimentados por los padres de niños de 2 a 3 años en Escocia (1353 en Dumfries y 10 239 de 30 meses en Glasgow) y 10 004 cuestionarios SDQ cumplimentados por los profesores de niños de 4 (personal de guarderías de la Autoridad Local y de la Asociación en Glasgow, 2012-2014). Estos datos han sido publicados por los autores y no han sido revisados por pares; los umbrales provisionales se documentan en Goodman (2015b), y la muestra subyacente se describe en https://www.sdqinfo.org/norms/UK3yearNorm.html. La clasificación provisional para niños de 2 a 4 años apunta a una distribución ligeramente diferente (aproximadamente un 80 % «Cerca de la media», un 12 % «Ligeramente elevado», un 4 % «Alto» y un 4 % «Muy alto»), lo que refleja las tasas de prevalencia estimadas en este grupo de edad más joven. Los autores describen estos umbrales como provisionales, a la espera de la recopilación de datos más amplios y representativos a nivel nacional para este grupo de edad.
Threshold Validation Against Australian Data. The four-band system does not stratify by sex. This is consistent with effect size analyses computed from Hawes and Dadds (2004) means and standard deviations (N = 1,359, ages 4-9), where all sex differences fell below the team’s threshold for meaningful stratification (|d| >= 0.5). The largest sex effect was on the Prosocial subscale (Cohen’s d = 0.38, girls higher than boys, weighted across age bands), with Hyperactivity a close second (Cohen’s d = -0.36, boys higher than girls). All other subscales showed |d| <= 0.30.
La verificación cruzada de los umbrales para padres de 4 a 17 años con los datos de la comunidad australiana (Hawes y Dadds, 2004) confirmó que los umbrales de los autores se sitúan en puntos plausibles de la distribución. Bajo una aproximación normal utilizando las medias ponderadas y las desviaciones estándar de la Tabla 1 de Hawes & Dadds (2004), el límite de «Dificultades totales cercanas a la media» (puntuación bruta 13) corresponde aproximadamente al percentil 80 de la muestra australiana, lo que coincide con el objetivo previsto por el autor. Cabe esperar desviaciones en las subescalas con distribuciones muy asimétricas (Conducta, Problemas con los compañeros, Impacto), dado que los umbrales originales se derivaron de distribuciones empíricas en lugar de estimaciones paramétricas. Los tamaños del efecto y las correspondencias de percentiles que se presentan en esta sección fueron calculados por NovoPsych utilizando las medias y las desviaciones estándar de la Tabla 1 de Hawes y Dadds (2004).
Un niño de cuatro años se encuentra en el punto en el que se solapan ambas versiones, por lo que lo que realmente importa es el contexto en el que se encuentra el niño, más que su edad por sí sola. La pauta habitual es la asistencia al colegio: se utiliza la versión de 4 a 10 años para un niño de cuatro años que ya ha empezado el colegio, y la versión de 2 a 4 años para uno que aún no lo ha hecho. Esto es importante porque las dos versiones no son idénticas; algunos ítems están redactados de forma diferente y cada una utiliza sus propios umbrales normativos, por lo que ajustar la versión a la etapa del niño ofrece el resultado más preciso. Si un niño se encuentra justo en el límite, elija la versión que mejor refleje su entorno cotidiano y utilice esa misma versión en administraciones posteriores para que las puntuaciones sigan siendo comparables.
Cada informante observa al niño en un contexto diferente, por lo que las versiones están diseñadas para complementarse entre sí, en lugar de utilizarse de forma aislada. La combinación de la valoración de los padres y del profesor, junto con el autoinforme del joven cuando sea pertinente, mejora la precisión de la evaluación más allá de lo que ofrece una sola perspectiva y, a menudo, revela en qué casos las dificultades son específicas de una situación concreta. El autoinforme solo está disponible a partir de los once años, lo que refleja la capacidad de lectura y la autorreflexión que requieren los ítems, mientras que las versiones de los padres y los profesores abarcan todo el rango de edades. Cuando más de un informante ha completado el SDQ para el mismo niño, NovoPsych reúne sus resultados en un único informe para que las perspectivas puedan compararse una al lado de la otra.
Utilice la versión estándar para la primera evaluación o la evaluación inicial; en ella se pregunta por el comportamiento durante los últimos seis meses (o durante el curso escolar, en el caso de los profesores) y ofrece una visión estable de las dificultades del niño. La versión de seguimiento está pensada para volver a realizar la evaluación una vez que el niño está recibiendo asistencia: en ella se pregunta por el último mes, por lo que es más sensible a los cambios recientes, y se añaden dos breves preguntas sobre si la situación ha mejorado y en qué medida ha resultado útil la asistencia al servicio.
El Suplemento de Impacto comienza con una pregunta inicial en la que se pregunta al encuestado si cree que el niño tiene alguna dificultad. Si responde «no», no se calcula la puntuación de Impact y el informe lo registra, incluso cuando una o más puntuaciones de las subescalas se sitúan en un rango elevado. Este patrón es clínicamente informativo más que contradictorio: puede significar que los comportamientos están presentes pero aún no preocupan al encuestado, que este tiene una alta tolerancia hacia los comportamientos, o que los está minimizando. Vale la pena explorarlo con delicadeza en la conversación en lugar de dar por sentado que la valoración es un error.
Es habitual que haya discrepancias entre los informantes y, por lo general, estas son significativas, en lugar de indicar que alguno de ellos esté equivocado. Los niños suelen comportarse de manera diferente en casa y en la escuela, por lo que una diferencia puede indicar una dificultad específica de la situación, por ejemplo, problemas de conducta que se manifiestan en el aula pero no en casa, o ansiedad que un padre observa pero que un profesor no percibe. Lea el perfil de cada informante comparándolo con las propias normas de ese informante y considere la discrepancia en sí misma como una pista clínica sobre dónde y cuándo el niño tiene dificultades. Poner de manifiesto estas diferencias de contexto es uno de los verdaderos puntos fuertes del SDQ.
El SDQ es un cuestionario de cribado general de primera línea: evalúa los síntomas emocionales, la conducta, la hiperactividad y la falta de atención, las relaciones con los compañeros y las habilidades prosociales en un único cuestionario breve, lo que lo hace muy adecuado para la evaluación inicial y el seguimiento rutinario de los resultados. Cuando el SDQ señala un área específica, una herramienta de evaluación más específica puede proporcionar el nivel de detalle que un cuestionario de cribado general no está diseñado para ofrecer. En el caso concreto de la ansiedad y la depresión, la Escala de Ansiedad Infantil de Spence (SCAS) o la Escala Revisada de Ansiedad y Depresión Infantil (RCADS) ofrecen detalles a nivel de trastorno, y la versión juvenil de las Escalas de Depresión, Ansiedad y Estrés (DASS-Y) evalúa el malestar internalizado en los jóvenes. Si se utilizan conjuntamente, el SDQ identifica dónde buscar y las medidas específicas ayudan a aclarar lo que está sucediendo.
Goodman, R. (1997). The Strengths and Difficulties Questionnaire: A research note. Journal of Child Psychology and Psychiatry, 38(5), 581–586. https://doi.org/10.1111/j.1469-7610.1997.tb01545.x
Goodman, A. (2015a, May 11). Scoring the Strengths & Difficulties Questionnaire for age 4-17 [English (Australian) version]. SDQ Information. https://www.sdqinfo.org/
Goodman, A. (2015b, May 11). Scoring the Strengths & Difficulties Questionnaire for 2-4 year olds [English (Australian) version]. SDQ Information. https://www.sdqinfo.org/
Goodman, A., & Goodman, R. (2009). Strengths and Difficulties Questionnaire as a dimensional measure of child mental health. Journal of the American Academy of Child and Adolescent Psychiatry, 48(4), 400–403. https://doi.org/10.1097/CHI.0b013e3181985068
Goodman, A., Lamping, D. L., & Ploubidis, G. B. (2010). When to use broader internalising and externalising subscales instead of the hypothesised five subscales on the Strengths and Difficulties Questionnaire: Data from British parents, teachers and children. Journal of Abnormal Child Psychology, 38, 1179–1191. https://doi.org/10.1007/s10802-010-9434-x
Goodman, R., & Scott, S. (1999). Comparing the Strengths and Difficulties Questionnaire and the Child Behavior Checklist: Is small beautiful? Journal of Abnormal Child Psychology, 27(1), 17–24. https://doi.org/10.1023/A:1022658222914
Goodman, R. (1999). The extended version of the Strengths and Difficulties Questionnaire as a guide to child psychiatric caseness and consequent burden. Journal of Child Psychology and Psychiatry, 40(5), 791–799. https://doi.org/10.1111/1469-7610.00494
Goodman, R., Ford, T., Corbin, T., & Meltzer, H. (2004). Using the SDQ multi-informant algorithm to screen looked-after children for psychiatric disorders. European Child & Adolescent Psychiatry, 13(Suppl. 2), II/25–II/31. https://doi.org/10.1007/s00787-004-2005-3
Goodman, R., Ford, T., Simmons, H., Gatward, R., & Meltzer, H. (2000). Using the Strengths and Difficulties Questionnaire to screen for child psychiatric disorders in a community sample. British Journal of Psychiatry, 177, 534–539. https://doi.org/10.1192/bjp.177.6.534
Hall, C. L., Guo, B., Valentine, A. Z., Groom, M. J., Daley, D., Sayal, K., & Hollis, C. (2019). The validity of the Strengths and Difficulties Questionnaire (SDQ) for children with ADHD symptoms. PLOS ONE, 14(6), e0218518. https://doi.org/10.1371/journal.pone.0218518
Hawes, D. J., & Dadds, M. R. (2004). Australian data and psychometric properties of the Strengths and Difficulties Questionnaire. Australian and New Zealand Journal of Psychiatry, 38, 644–651. https://doi.org/10.1111/j.1440-1614.2004.01427.x
Kankaanpää, R., Töttö, P., Punamäki, R.-L., & Peltonen, K. (2023). Is it time to revise the SDQ? A psychometric evaluation of the Strengths and Difficulties Questionnaire. Psychological Assessment, 35(12), 1069–1084. https://doi.org/10.1037/pas0001265
Khawaja, N. G., & Dhushyanthakumar, L. (2020). Strengths and Difficulties Questionnaire – teacher: Investigating its factor structure and utility with culturally and linguistically diverse students. Journal of Psychologists and Counsellors in Schools, 30, 43–57. https://doi.org/10.1017/jgc.2019.23
Mathai, J., Anderson, P., & Bourne, A. (2003). Use of the Strengths and Difficulties Questionnaire as an outcome measure in a child and adolescent mental health service. Australasian Psychiatry, 11(3), 334–337. https://doi.org/10.1046/j.1440-1665.2003.00544.x
Polancyzyk, G., Salum, G. A., Sugaya, L. S., Caye, A., & Rohde, L. A. (2015). Annual Research Review: A meta-analysis of the worldwide prevalence of mental disorders in children and adolescents. Journal of Child Psychology and Psychiatry, 56(3), 345-365. https://doi.org/10.1111/jcpp.12381
Stone, L. L., Otten, R., Engels, R. C. M. E., Vermulst, A. A., & Janssens, J. M. A. M. (2010). Psychometric properties of the parent and teacher versions of the Strengths and Difficulties Questionnaire for 4- to 12-year-olds: A review. Clinical Child and Family Psychology Review, 13, 254–274. https://doi.org/10.1007/s10567-010-0071-2