El PHQ-9 es la escala de depresión de nueve ítems del Cuestionario de Salud del Paciente y es una herramienta ampliamente utilizada para asistir a los clínicos de atención primaria en la identificación de la depresión, así como en el monitoreo del tratamiento (Kroenke et al., 2001).
El PHQ-9 se basa directamente en los criterios diagnósticos para el trastorno depresivo mayor del Manual Diagnóstico y Estadístico (DSM) y pregunta sobre los síntomas de las dos semanas anteriores. Es una herramienta ampliamente utilizada para el cribado, diagnóstico y monitoreo de la depresión tanto en entornos clínicos como no clínicos (Kocalevent et al., 2013). Clínicamente, apoya la planificación del tratamiento y el seguimiento de los cambios en los síntomas, mientras que en entornos no clínicos, como escuelas o lugares de trabajo, sirve como una herramienta de cribado inicial para identificar a individuos que puedan necesitar una evaluación adicional. El PHQ-9 es apropiado para individuos de 13 años o más, lo que lo hace adecuado para adolescentes y adultos (Kroenke et al., 2001; Richardson et al., 2011).
Las puntuaciones se categorizan en los siguientes rangos (Kroenke et al., 2001):
El PHQ-9 fue creado para proporcionar un método rápido y fiable para evaluar la presencia y gravedad de los síntomas depresivos basándose en los criterios descritos en el DSM. Cada uno de sus nueve ítems corresponde a uno de los síntomas de la depresión mayor, y permite obtener una puntuación de gravedad para facilitar la toma de decisiones clínicas (Kroenke et al., 2001).
Se presenta una puntuación bruta (de 0 a 27) donde puntuaciones más altas indican más síntomas depresivos.

La escala clasifica a los individuos en categorías de gravedad distintas basándose en sus puntuaciones brutas, de la siguiente manera:

Se calculan percentiles que proporcionan un contexto útil para comparar los resultados de un encuestado con una muestra normativa de la comunidad. Un percentil de 50 representa patrones de respuesta típicos, mientras que percentiles más altos representan niveles más elevados de síntomas depresivos. Los percentiles de 76 o inferiores, correspondientes a una puntuación bruta de 4, indican síntomas depresivos nulos o mínimos (Kocalevent et al., 2013).

El gráfico horizontal presenta la puntuación total en comparación con individuos de la población general, individuos con depresión mayor y personas con un trastorno depresivo (distinto de la depresión mayor). Las áreas sombreadas se presentan alrededor de los dos cuartiles centrales (entre el percentil 25 y el 75) (Kroenke et al., 2001; Kocalevent et al., 2013). La distribución de la depresión mayor representa a individuos diagnosticados con depresión mayor. La distribución depresiva representa las puntuaciones de individuos que padecen otro trastorno depresivo, como el trastorno distímico o el trastorno de adaptación con estado de ánimo deprimido.
Se ha demostrado que las puntuaciones de 10 o más predicen de forma fiable la depresión mayor, con una sensibilidad del 81,4%, lo que significa que el 81,4% de los individuos que realmente padecen la afección puntúan por encima de este umbral. El Valor Predictivo Positivo (VPP) es del 92,2%, lo que indica que cuando una puntuación es de 10 o más, existe una probabilidad del 92,2% de que el individuo realmente padezca depresión mayor (Urtasun et al., 2019).

Al utilizar el PHQ-9 para el seguimiento de los síntomas a lo largo del tiempo, un cambio significativo en la puntuación se define como un aumento o disminución de 5 o más puntos. Este criterio se basa en el Índice de Cambio Fiable. Dichos cambios indican una mejora o un deterioro fiable y significativo de los síntomas.
Puntuaciones más altas en el PHQ-9 indican síntomas depresivos más graves, lo que puede ser particularmente preocupante cuando se asocia con trastornos mentales comórbidos. Los individuos con puntuaciones elevadas en el PHQ-9 pueden experimentar sentimientos intensificados de tristeza, ansiedad o malestar, lo que dificulta la gestión de las responsabilidades diarias y las relaciones (Johansson et al., 2013). Esto puede conducir a peores resultados vitales, como un mayor absentismo laboral o escolar, mayores dificultades en las interacciones sociales y se asocia con una mayor prevalencia del consumo de sustancias (Johansson et al., 2013). El PHQ-9 se centra en los síntomas depresivos y, por lo tanto, no detecta otros trastornos de alta prevalencia como la ansiedad o los niveles generales de malestar psicológico.
Un estudio reciente que empleó una muestra no clínica de 58.272 individuos de múltiples países (Edad media = 43, DE = 13, 63% mujeres) encontró que el PHQ-9 consistía en una estructura unidimensional y que el factor general era fuerte (por ejemplo, las cargas factoriales oscilaron entre 0,725 y 0,893 en la muestra combinada) (Bianchi et al., 2022).
To establish reliability and validity, the PHQ-9 was administered to 6,000 patients (pooled mean age = 38.5, SD = 14.32, 83% women) in 8 primary care clinics and 7 obstetrics-gynecology clinics, and construct validity and criterion validity were assessed against independent measures (Kroenke et al., 2001). Criterion validity was assessed against an independent structured mental health professional interview in a sample of 580 patients. The PHQ-9 demonstrates strong convergent validity, correlating with the Brief Beck Depression Inventory (r = 0.73, p <.0001) and the General Health Questionnaire (GHQ-12; r = 0.59, p <.0001). Divergent validity is indicated by a lower correlation with quality of life (EuroQOL; r = -0.50, p <.0001), suggesting a stronger link to mental health than general health perceptions (Martin et al., 2006).
El PHQ-9 también demostró una excelente fiabilidad, con un alfa de Cronbach de 0,89, lo que indica una fuerte consistencia interna. Además, la fiabilidad test-retest durante un período de 48 horas arrojó un coeficiente de correlación de 0,84, lo que sugiere estabilidad en administraciones repetidas (Kroenke et al., 2001).
Utilizando un punto de corte de 10, el rendimiento del PHQ-9 en la detección de la depresión varía según la gravedad. Para la depresión mayor, la sensibilidad es del 81,4%, lo que significa que el PHQ-9 identifica correctamente al 81,4% de los individuos que realmente padecen la afección. La especificidad es del 89,6%, lo que indica que detecta con precisión al 89,6% de aquellos que no tienen depresión mayor. El Valor Predictivo Positivo (VPP) es del 92,2%, lo que sugiere que cuando la prueba indica un resultado positivo, existe una probabilidad del 92,2% de que el individuo realmente padezca depresión mayor. El Valor Predictivo Negativo (VPN) es del 76%, lo que implica que un resultado negativo corresponde a una probabilidad del 76% de que la persona no padezca la afección. Para la depresión moderada, la sensibilidad aumenta al 90,6%, con una especificidad del 84,5%, un VPP del 85,6% y un VPN del 89,9% (Urtasun et al., 2019).
Al utilizar el PHQ-9 para el seguimiento de los síntomas a lo largo del tiempo, un cambio significativo en la puntuación se define como un aumento o disminución de 5 o más puntos. Este criterio se basa en el Índice de Cambio Fiable (McMillan et al., 2010) y se determinó utilizando datos de más de 1.777 episodios de atención distintos medidos en NovoPsych entre septiembre de 2014 y febrero de 2022.
NovoPsych utiliza dos muestras clínicas para contextualizar los resultados en comparación con individuos diagnosticados con depresión mayor y otros trastornos depresivos (Kroenke et al., 2001):
Los percentiles se elaboran a partir de una muestra comunitaria normativa compuesta por 5.018 individuos de la población general (rango de edad: 14-92 años, 53,6% mujeres), lo que representa una amplia distribución demográfica (Kocalevent et al., 2013). El estudio informó que el 76,4% de la muestra obtuvo una puntuación entre 0 y 4, el 18% entre 5 y 9, el 4,3% entre 10 y 14, y el 1,3% una puntuación de 15 o más. Estos datos han sido utilizados por NovoPsych para modelar e interpolar percentiles para el análisis comparativo.
La tabla de percentiles a continuación ilustra cómo las puntuaciones totales (véase la Tabla 1) se comparan con individuos de la comunidad, individuos con otros trastornos depresivos y aquellos con depresión mayor (Kroenke et al., 2001; Kocalevent et al., 2013). Cada puntuación va acompañada de un percentil correspondiente, que indica el porcentaje de individuos que obtuvieron la misma puntuación o una inferior. Por ejemplo, una puntuación total de 5 corresponde al percentil 80 en la muestra comunitaria normativa, al percentil 16 en la muestra de personas con otros trastornos depresivos y al percentil 2 en la muestra de depresión mayor (Tabla 1). Esta puntuación significa que el 80% de los individuos de la población general obtuvo una puntuación de 5 o inferior, mientras que solo el 2% de las personas con depresión mayor. Estos gráficos proporcionan una comprensión de la posición de un encuestado en relación con la muestra comunitaria normativa, aquellos con otros trastornos depresivos y en comparación con individuos con depresión mayor.
Tabla 1. Puntuación Total del PHQ-9: Percentiles de la Comunidad Normativa, Otros Trastornos Depresivos y Depresión Mayor.

Kroenke, K., Spitzer, R. L., & Williams, J. B. W. (2001). The PHQ‐9. Journal of General Internal Medicine : JGIM, 16(9), 606–613. https://doi.org/10.1046/j.1525-1497.2001.016009606.x
Bianchi, R., Verkuilen, J., Toker, S., Schonfeld, I. S., Gerber, M., Brähler, E., & Kroenke, K. (2022). Is the PHQ-9 a Unidimensional Measure of Depression? A 58,272-Participant Study. Psychological Assessment, 34(6), 595–603. https://doi.org/10.1037/pas0001124
Johansson, R., Carlbring, P., Heedman, Å., Paxling, B., & Andersson, G. (2013). Depression, anxiety and their comorbidity in the Swedish general population: point prevalence and the effect on health-related quality of life. PeerJ, 1, e98-. https://doi.org/10.7717/peerj.98
Kocalevent, R.-D., Hinz, A., & Brähler, E. (2013). Standardization of the depression screener Patient Health Questionnaire (PHQ-9) in the general population. General Hospital Psychiatry, 35(5), 551–555. https://doi.org/10.1016/j.genhosppsych.2013.04.006
Kroenke, K., Spitzer, R. L., & Williams, J. B. W. (2001). The PHQ‐9. Journal of General Internal Medicine : JGIM, 16(9), 606–613. https://doi.org/10.1046/j.1525-1497.2001.016009606.x
Martin, A., Rief, W., Klaiberg, A., & Braehler, E. (2006). Validity of the Brief Patient Health Questionnaire Mood Scale (PHQ-9) in the general population. General Hospital Psychiatry, 28(1), 71–77. https://doi.org/10.1016/j.genhosppsych.2005.07.003
McMillan, D., Gilbody, S., & Richards, D. (2010). Defining successful treatment outcome in depression using the PHQ-9: A comparison of methods. Journal of Affective Disorders, 127(1), 122–129. https://doi.org/10.1016/j.jad.2010.04.030
Richardson, L. P., McCauley, E., Grossman, D. C., McCarty, C. A., Richards, J., Russo, J. E., Rockhill, C., & Katon, W. (2010). Evaluation of the Patient Health Questionnaire-9 Item for detecting major depression among adolescents. Pediatrics, 126(6), 1117-1123. https://doi.org/10.1542/peds.2010-0852
Urtasun, M., Daray, F. M., Teti, G. L., Coppolillo, F., Herlax, G., Saba, G., Rubinstein, A., Araya, R., & Irazola, V. (2019). Validation and calibration of the patient health questionnaire (PHQ-9) in Argentina. BMC Psychiatry, 19(1), 291–291. https://doi.org/10.1186/s12888-019-2262-9