El Cuestionario de Preocupación y Estabilidad de Género-2 (GPSQ-2) es una medida de autoinforme de 14 ítems para evaluar el malestar relacionado con el género (disforia de género) en adolescentes y adultos, y fue desarrollado por Bowman et al. (2024).
El GPSQ-2 fue desarrollado para asistir en la evaluación de los resultados relacionados con la atención de afirmación de género (médica, quirúrgica, social o psicológica) en personas transgénero y con diversidad de género. El GPSQ-2 revisó el GPSQ original (Hakeem et al., 2016) para mejorar su validez y extender su uso a adolescentes de 13 años o más (Bowman et al., 2024).
La disforia de género puede implicar un malestar significativo y una preocupación por la discrepancia entre el sexo asignado al nacer y el género identificado, así como una variabilidad interna en cómo se percibe el propio género (Bouman et al., 2016). El GPSQ-2 se centra en dos aspectos fundamentales de la disforia de género: la preocupación con el género y la estabilidad de la identidad de género:
En la práctica clínica, las puntuaciones del GPSQ-2 pueden orientar las conversaciones, ya que las puntuaciones altas en ciertos ítems pueden ayudar a los clientes a articular malestares o metas específicas (p. ej., “Veo que le ha preocupado mucho el hecho de que se le impida vivir en su género afirmado; exploremos qué está desencadenando esos sentimientos”). La escala también proporciona una medida estandarizada del malestar relacionado con el género, lo que permite el seguimiento del progreso del cliente. Dado que la escala pregunta sobre las últimas dos semanas, puede repetirse a intervalos quincenales para monitorear los cambios en los sentimientos de malestar por disforia.
La investigación sobre la escala ha demostrado correlaciones significativas con varios constructos psicológicos como la depresión (PHQ-9), la ansiedad (GAD-7) y el malestar (K-10) (Bowman et al., 2024).
La investigación de Donaghy et al. (2024) demostró una excelente capacidad predictiva positiva (99%) con el diagnóstico de clínicas especializadas en género utilizando la escala predecesora, el GPSQ. Dada la alta correlación entre el GPSQ y el GPSQ-2 (r = 0.91), los clínicos pueden confiar en la capacidad del GPSQ-2 para identificar el malestar relacionado con el género, junto con una validez de contenido mejorada para adolescentes.
El GPSQ-2 puede ayudar en la formulación y la orientación del tratamiento evaluando los pensamientos disfóricos y la variabilidad de la identidad de género. Por ejemplo, alguien con alta preocupación pero baja inestabilidad podría tener un género firmemente identificado pero estar angustiado por las barreras para vivir en ese rol de género. En contraste, alguien con alta fluctuación en la identidad podría beneficiarse de la terapia exploratoria antes de buscar intervenciones médicas que puedan implicar cambios duraderos.
La puntuación total oscila entre 0 y 56, donde las puntuaciones más altas indican experiencias más intensas de disforia de género. Los rangos de las puntuaciones brutas de las subescalas se enumeran a continuación:
El GPSQ-2 puede utilizarse para detectar el malestar relacionado con el género, orientar la planificación del tratamiento y monitorear los cambios a lo largo del tiempo en la terapia o después de las intervenciones.

En la primera administración, un gráfico de barras apiladas muestra la puntuación total y la de cada una de las dos subescalas en percentiles de diversidad de género. Los percentiles contextualizan la puntuación de un cliente, mostrando cómo se compara con sus pares. Por ejemplo, un percentil de 50 representa el nivel típico de malestar por disforia de género entre los miembros de la comunidad con diversidad de género.

También se presenta un gráfico de comparación horizontal que muestra la puntuación del encuestado en comparación con las muestras cisgénero, con diversidad de género y clínicas.

Cuando se administra en múltiples ocasiones, se presenta un gráfico de líneas para la puntuación total bruta, con etiquetas de percentiles de diversidad de género a la derecha.

Se presenta un segundo gráfico de líneas que representa cada una de las dos subescalas en términos de percentiles de diversidad de género.

Los cambios significativos en la puntuación total se indican mediante desviaciones de media desviación estándar o superiores (aproximadamente 6 puntos de puntuación total o más), siguiendo las directrices de la Diferencia Mínimamente Importante (Turner et al., 2010).
Las categorías de gravedad para las puntuaciones totales y de las subescalas fueron creadas por Bowman (2022) y ajustadas por NovoPsych para alinearlas (total y subescala) basándose en la distribución percentil de la puntuación total en la muestra de diversidad de género de Bowman (2024):
El GPSQ-2 demuestra una sólida validez de constructo como medida de la preocupación relacionada con el género y la estabilidad de la identidad. Se empleó un proceso de validez de contenido que incluyó la retroalimentación de expertos y pruebas piloto para desarrollar ítems relevantes y comprensibles. Las pruebas empíricas revelan altas correlaciones con medidas relacionadas, como la Escala de Congruencia de Género y Satisfacción con la Vida (GCLS) y la Escala de Reflexión y Rumiación de la Identidad de Género (GRRS) (Bowman et al., 2024).
El análisis factorial indica que el GPSQ-2 posee una estructura de dos factores que corresponde a sus subescalas teóricas: Preocupación e Inestabilidad (Bowman et al., 2024). El modelado bifactorial reveló además que las dos subescalas son empíricamente separables, aunque se encuentran bajo un factor general dominante. Índices estadísticos como el omega jerárquico de McDonald (ω 0.84) y la varianza común explicada indicaron que la mayor parte de la varianza fiable en las puntuaciones del GPSQ-2 se explica por un factor general de disforia. En términos prácticos, el GPSQ-2 puede considerarse principalmente unidimensional, aunque reconociendo dos subdimensiones significativas. Por lo tanto, los clínicos pueden utilizar legítimamente la puntuación total como un índice general de la gravedad de la disforia de género, o examinar las puntuaciones de las subescalas para obtener información más matizada.
El GPSQ-2 demuestra una fiabilidad excelente. La consistencia interna es alta para la escala total y buena para cada subescala. En la muestra de validación primaria (n=141), el alfa de Cronbach fue α = .92 para la puntuación total, α = .89 para preocupación, y α = .86 para Inestabilidad. La fiabilidad test-retest se examinó en un subconjunto de participantes (n=69) que volvieron a realizar el GPSQ-2 después de dos semanas. El coeficiente de correlación intraclase (CCI) para la puntuación total fue alto, de .88. Las subescalas mostraron valores test-retest similares (.88 para preocupación, y .81 para Inestabilidad).
Bowman et al. (2024) han reportado datos normativos de una muestra comunitaria de diversidad de género reclutada de sitios de redes sociales y grupos de apoyo trans y de diversidad de género (n=141). En esta muestra, el 65% se identificó como binario (es decir, hombre/transhombre/mujer/transmujer) y el 35% como participantes no binarios/género fluido (es decir, transgénero, no binario, agénero). Los autores informaron una puntuación total media de 22.95 (DE = 12.25). La Tabla 1 proporciona detalles adicionales que incluyen edad, medias y desviaciones estándar de las subescalas; además, Bowman (2022) también reporta normas clínicas adicionales de diversidad de género (n=32) y comunitarias cisgénero (n=122).
Los puntos de corte se establecieron mediante análisis de la curva característica operativa del receptor (ROC) para evaluar la capacidad del GPSQ-2 para clasificar a los individuos basándose en sus experiencias subjetivas de puntuaciones de angustia relacionadas con el género (una escala de 1 ítem y 5 puntos que evalúa el grado de angustia experimentado en las dos semanas anteriores en relación con la disforia de género). El análisis ROC determinó la capacidad del GPSQ-2 para predecir diferentes niveles de angustia medidos por el ítem único. La puntuación total mostró una discriminación excelente, con una sensibilidad del 97% y una especificidad del 87% en un punto de corte de 15. La subescala de Preocupación tuvo un rendimiento similar (sensibilidad = 97%, especificidad = 87%) en un punto de corte de 13, mientras que la subescala de Inestabilidad tuvo un poder de clasificación más moderado (sensibilidad = 69%, especificidad = 73%) en un punto de corte de 3.
Las categorías de gravedad para la puntuación total y las subescalas son delineadas por Bowman (2022), creadas basándose en el análisis ROC descrito anteriormente y una prueba ANOVA unidireccional de diferencias entre las categorías de angustia (desde "ninguna angustia" hasta "mucha angustia").
Total:
Preocupación:
Inestabilidad:
Aunque la puntuación total y las puntuaciones de las subescalas presentan diferentes rangos de gravedad de puntuación bruta, como se indicó anteriormente, NovoPsych ajustó los rangos para alinearlos basándose en la distribución percentil de la puntuación total en la muestra de género diverso de Bowman et al. (2024). Estos nuevos rangos de gravedad funcionan de manera similar a los rangos de puntuación bruta anteriores, pero permiten que las puntuaciones totales y de las subescalas se grafiquen conjuntamente en términos de percentiles para género diverso:
Bowman, S. J., Hakeem, A., Demant, D., McAloon, J., & Wootton, B. M. (2024). Assessing Gender Dysphoria: Development and Validation of the Gender Preoccupation and Stability Questionnaire – 2nd Edition (GPSQ-2). Journal of homosexuality, 71(3), 666–690. https://doi.org/10.1080/00918369.2022.2132440
Bartholomew, E., Smyth, C., Buchanan, B., Baker, S., Hegarty, D. (2025). A Review of the Gender Preoccupation and Stability Questionnaire-2 (GPSQ-2): Qualitative Descriptors, Psychometric Properties, and Normative Data.
Bouman, W. P., Claes, L., Brewin, N., Crawford, J. R., Millet, N., Fernandez-Aranda, F., & Arcelus, J. (2016). Transgender and anxiety: A comparative study between transgender people and the general population. International Journal of Transgenderism, 18(1), 16–26. https://doi.org/10.1080/15532739.2016.1258352
Bowman, S. J., Hakeem, A., Demant, D., McAloon, J., & Wootton, B. M. (2024). Assessing Gender Dysphoria: Development and Validation of the Gender Preoccupation and Stability Questionnaire – 2nd Edition (GPSQ-2). Journal of Homosexuality, 71(3), 666–690. https://doi.org/10.1080/00918369.2022.2132440
Bowman, S. J. (2022). Assessing gender dysphoria (Doctoral dissertation, University of Technology Sydney). University of Technology Sydney.
Donaghy, O. J. E., Cobham, V., & Lin, A. (2024). Screening adolescent transgender-related distress: Gender preoccupation and stability questionnaire demonstrates excellent criterion validity with multi-disciplinary, pediatric gender specialist assessment. International Journal of Transgender Health. Advance online publication. https://doi.org/10.1080/26895269.2024.2378378
Hakeem, A., Črnčec, R., Asghari-Fard, M., Harte, F., & Eapen, V. (2016). Development and validation of a measure for assessing gender dysphoria in adults: The Gender Preoccupation and Stability Questionnaire. International Journal of Transgenderism, 17(3-4), 131–140. https://doi.org/10.1080/15532739.2016.1217812
Portney, L. G. (2020). Foundations of clinical research: Applications to evidence-based practice (4th) ed.). McGraw-Hill.
Turner, D., Schünemann, H. J., Griffith, L. E., Beaton, D. E., Griffiths, A. M., Critch, J. N., & Guyatt, G. H. (2010). The minimal detectable change cannot reliably replace the minimal important difference. Journal of Clinical Epidemiology, 63(1), 28–36. https://doi.org/10.1016/j.jclinepi.2009.01.024