El Inventario de Obsesión-Compulsión Revisado (OCI-R) es una medida breve, bien validada y de 18 ítems que evalúa los síntomas obsesivo-compulsivos. Su cumplimentación requiere aproximadamente 3 minutos y es adecuado para adultos a partir de los 18 años. El OCI-R es ampliamente utilizado para el cribado, la planificación del tratamiento y el seguimiento del progreso terapéutico. Tras la reclasificación del trastorno de acumulación (hoarding) como un trastorno independiente del TOC en el DSM-5, la medida se puntúa en dos componentes distintos: cinco subescalas de TOC (Lavado, Comprobación, Orden, Obsesión y Neutralización) que comprenden 15 ítems, y una subescala de Acumulación que comprende 3 ítems. Este enfoque de puntuación permite una evaluación independiente de los síntomas del TOC y del trastorno de acumulación, en consonancia con la clasificación diagnóstica contemporánea.
El Inventario de Obsesión-Compulsión Revisado (OCI-R; Foa et al., 2002) es un cuestionario de autoinforme de 18 ítems que mide los síntomas del trastorno obsesivo-compulsivo (TOC) durante el último mes. Cada ítem evalúa el grado de malestar o incomodidad experimentado en situaciones/experiencias específicas. Es adecuado para su uso en adultos; sin embargo, la versión en español ha sido validada para su uso en individuos a partir de los 16 años (Piqueras et al., 2009). Puntuaciones más altas indican una mayor gravedad/intensidad de los síntomas tanto en la escala total como en las subescalas individuales. El OCI-R evalúa las conductas relacionadas con el TOC en seis dominios sintomáticos:
Pregunta de ejemplo del OCI-R

Cuando el OCI-R fue desarrollado originalmente, el DSM aún conceptualizaba el trastorno de acumulación como un síntoma del TOC. Sin embargo, el DSM-5 reclasificó el trastorno de acumulación como un diagnóstico distinto y separado del TOC. Investigaciones contemporáneas han demostrado desde entonces que el OCI-R puede evaluar de forma fiable ambas condiciones cuando se puntúa adecuadamente (Wootton et al., 2015): el OCI-R de 15 ítems (excluyendo los 3 ítems de acumulación) proporciona una medida válida de los síntomas del TOC, mientras que la subescala de Acumulación de 3 ítems evalúa los síntomas relacionados con la acumulación. Por lo tanto, los clínicos deben interpretar estos componentes por separado en lugar de depender únicamente de la puntuación total de 18 ítems, especialmente cuando el diagnóstico diferencial es relevante.
Más allá de la medición de la gravedad de los síntomas, el OCI-R apoya la toma de decisiones clínicas en tres contextos clave: cribado, evaluación inicial y planificación del tratamiento, y seguimiento continuo de los resultados:
Cribado y evaluación: El OCI-R cumple múltiples funciones a lo largo del proceso de evaluación y tratamiento. Como herramienta de cribado, identifica eficientemente a los individuos que podrían requerir una evaluación diagnóstica adicional para el TOC y/o el trastorno de acumulación (TA). Durante la evaluación inicial, el OCI-R proporciona un perfil sintomático completo en múltiples dominios del TOC, ayudando a los clínicos a identificar qué dimensiones sintomáticas son más prominentes e informando directamente la formulación del caso y la planificación del tratamiento. La estructura de subescalas permite a los clínicos comprender la complejidad y amplitud de la presentación del TOC de un individuo, en lugar de depender únicamente de una puntuación total de gravedad.
Seguimiento de resultados: La brevedad del OCI-R, combinada con su estructura de subescalas, lo hace particularmente valioso para la administración repetida en el seguimiento rutinario de resultados. La administración regular permite a los clínicos seguir los cambios en los síntomas a lo largo del tiempo, identificar qué dominios sintomáticos específicos están respondiendo a la intervención y detectar cualquier síntoma emergente en dominios previamente no afectados. También se ha demostrado la sensibilidad de la medida a los efectos del tratamiento para la terapia cognitivo-conductual (Abramovitch et al., 2006).
Interpretación individualizada: La estructura de subescalas del OCI-R permite a los clínicos adaptar la interpretación a las presentaciones individuales. Por ejemplo, un individuo cuya dificultad principal son las compulsiones de comprobación puede ser seguido directamente, sin que síntomas no relacionados en otras subescalas enmascaren una mejora significativa. Este enfoque granular proporciona información clínica más significativa que la puntuación total por sí sola y puede guiar los ajustes en el enfoque del tratamiento cuando dominios sintomáticos específicos demuestran resistencia a la intervención.
La escala OCI-R produce una medida de malestar derivado de las conductas del TOC (OCI-TOC; Tabla 1). La puntuación OCI-TOC se basa en los 15 ítems del TOC (rango de puntuación total: 0-60), donde puntuaciones más altas indican un mayor malestar/angustia por las conductas del TOC. Un punto de corte clínico de 12 sugiere un nivel clínico de malestar por las conductas del TOC. La Figura 1 muestra la puntuación total de TOC del individuo en relación con las distribuciones de la población comunitaria y clínica de TOC, ilustrando la puntuación del individuo en relación con cada grupo.
Interpretación de la Gravedad de la Puntuación Total OCI-TOC. Los descriptores de gravedad se asignan en función de la puntuación total del OCI-TOC, utilizando umbrales de puntuación bruta que corresponden a divisiones percentiles significativas dentro de las poblaciones clínicas con TOC. Las etiquetas de los descriptores se extraen del lenguaje de la escala de respuesta del OCI-R para mantener la coherencia interpretativa (Tabla 2).
Rangos de Descriptores de Gravedad del OCI-TOC (basados en la Muestra Normativa de TOC):

La puntuación total del TOC se compone de cinco subescalas (15 ítems en total):
En segundo lugar, una puntuación total OCI-HD (ítems 1, 7, 13), que mide la dificultad para desechar posesiones, la adquisición excesiva de objetos y los problemas de desorden que interfieren con los espacios habitables. La puntuación OCI-HD oscila entre 0 y 12; las puntuaciones más altas sugieren una mayor angustia derivada del comportamiento de acumulación.
Puntuación de TOC comparada con poblaciones comunitarias y clínicas de TOC para mostrar cómo se compara el cliente con estas dos poblaciones.


Los descriptores de gravedad para las subescalas específicas del TOC (Lavado, Obsesión, Ordenamiento, Comprobación, Neutralización) también están vinculados a las opciones de respuesta (p. ej., En absoluto, Un poco, Moderadamente, Mucho y Extremadamente). Cada subescala consta de tres ítems; las puntuaciones brutas se dividen por tres para calcular la puntuación promedio del ítem, que luego se asigna a los descriptores de gravedad utilizando los límites de la escala de respuesta (Figura 3). Este enfoque proporciona a los clínicos una indicación directa de cuán angustiante es cada dominio sintomático específico para el individuo, lo que puede ayudar a informar la planificación del tratamiento y a priorizar las intervenciones terapéuticas:
Nota: Para la subescala de Obsesión, los percentiles pueden subestimar la gravedad clínica. Las obsesiones son comunes en el TOC, por lo que las calificaciones de gravedad basadas en la angustia reportada suelen ser más informativas que el rango percentil.

El OCI-R también puede medir comportamientos de acumulación y proporcionar una puntuación de trastorno de acumulación basada en tres ítems de acumulación (1, 7, 13), que evalúan la dificultad para desechar posesiones, la adquisición excesiva de objetos y los problemas de desorden que interfieren con los espacios habitables. La puntuación del trastorno de acumulación oscila entre 0 y 12; las puntuaciones más altas sugieren una mayor angustia derivada del comportamiento de acumulación. Un punto de corte clínico de 6 (Wootton et al., 2015) sugiere un nivel clínico de angustia por los síntomas de acumulación. Las clasificaciones percentiles, calculadas en relación con una muestra clínica de TOC, pueden informarse solo para comparación contextual; a diferencia del OCI-TOC, no se aplican descriptores de gravedad graduados, y la interpretación clínica se basa únicamente en si se cumple el punto de corte clínico.
La estructura de 6 factores del OCI-R (Foa et al., 2002) valida que las seis subescalas de la medida —Lavado, Obsesión, Orden, Comprobación, Neutralización y Acumulación— evalúan dimensiones sintomáticas distintas. Tras la reclasificación del DSM-5, las cinco subescalas de TOC se puntúan ahora por separado de la subescala de Acumulación (OCI-TOC: 15 ítems; OCI-AC: 3 ítems). Esta estructura ha sido ampliamente respaldada en poblaciones clínicas y no clínicas (Gönner et al., 2008; Abramovitch et al., 2020; Chasson et al., 2013; Hajcak et al., 2004).
Fiabilidad de la Escala: El OCI-R demuestra una fiabilidad de la escala total de buena a excelente en muestras clínicas (α = .81-.93) y no clínicas (α = .90; Foa et al., 2002; Abramovitch et al., 2020; Veale et al., 2016). Las validaciones transculturales han confirmado propiedades psicométricas robustas (Fullana et al., 2005; Gönner et al., 2008; Belloch et al., 2013; Chasson et al., 2013), aunque las subescalas de Neutralización y Obsesión ocasionalmente caen por debajo de los umbrales aceptables en contextos clínicos específicos, lo que requiere una interpretación cautelosa.
Consistencia Interna: Subescalas. Las seis subescalas del OCI-R muestran una fiabilidad generalmente sólida, aunque esta varía según la dimensión sintomática específica que se mida y la población evaluada. Tanto en muestras comunitarias como clínicas, las subescalas de Orden, Lavado y Acumulación demuestran consistentemente la fiabilidad más alta (α = .87–.94 en todos los estudios; Abramovitch et al., 2020; Foa et al., 2002; Veale et al., 2016), mientras que Comprobación y Obsesión muestran una fiabilidad adecuada en la mayoría de los contextos (α = .82–.88; Abramovitch et al., 2020; Foa et al., 2002).
Limitaciones de Fiabilidad Específicas de la Subescala. La subescala de Neutralización presenta las preocupaciones más significativas en cuanto a fiabilidad, particularmente cuando se utiliza con individuos con historiales de trauma o TEPT, donde la fiabilidad puede disminuir drásticamente (α = .34 en muestras con TEPT; Abramovitch et al., 2020). En tales poblaciones, esta subescala podría no medir consistentemente un constructo coherente, lo que requiere una interpretación cuidadosa. De manera similar, al evaluar a individuos sin trastornos de ansiedad, la subescala de Comprobación puede mostrar una fiabilidad reducida (α = .65 en controles no ansiosos; Abramovitch et al., 2020). La subescala de Obsesión ocasionalmente cae por debajo de los umbrales aceptables en subgrupos específicos (α = .31 en algunas submuestras; Veale et al., 2016), aunque generalmente tiene un rendimiento adecuado.
Interpretación Clínica de la Fiabilidad. En la práctica clínica, la mayoría de las subescalas pueden interpretarse con confianza, pero Neutralización y Obsesión deben considerarse con cautela, especialmente en poblaciones donde se ha demostrado una disminución de la fiabilidad. Cuando las puntuaciones en estas subescalas parezcan inconsistentes con la presentación clínica, los clínicos deben apoyarse más en los datos de la entrevista y otros indicadores de síntomas.
Fiabilidad Test-Retest: La estabilidad temporal del OCI-R ha sido examinada en intervalos relativamente cortos, apropiados para establecer que la medida captura rasgos estables en lugar de estados transitorios. Foa et al. (2002) evaluaron a 41 individuos con TOC durante aproximadamente 2 semanas y encontraron una excelente fiabilidad test-retest para la puntuación total (r = .84), con correlaciones de subescalas que oscilaron entre .74 y .91. En una muestra de 69 controles no ansiosos evaluados durante aproximadamente 1 semana, la puntuación total demostró una buena fiabilidad (r = .74), con correlaciones de subescalas que variaron entre .57 y .87. Entre las subescalas, Obsesión, Lavado y Comprobación mostraron la estabilidad temporal más fuerte (r = .72 a .77 en muestras con TOC), mientras que Neutralización y Acumulación mostraron una estabilidad algo menor, pero aún aceptable (r = .54 a .58). Estos intervalos test-retest más cortos minimizan la probabilidad de que ocurran cambios sintomáticos reales entre las administraciones, proporcionando confianza en que la estabilidad de la puntuación refleja la fiabilidad de la medición y no la fluctuación de los síntomas.
Implicaciones Clínicas para la Evaluación Repetida. Los coeficientes test-retest indican que el OCI-R produce puntuaciones consistentes cuando los síntomas permanecen estables, lo que lo hace adecuado para el seguimiento del cambio a lo largo del tiempo en contextos de tratamiento. Sin embargo, los clínicos deben tener en cuenta que la fiabilidad test-retest comúnmente referenciada de r = .82 (Veale et al., 2016) afecta los cálculos de los índices de cambio fiable —medidas utilizadas para determinar si los cambios observados en la puntuación exceden el error de medición y representan una mejora clínica genuina en lugar de una fluctuación aleatoria.
Validez Convergente y de Criterio. Cuando las puntuaciones del OCI-R se comparan con otras medidas establecidas de TOC, existe un acuerdo moderado en general. El OCI-R se alinea bien con otros cuestionarios de autoinforme para el TOC, mostrando una fuerte correspondencia con el Inventario Obsesivo-Compulsivo de Maudsley (r = .85 en muestras clínicas, r = .65 en estudiantes; Foa et al., 2002). Sin embargo, muestra un acuerdo más débil con las entrevistas administradas por clínicos, como la Escala Obsesivo-Compulsiva de Yale-Brown (Y-BOCS), la herramienta diagnóstica de referencia (r = .53 en muestras no clínicas, Foa et al., 2002; r = .41 en muestras clínicas, Abramowitz et al., 2006).
En la práctica, estos hallazgos significan que la puntuación OCI-R de un individuo no siempre se alinea con lo que se esperaría de una entrevista clínica estructurada. El OCI-R puede capturar un malestar más amplio que se superpone con preocupaciones similares al TOC, en lugar de los síntomas específicos que identificaría una entrevista Y-BOCS.
Validez Divergente. El OCI-R se correlaciona con medidas de depresión (r = .39 a .41) y ansiedad (r = .42 a .47) a niveles aproximadamente similares a su correlación con la Y-BOCS (Hajcak et al., 2003; Abramowitz et al., 2006). Esto significa que las puntuaciones elevadas del OCI-R pueden reflejar en parte un estado de ánimo bajo comórbido o ansiedad generalizada, en lugar de solo la gravedad de los síntomas del TOC. Dadas las altas tasas de depresión y ansiedad entre las personas con TOC (Chen et al., 2025; Rowe et al., 2022), esta superposición es esperable; sin embargo, los clínicos deben interpretar las puntuaciones elevadas con cautela y considerar el cuadro clínico más amplio en lugar de confiar únicamente en el OCI-R.
Los puntos de corte clínicos para el OCI-R se basaron en Wootten et al. (2015) debido a que su muestra consistía en poblaciones tanto clínicas como no clínicas, así como a su enfoque de dividir el OCI-R en componentes de TOC (OCI-TOC) y acumulación (OCI-AC). Utilizando este enfoque de división, los autores sugirieron una puntuación de 12 o superior para indicar significación clínica para el componente de TOC de la escala, basándose en hallazgos de que esta puntuación proporcionaba el mejor equilibrio entre falsos positivos y falsos negativos (identificó al 82% de los pacientes con TOC y excluyó correctamente al 83% de los individuos sin TOC).
En cuanto a la acumulación, Wootton et al. (2015) sugieren que una puntuación de 6 o superior indicaría un nivel clínico de acumulación, dado que esta puntuación identificó correctamente al 92% de los pacientes con acumulación, mientras que excluyó correctamente al 93% de los individuos que no cumplían los criterios de acumulación.
Para identificar un cambio significativo en las puntuaciones del OCI-R a lo largo de las administraciones del tratamiento, la Diferencia Mínima Importante (DMI) proporciona umbrales apropiados para los componentes de TOC y acumulación. La DMI (definida como un cambio de 0.5 desviaciones estándar, redondeado al alza) ha demostrado utilidad para evaluar cambios clínicamente significativos en escalas relacionadas con la salud (Norman et al., 2003; Turner et al., 2010). Para el componente OCI-TOC de 15 ítems, los umbrales de DMI son 7 puntos para pacientes con TOC, 5 puntos para pacientes con acumulación y 2 puntos para individuos no clínicos. Para el componente OCI-AC de 3 ítems, la DMI es de 2 puntos en todas las poblaciones. Para los clínicos que monitorean el progreso del tratamiento, estos umbrales ayudan a distinguir entre cambios que reflejan una mejora clínica genuina y aquellos probablemente debidos a errores de medición. Un paciente con TOC cuya puntuación OCI-TOC disminuye en 7 puntos o más puede considerarse que ha experimentado una reducción significativa en la carga sintomática, mientras que los cambios de 5-6 puntos son ambiguos, ya que pueden representar un error en la escala o un verdadero cambio clínico.
Sí, el OCI-R es muy adecuado para la administración repetida con el fin de seguir los cambios sintomáticos a lo largo del tiempo. Su formato breve y su sensibilidad demostrada a los efectos del tratamiento lo hacen práctico para el monitoreo rutinario de resultados en entornos clínicos. La estructura de subescalas permite a los clínicos identificar qué dominios sintomáticos específicos están respondiendo a la intervención.
Sí, el OCI-R es una herramienta de cribado eficiente que puede identificar a individuos que podrían requerir una evaluación diagnóstica adicional para el TOC y/o el trastorno de acumulación. Sin embargo, las puntuaciones elevadas siempre deben ir seguidas de una evaluación clínica exhaustiva, ya que el OCI-R no es un instrumento diagnóstico por sí mismo.
El OCI-R se puntúa ahora como dos componentes separados: la puntuación OCI-TOC de 15 ítems (excluyendo los ítems de acumulación) que oscila entre 0 y 60, y la puntuación OCI-AC de 3 ítems que oscila entre 0 y 12. Este enfoque de puntuación dividida se alinea con la clasificación del DSM-5 y permite una evaluación independiente de los síntomas de TOC y acumulación.
Sí, el OCI-R puede completarse de forma remota como una medida de autoinforme. No obstante, los clínicos deben revisar las respuestas con el cliente para clarificar cualquier ítem ambiguo y contextualizar las puntuaciones dentro del cuadro clínico más amplio. La administración remota es particularmente útil para el monitoreo rutinario de resultados entre sesiones o para el cribado previo a la cita.
Para puntuaciones por encima del umbral clínico (≥12), los descriptores de gravedad (Un poco, Moderadamente, Mucho, Extremadamente) se basan en rangos percentiles dentro de poblaciones clínicas con TOC, no en las respuestas promedio del cliente a los ítems. Estos descriptores indican dónde se sitúa la carga sintomática del individuo en relación con otros diagnosticados con TOC. Por ejemplo, "Mucho angustiante" indica que la puntuación supera aproximadamente al 86-98% de los individuos en muestras clínicas de TOC.
Foa, E. B., Huppert, J. D., Leiberg, S., Langner, R., Kichic, R., Hajcak, G., & Salkovskis, P. M. (2002). The Obsessive-Complusive Inventory: Development and validation of a short version. Psychological Assessment, 14(4), 485–495. https://doi.org/10.1037//1040-3590.14.4.485
Abramowitz, J. S., & Deacon, B. J. (2006). Psychometric properties and construct validity of the Obsessive–Compulsive Inventory—Revised: Replication and extension with a clinical sample. Journal of Anxiety Disorders, 20(8), 1016–1035. https://doi.org/10.1016/j.janxdis.2006.03.001
Abramovitch, A., Abramowitz, J. S., Riemann, B. C., & McKay, D. (2020). Severity benchmarks and contemporary clinical norms for the Obsessive-Compulsive Inventory-Revised (OCI-R). Journal of Obsessive-Compulsive and Related Disorders, 27, Article 100557. https://doi.org/10.1016/j.jocrd.2020.100557
Belloch, A., Roncero, M., García-Soriano, G., Carrió, C., Cabedo, E., & Fernández-Álvarez, H. (2013). The Spanish version of the Obsessive-Compulsive Inventory-Revised (OCI-R): Reliability, validity, diagnostic accuracy, and sensitivity to treatment effects in clinical samples. Journal of Obsessive-Compulsive and Related Disorders, 2(3), 249–256. https://doi.org/10.1016/j.jocrd.2013.05.001
Cella, D., Choi, S., Garcia, S., Cook, K. F., Rosenbloom, S., Lai, J.-S., Tatum, D. S., & Gershon, R. (2014). Setting standards for severity of common symptoms in oncology using the PROMIS item banks and expert judgment. Quality of Life Research, 23(10), 2651–2661. https://doi.org/10.1007/s11136-014-0732-6
Chasson, G. S., Tang, S., Gray, B., Sun, H., & Wang, J. (2013). Further Validation of a Chinese Version of the Obsessive-Compulsive Inventory-Revised. Behavioural and Cognitive Psychotherapy, 41(2), 249–254. https://doi.org/10.1017/S1352465812000379
Cheng, S., Chen, Z., Wu, C., Li, X., Shen, X., Qiu, R., Tang, N., Feng, C., Wang, W., Lv, J., Yuan, S., & Liu, X. (2025). The comorbidity of anxiety and depression symptoms in obsessive–compulsive disorder: a network analysis. Frontiers in Psychiatry, 16, 1567448. https://doi.org/10.3389/fpsyt.2025.1567448
Fullana, M. A., Tortella-Feliu, M., Caseras, X., Andión, Ó., Torrubia, R., & Mataix-Cols, D. (2005). Psychometric properties of the Spanish version of the Obsessive–Compulsive Inventory—Revised in a non-clinical sample. Journal of Anxiety Disorders, 19(8), 893–903. https://doi.org/10.1016/j.janxdis.2004.10.004
Gönner, S., Leonhart, R., & Ecker, W. (2008). The Obsessive–Compulsive Inventory-Revised (OCI-R): Validation of the German version in a sample of patients with OCD, anxiety disorders, and depressive disorders. Journal of Anxiety Disorders, 22(4), 734–749. https://doi.org/10.1016/j.janxdis.2007.07.007
Hajcak, G., Huppert, J. D., Simons, R. F., & Foa, E. B. (2004). Psychometric properties of the OCI-R in a college sample. Behaviour Research and Therapy, 42(1), 115–123. https://doi.org/10.1016/j.brat.2003.08.002
Norman, G. R., Sloan, J. A., & Wyrwich, K. W. (2003). Interpretation of changes in health-related quality of life: The remarkable universality of half a standard deviation. Medical Care, 41(5), 582–592. https://doi.org/10.1097/01.MLR.0000062554.74615.4C
Piqueras, J. A., Martínez-González, A. E., Hidalgo, M. D., Fullana, M. A., Mataix-Cols, D., & Rosa-Alcázar, A. I. (2009). Psychometric properties of the Obsessive-Compulsive Inventory-Revised in a non-clinical sample of late adolescents. Behavioral Psychology/Psicología Conductual, 17(3), 561-572.
Rönkkö, M., & Cho, E. (2022). An Updated Guideline for Assessing Discriminant Validity. Organizational Research Methods, 25(1), 6–14. https://doi.org/10.1177/1094428120968614
Rowe, C., Deledalle, A., & Boudoukha, A. H. (2022). Psychiatric comorbidities of obsessive‐compulsive disorder: A series of systematic reviews and meta‐analyses. Journal of Clinical Psychology, 78(4), 469–484. https://doi.org/10.1002/jclp.23240
Solem, S., Hjemdal, O., Vogel, P. A., & Stiles, T. C. (2010). A Norwegian version of the Obsessive-Compulsive Inventory-Revised: Psychometric properties. Scandinavian Journal of Psychology, 51(6), 509–516. https://doi.org/10.1111/j.1467-9450.2009.00798.x
Wootton, B. M., Diefenbach, G. J., Bragdon, L. B., Steketee, G., Frost, R. O., & Tolin, D. F. (2015). A Contemporary Psychometric Evaluation of the Obsessive Compulsive Inventory-Revised (OCI-R). Psychological Assessment, 27(3), 874–882. https://doi.org/10.1037/pas0000075