RESUMEN
Las revisiones sistemáticas tienen como objetivo recopilar, analizar y sintetizar toda la evidencia científica disponible sobre una pregunta de investigación específica. A pesar de que las revisiones son una herramienta fundamental para la toma de decisiones basadas en la evidencia, su correcta interpretación y análisis pueden plantear ciertos desafíos. Este manuscrito aborda diferentes herramientas para guiar la lectura crítica de revisiones sistemáticas y determinar su utilidad con el fin de asistir a la toma de decisiones, basada en dos instrumentos como A Measurement Tool to Assess Systematic Reviews Version 2 (AMSTAR 2) y la lista de verificación del Critical Appraisal Skills Programme (CASP) del Reino Unido. La lectura crítica de las revisiones sistemáticas es crucial para garantizar la validez, la calidad y la aplicabilidad de sus resultados.
Tools for the Critical Appraisal of Systematic Reviews
ABSTRACT
Systematic reviews aim to collect, analyze, and synthesize all available scientific evidence on a specific research question. Although reviews are a fundamental tool for evidence-based decision-making, their correct interpretation and analysis can present certain challenges. This manuscript addresses different tools to guide the critical appraisal of systematic reviews and to determine their usefulness in supporting decision-making, based on two instruments: A Measurement Tool to Assess Systematic Reviews Version 2 (AMSTAR 2) and the checklist of the United Kingdom Critical Appraisal Skills Programme (CASP).
Critical appraisal of systematic reviews is crucial to ensure the validity, quality, and applicability of their results.
Una revisión sistemática (RS) es un tipo de investigación secundaria cuyo objetivo es recopilar, analizar y sintetizar toda la evidencia científica disponible (publicada o no) que cumpla con criterios de elegibilidad previamente establecidos para responder una pregunta concreta de investigación. Las RS aplican una metodología transparente y reproducible, evaluando los aspectos metodológicos de los estudios incluidos para minimizar sesgos1.
Además, cuando los estudios incluidos en la RS son lo suficientemente similares, tanto clínica como estadística y metodológicamente, en el informe de sus resultados, pueden incluir metanálisis, una técnica estadística que permite combinar matemáticamente los resultados de múltiples estudios. También mejora la precisión en la estimación de los efectos y permite evaluar su impacto en distintos subgrupos de pacientes2.
Las RS son una herramienta esencial para los pacientes, médicos, investigadores y funcionarios de la salud, ya que proporcionan una síntesis objetiva de las investigaciones disponibles, facilitando la toma de decisiones basadas en evidencia científica; de esta manera constituyen un pilar fundamental en el paradigma de la medicina basada en la evidencia (MBE), que integra los valores y preferencias personales de los pacientes con la experiencia clínica y los datos científicos más actualizados3.
A pesar de que las RS son una herramienta fundamental para la toma de decisiones basadas en la evidencia, su correcta interpretación y análisis pueden presentar ciertos desafíos. En el contexto clínicoasistencial, el tiempo limitado para la lectura profunda y reflexiva de una RS es una barrera común4 sumada a las dificultades asociadas a su complejidad metodológica. Al utilizar elementos y lenguaje técnico, puede resultar poco práctica su lectura para quienes no están familiarizados con esos conceptos. Además, los resultados de una RS no siempre son concluyentes, fáciles de interpretar o de trasladar a la práctica clínica debido a la variabilidad entre estudios, los sesgos de publicación o la calidad metodológica de los ensayos incluidos, que pueden influir en la validez de los hallazgos5. Para superar estos inconvenientes, la MBE propone la lectura o evaluación crítica de manuscritos científicos en general y de RS en particular, examinando sistemáticamente un artículo para juzgar su valor, fiabilidad y relevancia en el contexto en el que se pretende implementar, y guiando a los profesionales para interpretar y utilizar la evidencia científica de manera efectiva6.
Existen múltiples herramientas para valorar diferentes aspectos de las RS, como las listas de verificación PRISMA para evaluar el informe (del inglés Preferred Reporting Items for Systematic reviews and Meta-Analyses)7 o la herramienta ROBIS (del inglés Risk of Bias in Systematic reviews)8, orientada principalmente a los desarrolladores de guías de práctica clínica, para evaluar el riesgo de sesgo en las RS. En este manuscrito abordaremos otras dos herramientas desarrolladas para facilitar la lectura crítica de las RS.
Una de las herramientas para guiar la lectura crítica de RS de intervenciones es A Measurement Tool to Assess Systematic Reviews Version 2 (AMSTAR-2)9. AMSTAR 2 permite determinar si una RS proporciona un resumen preciso y completo de los resultados de los estudios disponibles que abordan la pregunta de interés específica.
Su propósito principal es ayudar a los profesionales, investigadores y responsables de la toma de decisiones a evaluar la confianza en una RS para fundamentar decisiones clínicas o sanitarias importantes. Para la implementación de AMSTAR 2 es necesario responder una serie de preguntas que abordan aspectos clave de la metodología de una RS. Contempla un cuestionario de 16 preguntas, con 6 dominios críticos con respuestas simples (“sí”; “no” o “sí parcial”). De este cuestionario, que no tarda más de 30 minutos en completarse10, se obtiene una estimación de la confianza de una RS (Tabla 1) para asistir en la toma de decisiones. Es tal el impacto y la importancia de estos dominios que basta con no presentar registro prospectivo del protocolo para que la RS sea de baja confianza. Por ejemplo, la RS de von Luckner, et al.11 sobre el efecto de la suplementación con magnesio para la profilaxis de la migraña no presenta en su sección Métodos el número de registro o publicación del protocolo. En comparación, la revisión de Talandashti, et al.12 sobre una pregunta de investigación similar, sí lo informa. El registro del protocolo de una RS aporta transparencia y replicabilidad a la investigación.
Tabla 1. Dominios críticos y valoración de la confianza general de una RS según AMSTAR-2).
| Dominios críticos de la herramienta A measurement Tool to Assess Systematic Reviews Version 2 (AMSTAR-2) | |
| 1 | Protocolo registrado antes de la revisión |
| 2 | Adecuada búsqueda en la literatura |
| 3 | Justificación de los estudios excluidos |
| 4 | Riesgo de sesgo de los estudios individuales incluidos |
| 5 | Métodos metanalíticos apropiados |
| 6 | Consideración del riesgo de sesgo en la interpretación de los resultados de la revisión |
| 7 | Evaluación de la presencia y el impacto probable del sesgo de publicación |
| Valoración de la confianza general en los resultados de la revisión | |
| Confianza | Justificación |
| Alta | Ninguna debilidad crítica y hasta una no crítica: la RS* proporciona un resumen exacto y completo de los resultados de los estudios disponibles |
| Media | Ninguna debilidad crítica y más de una debilidad no crítica (aunque, si son muchas, podría justificarse una baja confianza): la RS* tiene debilidades, pero no hay defectos críticos y puede proporcionar un resumen preciso de los resultados de los estudios disponibles |
| Baja | Hasta una debilidad crítica, con puntos débiles no críticos o sin ellos: la RS* puede no proporcionar un resumen exacto y completo de los estudios disponibles |
| Críticamente baja | Más de una debilidad crítica, con debilidades no críticas o sin ellas: la RS* no es fiable |
RS: Revisión sistemática.
Se recomienda aplicar esta metodología de análisis de calidad en cada una de las RS, a partir de las cuales se podrá tomar una decisión clínica o diseñar una política en salud13,14. Es posible que, teniendo en cuenta las características, el tipo y la metodología de cada revisión, se requiera asesoramiento especializado para responder a alguno de los dominios analizados, por ejemplo, para determinar si los autores de la revisión evaluaron adecuadamente el riesgo de sesgo o para determinar la correcta implementación de los métodos estadísticos.
Además de ser un instrumento útil no solo para quien lee una RS, sino también para el equipo que la elabora, es, en esencia, una herramienta educativa13.
Es importante incluirla en la formación académica de los estudiantes de las ciencias de la salud, de modo que la lectura crítica de las síntesis de la evidencia sea una práctica habitual en la vida profesional. Sin embargo, AMSTAR 2 no está libre de limitaciones: su aplicación requiere juicio experto y una comprensión profunda de la metodología de RS, lo que puede generar variabilidad entre evaluadores y limitar su uso por parte de usuarios con menor experiencia. Además, no produce una puntuación global cuantitativa, sino una clasificación basada en dominios críticos, lo que puede dificultar la comparación entre RS. Finalmente, algunos ítems son interpretativamente ambiguos o difíciles de aplicar a ciertos tipos de revisiones, lo que puede reducir su consistencia y su utilidad práctica.
Otra herramienta desarrollada para guiar la lectura crítica de RS es la lista de verificación del Critical Appraisal Skills Programme (CASP). La herramienta ayuda a determinar la fiabilidad de los resultados y la relevancia de una RS para poder aplicar los hallazgos en la práctica clínica, facilitando así la toma de decisiones a través de un conjunto de preguntas estructuradas de respuesta simple. La lista de verificación CASP para RS se divide en 4 bloques, cada uno con un objetivo de análisis específico (Tabla 2). El primer bloque trata de determinar si la RS presenta un diseño válido, con una pregunta claramente definida. Por ejemplo, una RS que evaluó los efectos de diferentes formulaciones de nutrición enteral en pacientes con pancreatitis aguda15 definió de manera precisa los componentes de la pregunta PICO (Población, Intervención, Comparador, Desenlaces), incluyendo en la Población a todas las personas mayores con pancreatitis aguda; en la Intervención cualquier tipo de nutrición enteral con una formulación específica; en el Comparador tipos diferentes de nutrición enteral, placebo o ninguna intervención, y en los Desenlaces la mortalidad por todas las causas, entre otros. En contraste, no encontramos una descripción detallada de la pregunta de investigación en otra RS sobre el mismo tema16.
Tabla 2. Secciones de la herramienta Critical Appraisal Skills Programme (CASP) para revisiones sistemáticas.
| Pregunta objetivo | Preguntas guía | |
|---|---|---|
| Sección A | ¿El diseño básico del estudio es válido para una revisión sistemática? |
- ¿La revisión sistemática abordó una pregunta de
investigación claramente formulada?
- ¿Los investigadores buscaron diseños de estudio apropiados para responder a la pregunta de investigación? |
| Sección B | ¿Es metodológicamente sólida la revisión sistemática? |
- ¿La estrategia de búsqueda es exhaustiva y está claramente
documentada? - ¿Los autores definieron criterios de selección, inclusión y exclusión adecuados? |
| Sección C | ¿Cuáles son los resultados? |
- ¿Se han informado de manera exhaustiva los resultados de la
revisión sistemática y se han interpretado adecuadamente? - ¿El número total de participantes en la revisión sistemática fue suficiente para detectar un efecto? |
| Sección D | ¿Los resultados ayudarán en el ámbito local? |
- ¿Pueden aplicarse los resultados de la revisión sistemática
a su población local/en su contexto local? - ¿Qué recursos se necesitarán para implementar la intervención? |
El segundo bloque indaga sobre la búsqueda de estudios, idealmente en más de una base de datos relevante (por ejemplo, MEDLINE/PubMed, Embase), y su correcto registro en el informe. También considera el uso de restricciones injustificadas por idioma y de búsquedas adicionales mediante la revisión manual de referencias de estudios incluidos o la consulta a expertos. Por ejemplo, una RS sobre el panorama general del dengue17 limitó la elegibilidad a estudios publicados en inglés. Esto puede provocar que se omitan estudios importantes publicados en otros idiomas y, por lo tanto, que la revisión no abarque toda la evidencia disponible, especialmente considerando que algunas investigaciones relevantes sobre enfermedades endémicas como el dengue suelen publicarse también en español o en portugués.
El segundo bloque asimismo se enfoca en evaluar la validez interna de los estudios incluidos, es decir, si su diseño y ejecución fueron adecuados para minimizar sesgos18. Mientras muchas revisiones sistemáticas omiten esta evaluación, las revisiones de Cochrane la incluyen sistemáticamente mediante herramientas de evaluación del riesgo de sesgo. También se analiza si los métodos estadísticos del metanálisis fueron correctos, bien aplicados e informados.
La tercera sección de la lista de verificación CASP para RS analiza la forma en que se presentan e interpretan los resultados, y evalúa si los estimadores de efecto de los análisis y su interpretación narrativa son consistentes entre sí. Además, tiene en cuenta la precisión de estos estimadores de efecto, considerando si el número total de participantes en la sumatoria de estudios incluidos en la RS fue suficiente para detectar un efecto o si los autores proporcionaron intervalos de confianza y valores P para evaluar si los resultados son estadísticamente significativos. Por ejemplo, una revisión Cochrane sobre el uso de un anticuerpo monoclonal para la prevención del virus sincitial respiratorio19 informó preocupaciones acerca del efecto de la intervención relacionadas con la escasez de participantes en los estudios incluidos. Sin embargo, otra revisión sobre el tema20 no incluyó un análisis de estas características al interpretar sus hallazgos.
La última sección analiza en particular la aplicabilidad de los resultados en el ámbito local. Por ejemplo, una revisión Cochrane21 sobre vacunas orales inactivadas contra el cólera demostró que dos vacunas (Dukoral® y Shanchol®) reducen los casos de cólera y que fueron seguras y bien toleradas. A pesar de que los resultados de la revisión son válidos y metodológicamente sólidos, la aplicabilidad de la vacuna en otro contexto con recursos limitados y dificultades para mantener la cadena de frío, podría no ser tan eficaz debido a las barreras logísticas, económicas y culturales.
Es fundamental que el lector de una RS evalúe si la intervención analizada realmente aporta un equilibrio aceptable entre beneficios y daños para los pacientes, si los recursos necesarios para implementarla están disponibles y si su utilización es razonable para dicha intervención.
Este análisis es clave tanto en la práctica clínica como en la toma de decisiones basadas en evidencia.
La principal debilidad de la lista de verificación CASP para RS radica en que se basa en preguntas cualitativas y abiertas, sin criterios de valoración específicos ni ponderación de los ítems, lo que puede conducir a interpretaciones subjetivas y variabilidad entre evaluadores.
Además, ofrece una evaluación general de la credibilidad y la aplicabilidad de la revisión, pero no permite identificar con precisión los aspectos metodológicos específicos que afectan su calidad, lo que limita su uso para comparar RS.
CONCLUSIÓN
La síntesis de la evidencia a través de las RS es fundamental para la toma de decisiones en salud y para el desarrollo e implementación de políticas sanitarias, proporcionando información fiable y objetiva. Sin embargo, la lectura crítica de estas RS es crucial para garantizar la validez, la calidad y la aplicabilidad de sus resultados.
Ciertas herramientas como AMSTAR 2 y CASP son valiosas para este propósito, y son de gran ayuda tanto para profesionales como para estudiantes de carreras médicas o de salud. También constituyen un pilar fundamental en la evaluación de tecnologías sanitarias y en el desarrollo de guías de práctica clínica.
Existen puntos en común entre las herramientas mencionadas. Es importante que los profesionales de la salud adquieran habilidades de lectura crítica y utilicen estas herramientas de manera efectiva para garantizar que la evidencia científica se traduzca en una atención de calidad para los pacientes, en argumentos fehacientes y fiables para la toma de decisiones médicas y, finalmente, en políticas públicas serias y con sustento científico y metodológico.