O que é GRADE?

GRADE (Grading of Recommendations, Assessment, Development and Evaluations) [Classificação de Recomendações, Avaliação, Desenvolvimento e Análises] é um arcabouço transparente para desenvolver e apresentar resumos de evidências que proporcionam uma abordagem sistemática para fazer recomendações de prática clínica.[1-3] É a ferramenta mais adotada para classificar a qualidade da evidência e para fazer recomendações, com mais de 100 organizações do mundo inteiro endossando oficialmente a iniciativa GRADE.

Como funciona?

Primeiramente, os autores decidem qual é a questão clínica, incluindo a população a que a pergunta se aplica, as duas ou mais alternativas, e os desfechos que mais importam para aqueles que enfrentam a decisão [4]. Um estudo — idealmente uma revisão sistemática — fornece a melhor estimativa do tamanho do efeito para cada resultado, em termos absolutos (por exemplo, uma diferença de risco) [3].

Em seguida, os autores avaliam a qualidade das evidências, que é melhor aplicada a cada desfecho, pois a qualidade das evidências geralmente varia entre os desfechos.[5] Uma classificação geral de qualidade de GRADE pode ser aplicada a um conjunto de evidências em todos os resultados, geralmente tomando a menor qualidade de evidência de todos os resultados que são críticos para a tomada de decisões [6].

GRADE tem quatro níveis de evidência — também conhecidos como certeza em evidência ou qualidade de evidência: muito baixo, baixo, moderado e alto (Tabela 1). As evidências de ensaios controlados aleatorizados começam em alta qualidade e, devido a confusão residual, evidências que incluem dados observacionais começam com baixa qualidade. A certeza nas evidências é aumentada ou diminuída por várias razões, descritas mais detalhadamente abaixo.

Tabela 1. Classificações de certeza da GRADE
Certeza	O que significa
Muito baixa	O verdadeiro efeito provavelmente é muito diferente do efeito estimado
Baixo	O verdadeiro efeito pode ser muito diferente do defeito estimado
Moderado	Os autores acreditam que o verdadeiro efeito provavelmente é próximo do efeito estimado
Alto	Os autores têm muita confiança de que o verdadeiro efeito é próximo do efeito estimado

A GRADE é subjetiva

A GRADE não pode ser implementada mecanicamente – necessariamente há uma quantidade considerável de subjetividade em cada decisão. Seria razoável que duas pessoas avaliando o mesmo corpo de evidência chegassem a conclusões diferentes a respeito de sua certeza. O que a GRADE oferece é um arcabouço reprodutível e transparente para classificar a certeza na evidência.[7]

O que torna uma evidência mais incerta?

Para cada risco de viés, imprecisão, inconsistência, indireta e viés de publicação, os autores têm a opção de diminuir seu nível de certeza um ou dois níveis (por exemplo, de alto para moderado).

Os domínios GRADE para classificação para baixo

1. Risco de viés

O viés ocorre quando os resultados de um estudo não representam a verdade devido às limitações inerentes ao desenho ou à condução de um estudo [8]. Na prática, é difícil saber em que grau os vieses potenciais influenciam os resultados e, portanto, a certeza é menor no efeito estimado se os estudos informando o efeito estimado puderem ser tendenciosos.

Existem várias ferramentas disponíveis para avaliar o risco de viés em ensaios randomizados individuais [9] e estudos observacionais. [10, 11]

GRADE é usado para classificar o corpo de evidências no nível do resultado em vez do nível de estudo. Portanto, os autores devem julgar se o risco de viés nos estudos individuais é suficientemente grande que sua confiança no efeito estimado do tratamento seja menor. As principais considerações sobre o risco de viés e uma descrição detalhada do processo de mudança do risco de viés no nível do estudo para o risco de viés para um corpo de evidências são descritas em detalhes na série de diretrizes GRADE #4: Avaliação da qualidade da evidência — limitações do estudo (risco de viés). [8]

2. Imprecisão

A abordagem GRADE para imprecisão de classificação centra-se no intervalo de confiança de 95% em torno da melhor estimativa do efeito absoluto[12] A certeza é menor se a decisão clínica for susceptível de ser diferente se o efeito verdadeiro se encontrasse na extremidade superior versus na extremidade inferior do intervalo de confiança. Os autores também podem optar por diminuir a taxa de imprecisão se a estimativa do efeito vier de apenas um ou dois pequenos estudos ou se houve poucos eventos [13]. Uma descrição detalhada da imprecisão é descrita na série de diretrizes GRADE #6: Avaliando a qualidade da evidência — imprecisão. [12]

3. Inconsistência

A certeza em um corpo de evidência é maior quando há vários estudos que mostram efeitos consistentes. Ao considerar se a certeza deve ou não ser avaliada para inconsistência, os autores devem inspecionar a similaridade das estimativas pontuais e a sobreposição de seus intervalos de confiança, bem como critérios estatísticos para heterogeneidade (p. ex.² e teste do qui-quadrado). [14] Uma discussão completa sobre inconsistência está disponível na série de diretrizes GRADE #7: classificando a qualidade da evidência — inconsistência. [14]

4. Indiretamente

As evidências são mais certas quando estudos comparam diretamente as intervenções de interesse na população de interesse e relatam os resultados críticos para a tomada de decisão. A certeza pode ser avaliada para baixo se os pacientes estudados forem diferentes daqueles para os quais a recomendação se aplica. A indirectidão também pode ocorrer quando as intervenções estudadas são diferentes dos resultados reais (por exemplo, um estudo de um novo procedimento cirúrgico em um centro altamente especializado só se aplica indiretamente a centros com menos experiência). A indireta também ocorre quando o resultado estudado é um substituto para um resultado diferente - tipicamente um que é mais importante para os pacientes. Uma discussão completa sobre indirectness está disponível na série de diretrizes GRADE #8: classificando a qualidade da evidência — indirectness. [15]

5. Viés de publicação

O viés de publicação é talvez o mais irritante dos domínios GRADE, pois requer inferências sobre a falta de evidências. Diversos métodos estatísticos e visuais são úteis na detecção de viés de publicação, apesar de apresentarem sérias limitações. O viés de publicação é mais comum com dados observacionais e quando a maioria dos estudos publicados é financiada pela indústria. Uma discussão completa do viés de publicação está disponível na série de diretrizes da GRADE nº 5: classificação da qualidade das evidências – viés de publicação.[16]

O que aumenta a confiança na evidência?

Em raras circunstâncias a confiança na evidência pode ter sua classificação aumentada (ver tabela 2). Primeiro, quando há uma magnitude muito grande de efeito, podemos estar mais certos de que há pelo menos um pequeno efeito. Segundo, quando há uma claro gradiente dose-resposta. Terceiro, quando a confusão residual tende a diminuir em vez de aumentar a magnitude do efeito (nas situações que comportam um efeito). Uma discussão mais completa das razões para aumentar a classificação da confiança está disponível na série 9 das diretrizes GRADE: Aumentando a classificação da qualidade da evidência.[17]

Tabela 2. Razões taxa de certeza em evidência para cima ou para baixo
A certeza pode ter a sua classificação diminuída por:	A certeza pode ter a sua classificação aumentada por:
Risco de viés Imprecisão Inconsistência Indiretidade Viés de publicação	Grande magnitude do efeito Gradiente dose-resposta Todo o confundimento residual diminuiria a magnitude do efeito (nas situações em que há um efeito)

Passagem da qualidade da evidência para as recomendações

No GRADE, as recomendações podem ser fortes ou fracas, a favor ou contra uma intervenção. Recomendações fortes sugerem que todas ou quase todas as pessoas escolheriam essa intervenção. Recomendações fracas implicam que seja provável que haja uma variação importante na decisão que as pessoas informadas provavelmente tomarão. A força das recomendações é acionável: uma recomendação fraca indica que o envolvimento em um processo de tomada de decisão compartilhado é essencial, enquanto uma forte recomendação sugere que geralmente não é necessário apresentar ambas as opções.

As recomendações são mais propensas a serem fracas em vez de fortes quando a certeza na evidência é baixa, quando há um equilíbrio próximo entre consequências desejáveis e indesejáveis, quando há variação ou incerteza substancial nos valores e preferências dos pacientes, e quando as intervenções exigem considerável recursos. Está disponível uma discussão completa na série BMJ sobre o quadro de decisão GRADE Evidência para a Decisão [18, 19] e na série original [2, 20].

Autores: Reed Siemieniuk e Gordon Guyatt

Referências

Guyatt GH, Oxman AD, Kunz R, Vist GE, Falck-Ytter Y, Schunemann HJ. What is "quality of evidence" and why is it important to clinicians? BMJ (Clinical research ed). 2008; 336 (7651) :995-8.
Guyatt GH, Oxman AD, Vist GE, Kunz R, Falck-Ytter Y, Alonso-Coello P, et al. GRADE: an emerging consensus on rating quality of evidence and strength of recommendations. BMJ (Clinical research ed). 2008; 336 (7650) :924-6.
Guyatt G, Oxman AD, Akl EA, Kunz R, Vist G, Brozek J, et al. GRADE guidelines: 1. Introduction-GRADE evidence profiles and summary of findings tables. Journal of Clinical Epidemiology. 2011; 64 (4):383-94.
Guyatt GH, Oxman AD, Kunz R, Atkins D, Brozek J, Vist G, et al. GRADE guidelines: 2. Framing the question and deciding on important outcomes. Journal of Clinical Epidemiology. 2011; 64 (4) :395-400.
Balshem H, Helfand M, Schunemann HJ, Oxman AD, Kunz R, Brozek J, et al. GRADE guidelines: 3. Rating the quality of evidence. Journal of Clinical Epidemiology. 2011;64(4):401-6.
Guyatt G, Oxman AD, Sultan S, Brozek J, Glasziou P, Alonso-Coello P, et al. GRADE guidelines: 11. Making an overall rating of confidence in effect estimates for a single outcome and for all outcomes. Journal of Clinical Epidemiology. 2013;66(2):151-7.
Mustafa RA, Santesso N, Brozek J, Akl EA, Walter SD, Norman G, et al. The GRADE approach is reproducible in assessing the quality of evidence of quantitative evidence syntheses. Journal of Clinical Epidemiology. 2013; 66 (7) :736-42; quiz 42.e1-5.
Guyatt GH, Oxman AD, Vist G, Kunz R, Brozek J, Alonso-Coello P, et al. GRADE guidelines: 4. Rating the quality of evidence--study limitations (risk of bias). Journal of Clinical Epidemiology. 2011; 64 (4) :407-15.
Higgins JP, Altman DG, Gøtzsche PC, Jüni P, Moher D, Oxman AD, et al. The Cochrane Collaboration’s tool for assessing risk of bias in randomised trials. BMJ (Clinical research ed). 2011; 343:d5928.
Wells G, Shea B, O’connell D, Peterson J, Welch V, Losos M, et al. The Newcastle-Ottawa Scale (NOS) for assessing the quality of nonrandomised studies in meta-analyses. Ottawa: Ottawa Hospital Research Institute; 2011. Oxford. asp; 2011.
Sterne JA, Hernan MA, Reeves BC, Savovic J, Berkman ND, Viswanatana M, et al. ROBINS-I: a tool for assessing risk of bias in non-randomised studies of interventions. BMJ (Clinical research ed). 2016; 355:i4919.
Guyatt GH, Oxman AD, Kunz R, Brozek J, Alonso-Coello P, Casca D, et al. GRADE guidelines 6. Rating the quality of evidence--imprecision. Journal of Clinical Epidemiology. 2011; 64 (12) :1283-93.
Walsh M, Srinathan SK, McAuley DF, Mrkobrada M, Levine O, Ribic C, et al. The statistical significance of randomized controlled trial results is frequently fragile: a case for a Fragility Index. Journal of Clinical Epidemiology. 2014;67(6):622-8.
Guyatt GH, Oxman AD, Kunz R, Woodcock J, Brozek J, Helfand M, et al. GRADE guidelines: 7. Rating the quality of evidence--inconsistency. Journal of Clinical Epidemiology. 2011; 64 (12) :1294-302.
Guyatt GH, Oxman AD, Kunz R, Woodcock J, Brozek J, Helfand M, et al. GRADE guidelines: 8. Rating the quality of evidence--indirectness. Journal of Clinical Epidemiology. 2011; 64 (12) :1303-10.
Guyatt GH, Oxman AD, Montori V, Vist G, Kunz R, Brozek J, et al. GRADE guidelines: 5. Rating the quality of evidence--publication bias. Journal of Clinical Epidemiology. 2011; 64 (12) :1277-82.
Guyatt GH, Oxman AD, Sultan S, Glasziou P, Akl EA, Alonso-Coello P, et al. GRADE guidelines: 9. Rating up the quality of evidence. Journal of Clinical Epidemiology. 2011; 64 (12) :1311-6.
Alonso-Coello P, Schunemann HJ, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, et al. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 1: Introduction. BMJ (Clinical research ed). 2016; 353:i2016.
Alonso-Coello P, Oxman AD, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, et al. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 2: Clinical practice guidelines. BMJ (Clinical research ed). 2016;353:i2089.
Guyatt GH, Oxman AD, Kunz R, Falck-Ytter Y, Vist GE, Liberati A, et al. Going from evidence to recommendations. BMJ (Clinical research ed). 2008;336(7652):1049-51.