首页 > 文章中心 > 正文

传统医学证据体的构造

传统医学证据体的构造

1循证次学证据的儿个概念循证医学的证据

(videnc)是指以患者为研究对象的各种临床研究(包括防治措施、诊断、病因、预后、经济学研究与评价等)所得到的结果和结论通常,这类研究不包括体外细胞实验、离体器官的研究和动物实验不同的研究问题要求不同的研究证据循证医学强igJ“证据体(。vidoneeb()dy)”的概念,即初I一据体是由多种研究方法、多种来源的证据构成,而非仅仅由某一种研究所获得的证据构成(二证据体的结构类似于一座金字塔二」以干顶措施的证据为例,这类证据是由随机对照试验(工级)、队列研究(11级)、病例对照研究(}n级)、系列病例研究(I\级)、病例报告、传统综述、专家观点或经验(V级)构成、证据的基础是临床实践者在长期的医疗实践中,通过对单个患者的治疗观察,逐渐积累获得治疗的经验,撰写病例总结,形成一种假说在此基础上观察更多的病例,形成病例系列,然后进行有对照的比较研究,初期最容易实施的是回顾性的病例对照研究,而后是前瞻性的队列观察或非随机的对照研究,最终采用随机对照试验进行验证针对某一于预措施的证据体的形成需要一个较为长期的积累过程我国目前在中医药领域所出现的一种倾向,就在于从经验一下跨越其他研究类型而直接采用随机对照试验的方法来评价,因此,对于干预的构成、性质、最佳起效方案、疗程、适应对象及中医证型等缺乏1卜随机的研究,导致了在随机试验设计、实施过程中的诸多漏洞和问题,造成了研究结果(疗效评价)的不确定性。

所以,我们需要对证据体的概念有一个清楚的认识有关证据的第二个概念是ilE据等级(h1er。,rehy、)f二idence)为什么需要划分证据等级、‘几?这是因为不同的证据从科研意义上看其证据强度(、trengthofc\’i-detlc。)不同所谓证据强度,也称为论证强度,是指研究结果的真实性和可推广应用性就干预类证据而言,构成证据的要素包括设计、方法、对象、干预和结局因此,在对证据的评价中,需要对研究设计的严谨性、方法学的可靠性、研究特征以及结果的可应用性方面来加以判断临床医生在使用证据时,以及研究人员在科研和制定临床实践指南的过程中,都需要对证据进行分级和评价,以便能够正确、合理地使用证据涉及循证医学证据的第三个概念为证据的推荐强度(、trength。freeommendatson)〔2::它是指通过对证据的分级和评价,研究者对应用其结果的可行性提出的推荐性意见。通常在临床指南的编写中,指南制定者会结合证据强度,对防治措施的临床运用可信性(即该证据可以被使用的推荐强度)做出建议。比如有高质量的研究证据表明干预措施有良性效果,比如高质量、大样本的随机对照试验,则研究者会提出“推荐使用”的建议;如果有一些证据,如小样本、质量较低的随机对照试验或非随机的研究证据,但强度不够高,则研究者会推荐选择性地使用;如果高质量的研究证据表明干预措施是无效的,甚至是有害的,则研究者会建议不使用或禁止使用该干预措施。

2当前证据分级的国际体系笔者通过:

(1)检索ME】)LINE(1995一2000年)获得了有关证据强度(strengthofevidenee)的相关文章704篇;(2)查询了北美循证实践中心(Evidenee一basedPraetieeCentreS,EPCS)制作的12份报告(w~.ahrq.gov);(3)参考了《美国医学会杂志》(JAMA)1990年初发表的一系列文章;(4)参考了《英国医学杂志》(BMJ)发表的严格评价(criticalaPPraisal)手册;(5)查询并获取了世界卫生组织(WHO)、英国循证医学中心和澳大利亚国家健康与医学研究委员会的相关文件。对目前国际上评估研究质量的证据分级体系进行了整理和比较。现将几种国际干预措施证据分级系统概括。

3现有证据分级体系中存在的问题

目前国际上有关干预措施证据的分级没有一个统一的标准,上述介绍的标准都在不同程度上有所使用,但仍然存在一些观点上的争论。比如说,循证医学专家DavidSaekett教授及少数学者认为,系统评价(系统综述)不应当纳人证据等级评价中,即使纳人也只能算m级证据「8〕。理由是系统评价乃回顾性研究;且不易鉴定到未被发表的临床研究,可能存在发表偏倚;与原始研究一样,系统综述的过程也可能存在各种偏倚。此外,纳入大量低质量的随机对照试验的系统评价有可能使结果产生误导。实践证明,在系统评价中向原作者索取所需补充资料是很困难的;且往往真实性评价指标与试验结果之间的相关关系证据不足,比如有无研究目的、纳人/排除标准、样本量计算等缺乏与疗效效应之间的相关性证据。第二个争论点是,方法学研究发现19二,系统综述结果与随后的大样本随机对照试验的结果出现明显的不一致时,人们不清楚到底该相信哪一个。第三,有关方法学专家对上述证据分级的等级模式提出了质疑。例如金字塔的证据等级由下而上表明研究结果的真实性增加了,但是,其研究结果的外推性却降低了。因为严谨的研究设计必然增加对研究对象的选择性(以达到研究人群的同质性),所以这样的研究结果在临床实践中的推广应用性反而就降低了。因此,有专家提出应当采取一种环状模式来代替等级模式〔’川。该模式更加强调证据体的概念及证据的多样性。

4适用于中医药临床疗效评价的各种随机对照

试验经典的随机双盲对照试验存在局限性。主要体现在:严格的纳人与排除标准使试验结果的外推受到限制;忽略患者对治疗的偏好使伦理原则受到挑战;巨大的经费投人和较长的研究周期增加了实施的难度;双盲安慰剂对照方法不适合评价“复杂性干预”如中医个体化辨证论治;随机分组的患者与试验之外的患者干预的结局差异较大。为此,近年来在随机对照试验的方法学上有了进一步发展,以适应不同评价目的的需要。

5适用于中医药临床疗效评价的证据分级体系

即使在同种医疗体系当中,也还存在药物(比如西药)干预与非药物(比如外科手术)干预的差异,所以作为西医和中医两种医疗体系和实践模式,传统医学与现代医学方法存在明显差异乏”,”〕。因此我们在对两者临床干预研究证据进行分级和评价时应有所区别。对传统医学(包括补充替代医学)的评价,需要将人文背景纳人评价体系中。例如,中医药所特有的人文因素对于其疗效的评价必然会产生影响。而对这些要素的评价,采用经典的定量研究和关联分析是难以回答的,必须补充以社会学的定性研究方法等多种新的研究方法。而这些新的研究方法在传统的干预疗效证据分级和评价中并无应用。这显示了传统证据评价和分级体系的不足。

随着结局研究、卫生服务体系研究、卫生经济学研究、人群健康研究等新方法的引入,循证医学证据体系将更加完善,在评价复杂性干预领域体现多维度、多系统、模式整合(自然科学属性与社会科学属性研究)的特点。因此,证据体强度的评价要素也已扩展到了方法学以外,即注重质量、数量和一致性的要素。质量要素是指针对某干预的所有相关研究的质量;数量要素包括治疗效应的大小、评估某干预的研究数量、所有相关研究的总体样本量;一致性(consistency)要素是指某干预采用相似或不同的研究设计获得的结果(效应)的一致性。与决定证据的推荐强度一样,在评价证据质量时也应综合考虑以下三方面:(1)方法学多样性,针对不同结局采用不同的研究设计。例如,症状评价,较之终点结局如死亡、并发症发生率的评价,需要更为严格的设计方法;评价卜预措施的安全性需要观察性研究而非随机对照试验;(2)不同研究间结果的一致性;(3)研究结果效应的方向(利大于弊或弊大于利)。因此,我们在制定指南推荐时需要考虑证据的级别、方法学质量、统计学的精确度、效应大小,以及证据的临床相关程度〔,」。此外,应该如何看待传统医学(如中医药学)古典文献的证据级别?笔者认为采用上述证据分级和现代临床科研的工具来评价是不恰当的。

首先,古代医书中记载的病/证与现代医学定义的疾病不同(除了病因、诊断不同外,疾病谱与医疗水平亦不同);病案的记载多为个案(典型病例),缺乏对照与重复;记述的疗效缺乏研究的验证。其次,古代中医文献一直是指导中医临床实践的指南,现代文献更多地着眼于获取临床科研证据,这两者很难用同一尺度来衡量。对干预措施作出推荐时除了应当考虑证据的强度以外,包括研究设计、质量、同级同类研究的数量,还需要考虑研究结果的一致性以及效应值的方向(试验措施优于对照措施,对照措施优于试验措施,或试验与对照措施没有差异)。此外,还需要考虑成本的问题。在制定中医药临床实践指南时,可以在上述证据分级的基础上,根据以下国际公认的推荐方案加以制定。证据推荐强度目前较为公认和被普遍采用的是GRADE工作组2004年发表的专家共识,形成以下推荐分级〔2::(l)推荐使用:有充分的证据支持其疗效,应当使用(基于工级证据);(2)有选择性的推荐:有一定的证据支持,但不够充分,在一定条件下可以使用(基于n、m级证据);(3)建议不要使用:大多数证据表明效果不良或弊大于利(基于n、m级证据);(4)禁止使用:有充分的证据表明无效或明显地弊大于利(基于工级证据)。证据因为存在疗效的不确定性,无法作为推荐的依据。但是可以作为进一步研究的依据或假说,为未来的研究提供线索。