通过与经典的随机对照临床试验( randomized clinical trial,RCT)相比较,有助于进一步加深对真实世界研究设计与应用的理解。二者在设计和应用方面有很大的差别(表1),各有优劣[5,6]。RCT是目前公认的治疗性或预防性干预措施效果评价的金标准,设计严谨,需要制定严格的入选和排除标准,这导致研究对象的代表性不够广泛和全面,使得结论外推到总体受限;另外,RCT常常需要盲法观察,有时难以实现,如对外科手术治疗效果或对医疗器械进行评价时,多数无法实施盲法;最为重要的是,RCT是在条件严格控制情况下,评价标准治疗或某一单一干预措施在理想状态下所能达到的最大效果,属于理论疗效,即"效力"(efficacy),而在临床实际中,患者经常罹患多种疾病,同时接受多种治疗措施,最终的疗效是研究的干预措施与其他各种处理因素(如治疗方式、管理、辅助治疗等)综合作用的效果;此外,RCT还常涉及医学伦理学问题,或因观察时间有限,有时不可避免地出现过多的失访、退出、沾染或干扰影响研究结果;虽然大样本、多中心的RCT研究结果证据较强,但研究费用逐年上升,并且有数据表明,RCT所获得的证据中,仅有14%可在平均17年后广泛应用于临床[7]。故从研究的效率和成本角度分析,RCT存在明显不足。
相比RCT的这些局限性,真实世界研究则具备多种优势:(1)真实世界研究关注实际疗效或"效果"( effectiveness),即评价药物或其他干预措施在真实临床环境下的治疗效果,重在外部有效性,因此,对研究对象的排除标准限定相对较少,纳入的人群有较好代表性;(2)样本量通常较大,利于解决罕见疾病和事件的相关问题,利于评价不同人群之间干预效果的差异(亚组分析);(3)可利用已有的电子病历、医保数据、医疗产品及疾病注册登记数据等,实现快速设计与收集大样本数据、统计效能不仅高,还可对更有广泛临床意义的结局指标进行评价,如治愈率、病死率、复发率、伤残情况等,并且还能评价取得结果的投入(如时间、经费、生活能力等);(4)干预措施符合临床实际、临床实践环境,无盲法,无安慰剂,容易被研究对象接受,较容易通过伦理审查,成本-效益更优;(5)最重要的是,真实世界研究提供了传统RCT无法提供的证据,包括真实环境下干预措施的疗效、长期用药的安全性、依从性等证据,并且可以做到新药或新型设备上市后再评价,为临床选择使用新药及新型设备提供客观的依据。
但是真实世界研究也的确存在自身的局限性,包括如下两个方面:(1)设计的局限性:对于疗效评价,除pRCT外,多数真实世界研究为观察性研究设计,研究对象纳入限制较少,人群异质性较大,干预分组不采用随机化,因此基线特征和其他影响疗效与预后的因素在比较组间的分布存在一定程度的不均衡性,可导致结果偏倚;即使采用复杂的统计学方法如倾向性评分减少这些混杂因素的影响,但这种分析方法也仅能处理已知的混杂因素,无法处理未知的混杂因素。(2)数据的准确性、完整性:多数真实世界研究是对现有临床或医疗管理数据库如电子病历、疾病登记表以及电子健康档案等来源的数据进行回顾性观察分析,故这些数据的准确性、可靠性以及与所研究问题的相关性难以保证;常常会出现关键数据信息的缺失,导致无法充分分析结局与相关因素的关系。虽然真实世界研究样本量增大,可增加统计的效能,但由于这些数据质量本身的缺陷可能导致的偏倚,使用复杂的统计学处理也并不能消除,故判断研究措施有效性时应慎重[1,8]。
目前,真实世界研究主要用于但不限于解决4类科学问题(表2)[5] 。
真实世界证据(real-world evidence)是基于这些研究数据形成的与医疗产品使用、获益及风险相关的临床证据。真实世界证据来源广泛,从基于已有数据库的观察性研究到随机或非随机化的临床试验,均可产生真实世界证据。
目前国内临床医生对真实世界证据的认识存在"两极分化":一部分人认为真实世界证据最接近临床医疗现实情况,得到的结果最能说明现实条件下的问题,比传统的RCT更可信;另外一部分人则认为真实世界研究证据大多来自观察性研究,缺少严格的方法学控制,研究结果存在较大偏倚,其证据等级要比RCT低。
解决这些分歧,首先需要明确,研究证据的强弱并不完全取决于研究方法,临床研究的问题不同,适用的研究方法不同。例如疗效评价,理论上RCT的证据级别最强,但如果当前无RCT的研究证据或因限于伦理的要求,无法在特定人群开展RCT,那么基于真实世界的pRCT或注册登记研究的证据将是当前最佳的研究证据。此外,对于预后评价,最佳的证据来自高质量的队列研究,而不是RCT(在预后评估中甚至不能进行随机化分组干预);而对于临床某一诊断方法或技术的评价,最佳证据来自高质量的横断面研究。其次,针对同一研究问题,研究证据的强弱也不完全取决于研究设计。如前所述,在疗效评价方面,理论上最佳的研究设计是随机对照试验,但如果这种RCT研究在设计、实施和质量控制等方面存在重大缺陷,其研究结果的可靠性可能会低于针对同一问题且严格设计、实施和分析的前瞻性队列研究。
为纠正目前对真实世界证据的错误观念,美国FDA于2016年12月在N Engl J Med发文指出,真实世界证据与其他证据的本质区别不在于研究方法和试验设计,而在于获取数据的环境,即真实世界研究的数据来源于医疗机构、家庭和社区,而非存在诸多严格限制的科研场所[1]。
因此,RCT的研究证据与真实世界证据并不是对立关系。RCT研究证据因具有很高的内部真实性,仍是循证医学的基石,是评价任何临床干预措施有效性和安全性的基础;在RCT的基础上制定相应的治疗指南,使新的临床干预措施得以真正用于临床,但其结果外推受限,不能涵盖临床所有的实际情况。而真实世界证据来自临床与医疗真实环境,数据来源广泛,样本量巨大,可以作为RCT的重要延续和补充,用于决定某种或多种干预、预防或管理等措施在临床实践中的真实效益、风险等,使RCT后的临床研究结论回归真实世界。近年来,欧美国家越来越重视真实世界证据的应用。英国制药工业协会2011年明确提出,真实世界证据与RCT证据是相互补充的关系,两者在"证据等级"中处于平等地位,希望在2020年,真实世界证据可以更广泛地应用于药品研发、审批及适应证调整等方面[9]。2016年,美国国会公布的《21世纪治愈法案》也提出,将采用真实世界证据用于药品及医疗器械的审批[10]。
虽然真实世界研究有诸多RCT无法媲美的优势,但也存在一些难题:真实世界研究需要大量的研究样本,甚至多中心事件,收集数据难度高,工作量庞大,数据异质性强,对统计方法的要求比传统研究更高,多属于回顾性分析或事后分析,研究证据等级受到挑战。此外,利用电子病历的大数据可以提供可利用的多源数据,保证了数据的多元性、重要性和时效性。但对于数据的准确性、完整性和一致性,目前仍缺乏用于解决研究数据收集和质量控制的系统技术指导。
中国真实世界研究仍处在起步阶段,研究的质量参差不齐,为规范与指导我国临床开展真实世界研究,已有学术团体组织专家制订"中国临床医学真实世界研究施行规范",对这类研究的设计、样本量计算、患者随访管理、数据管理、统计分析及质量控制等多方面提出了基本的意见[11]。
此外,当一项真实世界研究完成后,还要遵循国际规范,报告研究结果的真实性与临床适用性。目前国内医生对此要求的重要性认识不足,这会影响其设计与实施高质量的真实世界研究。而真实世界研究遵循的报告规范,主要是依据观察性流行病学研究报告规范STROBE的扩展板"RECORD声明"(reporting of studies conducted using routinely collected data, RECORD),即"常规医疗数据研究的报告规范声明"和国际药物流行病学会签署的"优秀比较效益研究"(good research for comparative effectiveness, GRACE) (http://www.graceprinciples.org/)列表[12,13]。这2份列表既可用于指导这类研究的设计,还可用于评价这类研究。国内有学者已将其翻译成中文并进行了解读,感兴趣的读者可查阅相关文献[14,15],有助于进一步了解真实世界的设计与报告规范。
总而言之,真实世界研究并不是一种新的研究方法,而是一种理念,包括观察性真实世界研究和试验性真实世界研究。真实世界研究与RCT相比,二者各有优势和不足,产生的研究证据可以互为补充。随着医疗大数据的迅猛发展,利用电子病历数据开展的大样本真实世界研究数量急剧增加,未来将产生更多的真实世界证据指导临床实践。但如何正确收集、处理和解释数据,减少偏倚,提高质量是真实世界研究亟待解决的。尽管我国真实世界研究起步晚于欧美发达国家,但可以预见,在各方努力下,随着国内临床医生对真实世界研究设计、实施与报告规范重视度的不断提升,国内高质量的真实世界证据将不断涌现,将推动中国循证医疗实践和决策的发展。