
第一节 国外疫苗临床试验发展历程
一、随机对照双盲临床试验原则的发展历程
1747年,英国皇家海军外科医生James Lind在海上航行的Salisbury号船上,选择了12名病情相近的坏血病患者进行两两分组,分别定量给予橘子与柠檬、苹果酒、醋、胆矾、海水和肉豆蔻浆液,结果只有吃橘子与柠檬的患者得以治愈。这项尝试用橘子与柠檬治疗坏血病的临床试验开创了现代临床试验之先河,而James Lind亦被公认为临床试验之父。
1799年,英国John Haygarth研究了医疗仪器“帕金斯拖拉机”的功效。“帕金斯拖拉机”是一些金属指针,据称能够“拉出”各种疾病。他通过比较木制漆成金属色的“拖拉机”和金属“拖拉机”对于缓解风湿病患者疼痛的效果,发现没有差别,证实“对于疾病的强大影响是由想象力产生的”。这是安慰剂效应的首次证明。这一研究被认为是最早的安慰剂对照单盲研究。
1863年,英国Willian Gull与Henry Sutton合作,证明了安慰剂治疗在评估疾病过程中的自然变异和自发治愈可能性上的重要性。他们给44名风湿热患者仅提供薄荷水,发现患者因对药物的使用非常重视,而不是药物本身的有效性使得患者发生了痊愈。这种安慰剂治疗的作用对于那些具有较大自然痊愈倾向的急性患者尤甚。
早期实验在涉及患者分组时,多数采用随意分配或交替分配的方式。Johannes Fibiger在评估用于治疗白喉的治疗性血清时即采用了交替分配,“将治疗性血清隔天注射到进入临床试验的对象身上”,患者获得抗体治疗或作为对照,取决于他们进入临床试验的顺序。交替分配的技术有一个主要的缺点:研究者知道下一个患者将要接受哪种治疗,并且确实经常由于知道下一个分配将是什么,而对患者是否合适纳入进行筛选,从而引入偏性。避免这种偏差的一种方法是在知道哪个组将获得哪种治疗之前将患者分成两个类似的组,然后在最后一分钟,通过扔硬币将一个组分配给一个治疗,而将另一组分配给另一个治疗。这种方法是由17世纪著名化学家、生理学家、医生Jan Baptista van Helmont提出的,被收录在1648年他儿子以拉丁文为其整理出版的《医学的源头》一书中,美国底特律卫生署的Burns Amberson及其同事于1926年将这一方法付诸实践以评价硫代硫酸金钠治疗肺结核的效果。Amberson等将24名患者分成两组,每组12名,每组成员为“单独匹配”。然后通过抛硬币来确定硫代硫酸金钠治疗组与对照组;只有Amberson等两名设计者与负责病房的护士知道分组情况,患者与其他参与临床试验的医生均不知道治疗中的任何区别。这项调查证明金制剂治疗结核病无效且有害,从而直接终结了当时国际盛行的这一疗法。该研究虽然入组病例数量较少,但因首次采用随机化,被誉为随机对照双盲临床试验的萌芽。
在第二次世界大战之前进行的临床试验仅有可数的几次,且经常在计划或执行上存在严重缺陷。1944年,在英国医学研究委员会(the Medical Research Council)支持下,一项名为Patulin试验、旨在评估展青霉素(patulin)治疗普通感冒效果的临床试验在伦敦10万人中开展。研究对象来自工厂、学校以及社区,临床试验设计复杂。研究者清楚地认识到防止患者预知分组的重要性,因而临床试验设计了两个治疗组(代码R和T)和两个安慰剂对照组(代码Q和S),采用交替分配的方式,根据进入临床试验的顺序,患者依次服用代码为Q、R、S、T的药物。该临床试验虽然未能证明展青霉素治疗普通感冒有效,但在方法学上向前迈出了巨大的一步,被公认为第一个多中心临床试验。即便如此,这种分配方式还是不能保证研究对象真正匹配,而个体随机化则可以克服这种困难。现代意义的随机化概念是1923年由Ronald Fisher在世界上最古老的农业研究机构(the Rothamstead Experimental Station)从事农业研究(土地被逐个随机化)时提出的。伦敦卫生和热带医学学院Austin Bradford Hill教授在1937年发表的一系列关于医学统计学原理文章时,已经意识到个体化随机分组在临床试验中的价值,即在实践上可消除选择性偏倚。1946年,作为英国医学研究委员会统计研究组组长,以及肺结核临床试验委员会的统计学家,Austin Bradford Hill在链霉素治疗肺结核的临床试验中采用了随机数进行个体化随机分组,该研究被广泛认为是现代随机对照临床试验开始的标志。实际上,首先开始个体化随机分组的临床试验是测试百日咳疫苗的免疫效果,而不是链霉素治疗肺结核的临床试验。但后者早于百日咳临床试验三年,于1948年报道结果。链霉素治疗肺结核的临床试验也成为Bradford Hill杰出职业生涯中两个具有里程碑意义的研究之一。没有Bradford Hill,随机化将迟早会应用于临床试验,但是缘于Bradford Hill对医学研究的敏感性、对医学伦理的理解,以及他对设计的简单性和表达的清晰度的关注,使得随机化迅速获得医学科学家的接受。1962年,Bradford Hill出版了《临床与预防医学统计方法》(Statistical Methods in Clinical and Preventive Medicine)一书,成为临床试验史上第一本讲述临床试验方法学的书籍。
伦理道德与临床试验似乎是相伴的。历史上的链霉素治疗肺结核临床试验策划时首先面对的是对照组设立的伦理问题,即不给予一部分参与临床试验的患者在动物实验中有效且具有初步临床疗效的药物是否合乎伦理?最终医学研究委员会下的肺结核试验委员会确定一个原则:“如果没有抓住机会设计一个严格控制的临床试验,快速有效地揭示新疗法的价值,这将是不道德的。”由此,解决了这一伦理问题。在百日咳疫苗预防临床试验中,要求6~18月龄儿童的父母自愿让他们的孩子进入临床试验。他们被给了一个描述疫苗临床试验信息的小册子,包括在所有进入临床试验孩子中有一半的接种不预防百日咳,而是“抗卡他症状”的信息。孩子不被纳入该试验直到收到父母的书面同意书。并且在临床试验报告中强调了“父母在充分了解到他们的孩子不一定会接受百日咳疫苗接种情况下,同意参加临床试验”。
第二次世界大战以后,在德国纽伦堡审判了纳粹战犯,涉及集中营中不人道的人体实验。审判形成的《纽伦堡法典》中包括了关于人体试验十项准则,包括知情同意和自愿原则、有利于社会的原则、试验的科学性原则。在《纽伦堡法典》基础上,1964年6月在芬兰赫尔辛基召开的第18届世界医学协会联合大会上,制定了《赫尔辛基宣言》(全称《世界医学协会赫尔辛基宣言》)。该宣言规定了涉及人体对象医学研究的道德原则,是一份包括以人作为受试对象的生物医学研究的伦理原则和限制条件,也是关于人体试验的第二个国际文件,比《纽伦堡法典》更加全面、具体和完善。1966年,美国外科医生总署发表了一项政策声明Surgeon General’s Directives on Human Experimentation,要求人类研究有独立的预先审查,由此催生了机构审查委员会(Institutional Review Board)。
1979年,为进一步保护人类受试者权益,美国保护生物医学和行为研究人体国家委员会撰写并公布了题为“保护研究中人类受试者的伦理原则和准则”报告,又被称为贝尔蒙特报告(Belmont Report)。贝尔蒙特报告解释了任何使用人类受试者的研究应遵循的三个基本伦理原则:①尊重人——保护所有人的自主权,并以礼貌和尊重的方式对待他们,并允许知情同意。研究者必须真诚,不要欺骗。②受益——“不伤害”的哲学,同时最大限度地利用研究项目的利益,最大限度地减少研究课题的风险。③正义——确保合理、非剥削和经过充分考虑的程序得以实施;将成本和利益公平平等地分配给潜在研究参与者。
国际人用药品注册技术协调会(International Conference on Harmonization of Technical Requirements for Registration of Pharmaceuticals for Human Use,ICH)是由欧盟、美国、日本三方的政府药品管理部门和药品研发生产部门共同发起的,目的是协调各国药品注册的技术要求,对新药研发程序的相互可接受性、临床试验的可靠性及新药的安全性和有效性等方面进行研讨,制定出一系列有关质量、安全性和有效性的指导原则,减少或消除重复研究和开发新药期间进行的测试的需要,促进各国临床试验规范化。1990年成立ICH指导委员会,颁布的ICH指导原则分为4个部分,包括质量部分指导原则、安全部分指导原则、临床部分指导原则和多学科部分指导原则。其中ICH-E6即为《药物临床试验质量管理规范》(Guideline for Good Clinical Practice,GCP)。
1993年,为了提高临床试验报告质量,30位专家包括医学杂志主编、临床试验专家、流行病学家等在加拿大多伦多首次提出了《临床试验报告标准声明》(the standardized reporting of trials statement),包括32项的检查清单与流程图。在此基础上,1996年最终形成《国际临床试验报告标准共识声明》,正式发布在JAMA。
为了提高临床试验信息透明度和质量、提高医学研究公信度,加快药物及干预措施的研究进程,鉴定和阻止不必要的重复性研究,国际上建立了临床试验注册制度。此制度肇始于1974年美国尼克松总统号召的“向癌症开战”(the war on cancer)。当时,为加快癌症治疗的研究、传播相关信息,美国国立癌症研究所提出并尝试建立了临床试验注册。国际上首个面向全球的在线临床试验注册平台(Clinicaltrials.gov)于2000年正式上线。2004年,国际共识“渥太华声明:人体医疗类干预临床试验研究方案信息与结果的国际注册原则”发表。2005年8月,世界卫生组织(WHO)为使国际上临床试验的注册符合伦理学要求并具备科学性,制定了相应的规范和标准,建立了WHO全球性临床试验注册平台,目标是通过提高透明度来加强临床试验的可信度。
二、疫苗临床试验发展历程
1798年,英国Edward Jenner在Variolae Vaccinae中发表了将牛痘接种到人体,从而预防天花的实验结果,标志着疫苗这一现代医学用于预防和治疗疾病的重要手段的诞生。疫苗的发明与使用,是人类文明的最伟大成就之一。至今,还没有任何一种其他的医疗措施能像疫苗一样对人类健康产生如此重要、持久和深远的效果和影响;也没有任何一种其他的治疗药品能像疫苗一样以极其低廉的代价把某一种疾病从地球上消灭。与其他医学干预一样,临床试验是评价疫苗效果的唯一科学标准。由于疫苗主要用于预防疾病发生,使用对象多为健康人群,特别是婴幼儿,其临床评价从伦理与实施上具有相对的特殊性,方法学上亦具有一些特别之处。即便如此,疫苗临床试验作为临床试验的一个部分,其发展历程与临床试验是一致的。随着牛痘疫苗的创始,19世纪到20世纪中叶,全球计划免疫项目中的疫苗基本形成,这一过程亦即疫苗临床试验的发展历程。
美国哈佛医学院的联合创始人和教授Benjamin Waterhouse是第一个评价天花疫苗的医生。1800年,他在当时美国副总统杰弗逊支持下,受波士顿卫生委员会委托进行了一项对照实验,19名接种Edward Jenner牛痘疫苗的男孩和2名未接种疫苗的男孩暴露于天花病毒。接种的男孩表现出免疫力,2个未接种疫苗的男孩则死于天花。这是第一个疫苗疗效临床试验,也是人类历史上第一个疫苗临床试验。随后于1885年,巴斯德采用干燥法制备的神经组织疫苗成功地治疗了一名9岁的被疯狗咬伤的儿童,成为不朽的传奇。同年,Jaime Ferran,一个33岁的西班牙医生首次将减毒的霍乱弧菌肉汤培养物皮下注射到至少30 000个西班牙人中,这是历史上第一个细菌性疫苗。接种人群中霍乱弧菌的感染率为1.3%,而未接种人群为7.7%。两项试验都缺乏对照或事先设计的对照。
1892年7月18日,通过动物实验确定了疫苗有效性后,法国巴斯德研究所Waldemar Haffkine在自己和三个同胞的左侧腹部皮下注射了2剂研制的减毒霍乱疫苗,间隔6天,密切观察了接种后的不良反应,完成了历史上首个Ⅰ期临床试验。试验结果证明疫苗安全,可以用于人体。Haffkine认为虽然很多信息可以从实验室的动物实验中获得,但最终的效果评估只能通过人体观察来进行。于是在1894—1896年,应印度政府邀请,Haffkine在印度孟加拉邦、旁遮普邦等地推广霍乱活疫苗,控制当地霍乱疫情的同时,开展了7项现场试验,详细记录一段时间内发生的霍乱事件,收集到大量数据。他每项试验中的接种人群和未接种人群发病率和死亡率的差异进行了比较,发现一个令人困惑的现象,即该疫苗在一些临床试验中能预防霍乱,但在其他临床试验中却不能。对此,他归结为现场试验本身不尽善尽美。其一,一些临床试验中,不同数量的接种与未接种个体可能降低了疫苗效果的评价效能;其二,因为疫情控制实际需要的量往往超出预料,出现了不同临床试验中使用了不同剂量和效力的疫苗现象。由此,他认识到好的现场试验必须保持个体接种日期、剂量和临床反应准确的记录;详细随访个体的疾病发生情况;现场试验必须设对照组,其人数应与接种组相同;接种组与对照组应暴露于相同的疾病风险。Haffkine是第一个明确定义对照现场试验的原则,并且贯彻于实践的科学家。此外,在1896年4月Durbhanga监狱的对照试验中,Hafikine首次采用交替入组的方法。他要求囚犯在地上坐成排,依他们机遇性的座位顺序,双号的男人或女人被接种疫苗。接种5天后,霍乱流行停止。99例每日处于平均劳动强度的对照中11例(11.1%)发病,100%死亡;而110例每日处于平均劳动强度的接种者中5例(4.6%)发病,仅3例(2.7%)死亡。考虑到死亡的威胁,伦理道德观击败了他的科学性,Haffkine给剩余的对照进行了疫苗免疫,使得最终估算疫苗效果为59.5%。毋庸置疑,他是现代疫苗临床试验的先驱者,引领着那个时代的现场试验!
1946年11月至1950年在英国牛津郡、伯克郡和白金汉郡进行的百日咳疫苗现场试验是现代随机双盲对照疫苗临床试验开始的标志。这个试验招募了8 927名6~18个月的儿童,采用随机数随机分成人数大约相等的两组。疫苗组接种三剂百日咳疫苗,对照组接种三剂不含百日咳杆菌,但含有抗组胺成分,浊度与百日咳疫苗相似,用相同瓶子包装的“对照疫苗”。接种后,每名儿童由护士调查员以频繁的间隔定期随访2~3年。父母和调查员均不知道孩子接种何种疫苗。现场试验详细记录了疫苗接种、疾病发生与严重程度。试验的终点为疫苗保护发病以及保护重症的效力。临床试验结果表明疫苗免疫使该病的发病率降低78%。
1955年4月12日,密歇根大学流行病学教授Thomas Francis Jr.在美国安娜堡举行了一次新闻发布会,宣布Jonas Salk研制的灭活小儿麻痹症疫苗现场试验的结果:“对瘫痪脊髓灰质炎有效率为80%~90%”。这个“有史以来最大的公共卫生试验”在44个州招募了1 022 684名1~3年级学生。30万护士、医生、教师、学校官员、公共卫生官员和普通公民自愿组织免疫接种和跟踪脊髓灰质炎病例。在此之前或之后,没有一项医学研究在规模、复杂性或公众参与程度上接近1954年Salk疫苗现场试验。这是另一个标志性现场试验,现代疫苗评价的模式由此固定下来。该现场试验包括两个部分:
观察性开放研究:来自33个州的567 210名儿童参加开放性研究,221 998名二年级学生接种了三剂疫苗,而一年级和三年级的儿童作为对照。
随机对照双盲现场试验:来自另外11个州的455 474名一、二、三年级学生被区组数为10的区组随机方式分成疫苗组与对照组,分别接受三剂疫苗或三剂安慰剂注射,最终疫苗组200 745名儿童与对照组201 229名儿童完成3剂接种与随访。分组信息被隐藏在代码中。“因此,所有关于这些儿童的观察和记录都基于客观基础上,接种和对照之间的偏倚被消除”。根据过去的经验,Francis清楚地知道,年龄、家庭的经济社会背景、家长的参与意愿,乃至于病例的观察和诊断,每个阶段均可能有意无意地引入偏倚。
该试验的主要特点与经验如下:
1.公共资源的投入。如果没有30万的志愿者,系统地跟踪近50万儿童的健康状况几乎是不可想象的。
2.收集最少量的基线信息,这种信息收集的关键目的不是分析,而是提供唯一的识别信息,以提供分析阶段分子与分母的关联。
3.仅在一小部分参与者获得关于疫苗效应的进一步信息,如抗体滴度。
4.采用随机分配,使用单独编码的最小包装,只有现场试验中心持有盲底。
5.最重要的是盲法,临床试验中病例的确认在临床试验结束后,由专家通过肌肉功能、血清学等测量结果彻底地评估。社区医生只负责及时报告疑似病例。
6.临床试验设计要建立在疾病的流行病学基础上。该临床试验地区的筛选基于过去5年高度发病的基础上;临床试验在1954年夏秋季(流行季节)来临之前完成接种。但在分析时,未能说明在“三剂免疫完成后两周”之前发生的10%病例分布情况是个缺陷。
7.临床试验中定义的准确性非常重要。在临床试验记录的858例小儿麻痹症病例中,682例表现为肢体的麻痹,而另外176例被诊断为“非麻痹性脊髓灰质炎”,临床上仅表现为类似感冒的症状。疫苗针对麻痹型脊髓灰质炎有良好保护(疫苗组发病率16/10万,对照组55/10万),但不能保护非麻痹性感染(疫苗组发病率11/10万,对照组14/10万)。大多数疫苗能保护免受严重疾病侵袭,但对于无症状或轻度感染的保护效果不佳。
8.疫苗效力是关键的终点!即使在如此大规模临床试验中,发病与免疫的相关性这一重要问题仍然是难以捉摸;同样,一些严重安全性问题也仍然是无法检出的。
一般来说,临床试验干预措施实施的单位是个体,但在某些特殊情况下,实施的单位可以是家庭、村庄、学校等群体,即群组随机设计(cluster randomization)。发表文献中较早将群组随机用于流行病学研究的是1962年关于治疗肺结核药物异烟肼的试验。而首个明确提出受试者群组随机化时出现的统计问题的学者,则是1978年Georg Washington University生物统计中心的Jerom Cornfield。他指出,如果随机化是通过聚类的,则分析也应该是聚类的;群组随机设计的统计效能低于个体随机。在Cornfield之后,Allan Donner撰写了一系列文章,发表了他在该领域的开创性工作。群组随机设计有一些应用前提,诸如干预措施以群组给予比个体给予更容易,受试对象的接受性更好;利用传播媒介传播的传染病,需要在一定的人群与空间中实现传播;在同一空间的易感者与未采取干预措施的空间的易感者,其传播的速率与机会不同。通常在疫苗效力在个体随机临床试验中得到了确证后采用的临床试验设计中采用群组随机设计,该设计能较好地辨别疫苗的免疫屏障作用。群组随机在疫苗临床试验中的范例是2007年在印度加尔各答开展的霍乱疫苗临床试验。在该临床试验中,住宅(定义为几个家庭居住在一个小屋或一组小屋,或一个多层建筑,但共享由加尔各答市政公司分配的水管,浴室和厕所)、家庭(定义为一起居住在一起的共享相同烹饪锅的个人)被作为群组进行随机分配。临床试验发展史上的重要事件见表1-1。
表1-1 临床试验发展史上的重要事件
