【关键词】临床研究 真实性 学术不端 对策
【作 者】郭盛楠 、齐淑兰、王晓红、杨立丽、朱琦、孟醒:中国中医科学院针灸研究所期刊中心,100700,北京
【摘 要】临床医学研究论文中常见的真实性学术不端问题常存在于受试者、干预措施、疗效指标、统计学处理和研究方案这几个方面。编辑可以通过向作者索要原始数据;从文章整体及宏观的角度入手,注意写作的严谨性和逻辑的缜密性;重视同行评议专家意见,必要时可请多位专家对论文进行评审;核查投稿系统中作者的基本信息等方式协助判断研究的真实性。若遇到涉及真实性的学术不端问题,可参考出版伦理委员会中的具体流程处理。
对任何学科的科学研究而言,研究报道的真实性都是至关重要的。对于医学研究,特别是其中的临床研究来说,真实性的重要性更为突出。医学是与人类的健康、生存、繁衍息息相关的。正确的医疗抉择可以惠及成千上万的民众,如中国中医科学院中药研究所的屠哟哟研究员对青篙素截疟的研究成果可拯救数以百万计的生命,获得2015年诺贝尔生理或医学奖,更是被称为“拯救生命”的奖。然而同样,由于不真实的临床医学研究导致的错误医疗决定也会吞噬人类健康,甚至夺走宝贵生命。一位美国的医学专家被查证研究数据造假,其伪造的数据主要与一类解热镇痛抗炎药相关。该类药物于20世纪90年代上市,与传统解热镇痛抗炎药相比具有更好的胃肠道安全性,但后来证实该类药物具有导致非常严重的心脑血管事件的风险。错误也许是不能避免的,但是,我们不能接受的是因“捏造”“杜撰”等手段得出的“虚假”结论而产生的错误。真实性是医学研究论文的第一要务。临床研究是医学研究中最常见的类型,如何发现临床医学研究论文中常见的真实性学术不端问题,以及我们应当如何应对,是科技期刊编辑需要注意的问题。
1、临床医学研究论文中涉及的真实性学术不端问题
描述临床研究的论文即为临床研究论文。临床研究指任何在人体(病人或健康志愿者)进行药品的系统性研究或其他干预措施,以证实或揭示试验用药品或其他干预措施的作用、不良反应及/或试验用药品的吸收、分布、代谢和排泄,目的是确定试验用药品或其他干预措施的疗效与安全性。受试者、干预措施、疗效指标、研究方案等是临床研究的几个关键要素。我们主要从这几个方面探讨涉及到的真实性学术不端问题,此外临床研究的统计学处理也容易出现相关问题,故一并讨论。
1.1、受试者方面
1.1.1、重要资料缺项导致的证据支持力度弱
部分临床研究缺少关键的基础资料,故而相应的证据支持力度弱,可信性低,真实性受到极大质疑。比如一项临床研究的开展需要时间、场地、人员和/或资金等多方面支持。但不少临床研究在撰写过程中脱离了时间和空间,一些临床研究的基本要素,如临床试验开展的地点、研究持续的时间、参加试验的人员及分工等均未描述。这也许不单单是写作不规范的问题,很有可能是研究并未真实开展。再如在临床研究中,常设置试验组和对照组2组受试者进行对照,用来比较不同干预措施疗效的差异性。但在进行干预之前,需要比较2组患者的一般资料是否具有组间差异,即判断基线是否齐。但作者在描述时常常将一般资料的基线齐性间题一笔带过,简单一句,“2组患者年龄、性别、病程等一般资料比较差异均无统计学意义”,而不列出具体的年龄、性别、病程等的数据。这样的描述较为随意,明显说服力不强,可信性较低。
1.1.2、研究数据不符合常理、不符合逻辑
临床研究的数据是整个临床研究的核心,也是容易被改写、夸张、编造和捏造的。研究数据不符合常理、不符合逻辑可体现在以下方面。
1)受试者的纳人标准与一般资料中的资料不符。如笔者在审稿工作中发现有论文撰写受试者的纳人标准年龄为18至60岁,但是在介绍受试者一般资料时,年龄最小为20岁,年龄最大为65岁。受试者65岁的年龄已经超出了纳人标准中所要求的。这提示我们该研究要么有较大的实施偏倚,要么就涉嫌数据捏造。
2)受试者的临床资料有悖常理,不合逻辑。如妇科疾病临床研究中作者记述患者一般资料中男性和女性各多少例。这种描述与实际情况严重不符,有悖常理,可以说是捏造的数据,这样论文的真实性可想而知,其研究结果结论更是站不住脚。
3)受试者一般资料中某项指标的平均值超过极值。如患者病程最短为3.5年,最长为10.5年,平均为2.8年。因为患者的病程范围在3.5至10.5年之间,所以其病程的平均值一定在这个区间之内,而2.8年明显不属于这个范围,拥有这样数据的临床研究高度涉嫌数据的编造。
1.2、干预措施方面
1.2.1、所描述的干预措施在临床实际中不可能操作或完成
医学具有自然科学和社会科学的双重属性。我们不能仅仅重视科学和技术层面的问题,还需要特别关注人的因素。有的临床试验所描述的干预措施具有创新性,记述的效果也很好,但是具体操作起来一定具有相当大的阻力。笔者在工作中曾经遇到这样的情况。比如有作者描述针刺会阴穴(该穴位定位在会阴部)治疗妇科疾病。该试验总共观察30例患者,所取穴位包含会阴穴,全部患者完成治疗,无一脱落。但文中并未描述如何保护患者隐私的问题,具体实施起来是否有难度,如何做质量控制,针刺的操作者是否要求为女性医师等。所以在同行评议时,有着丰富临床经验的专家指出,这样的取穴方法在医院几乎不可能实施,严重质疑是否真的如此操作,对其真实性提出了质疑。再如有研究纳人病程在5-30 d的产后缺乳患者,每日在医院为患者针刺治疗,连续治疗1个月。而妇产科医师,甚至是经产妇都知道哺乳期妇女,一些尚处于子宫复旧的过程中,即“坐月子”期间。连续1个月出门的可能性非常之低。而该研究未报道脱落病例。故该研究是否真的如所叙述的那样实施令人生疑。这种种案例提示我们,干预措施不可能脱离人而孤立存在,一定要注意受试者本身是否能够接受该干预措施,是否符合人文伦理等关键问题。要将患者、干预措施放到真实世界中设身处地地考虑。这样,一些不经推敲的谎言就会不攻自破。
1.2.2、干预措施的描述本身前后矛盾
一项临床研究的核心一般是目标干预措施的有效性和安全性,故干预措施的临床疗效是其主要观察内容。所以对干预措施的描述尤为重要。在2010年版的临床试验报告的统一标准(CONSORT)声明中,关于干预措施描述的要求就非常详细。比如对于药物治疗,应包括药物名称、药物的剂量、具体的给药方式、给药的时点以及疗程、什么情况下需要停用药物或配合使用其他药物等。如果对照组接受常规治疗,那么应该详尽描述常规治疗都包括哪些具体的治疗方法,其目的是读者通过阅读可以基本复制或重复该项操作。我们通过作者对干预措施的描述,也许可以发现一些潜在的问题。如在临床实际操作中,作者描述患者取仰卧位,之后又描述穴取心俞穴和肺俞穴。具有中医基础的人都应了解,心俞穴和肺俞穴均位于人体的后背部,那么仰卧位如何取穴呢?出现了前后矛盾的情况。如果这不是作者的笔误的话,那么当属随意编造。
1.3、疗效指标方面
1.3.1、临床观察时点与疗效指标的评测周期不符或矛盾
疗效指标是评价疗效标准的工具。每个疗效指标都有自己的适用范围和人群、检测方法、检测时点、数值范围、临床意义等。如果作者描述的临床研究中的疗效指标与该指标的使用要求或特性不相符。那么我们就要对作者是否真的进行了该项研究持有怀疑态度。比如,匹兹堡睡眠指数量表是临床中用来评价失眠患者的常用指标。该指标设计的是用来询问患者近1个月以来的睡眠情况,评价时点是每个月一次。而有的研究对匹兹堡睡眠指数量表的评价是一周一次,与该量表的设计不相符。这也许是作者科研水平较低的问题,但也有可能是根本未实际操作,只是文字描述想象而已。这样论文的研究成果与科学可靠渐行渐远。
1.3.2、受试者治疗前后的观察指标数值超出该指标的理论及临床实际范围
疗效指标作为一个工具,一把尺子,是有一定范围的。比如Barthel指数评定量表是临床上用来评价患者日常生活能力的常用量表。其得分范围为0至100分,所得分数只可能是数字“0”或者数字“5”结尾。如果作者在研究结果中描述Barthel指数的最小值为0分,最大值为92分,或者Barthel指数的平均值为110.5分,那么说明作者并未理解或根本未使用本量表进行临床评价。所以若是受试者治疗前后的观察指标数值超出该指标的理论及临床实际范围的话,应高度怀疑该文章的真实性。
1.4、统计学处理方面
1.4.1、未描述统计学处理方法
医学统计学是临床研究的重要组成部分。统计学专业人士的加人是申请重大科研课题的必备要求。在研究的设计阶段,就需列出统计方案和计划,结题时,如果试验结果的统计与预定的统计方案不一致,则要详细解释说明。所以,作为规范的临床研究,如果在研究报告阶段未进行统计学处理的描述,除了不规范,我们还有理由怀疑,作者对统计结果是否真正进行了统计,其结果是否可信。2010年版的CONSORT声明中的条目12a和条目12b就明确提出要描述用于比较各组主要和次要结局的统计学方法以及附加分析的方法,如亚组分析和校正分析等。
1.4.2、统计学处理方法描述错误
不同的统计方法有不同的适用情况。比如,t检验是用来评价2组正态分布且方差齐性的2组计量资料统计学差异的方法;单因素方法分析是用来评价两组以上计量资料统计学差异的方法;等级资料一般采用秩和检验;卡方检验是用来比较2组计数资料中率的差异的统计学方法等。所以如果作者在文章中描述只有2组患者,但是却使用单因素方差分析的统计方法是不正确的。或者组内治疗前后应该使用配对样本的t检验,而描述为组间使用配对样本的t检验,都是错误的。若不考虑数据资料本身的特点,盲目套用或抄写他人的统计学方法则对研究的真实性有较大影响。
1.5、研究方案方面
关于研究方案中涉及到的真实性学术不端问题主要为作者描述的研究方法与对试验的描述相矛盾。临床研究的常见类型有随机对照临床试验、非随机对照临床试验、病例对照研究、队列研究、病例系列研究等。其中随机对照试验(RCT)和由RCT形成的系统综述是临床研究证据等级中的I级证据。故而很多作者更倾向于把自己的研究描述为RCT,以求发表。而笔者在工作中发现部分作者实施的是非随机对照研究,但却定性为随机对照研究,或杜撰随机方法。有学者对随机对照试验描述错误进行过细致的分析。比如试验分组实际上的方法是按照患者的就诊顺序或者病案号,属于半随机分组方法,那么就不应该描述为完全随机分组。
再如,通过阅读作者论文的相关描述,我们发现该研究是一个回顾性研究,但作者同时描述采用的是前瞻性随机对照的方法,相互矛盾。这提示我们作者也许并不了解研究设计的具体类型,只是仿照其他参考文献的研究方法书写,而实际并不是如此设计和实施的,故而真实性存疑的风险较大。举个例子,作者描述“搜集2008年5月至2009年5月在我院就诊的颈椎病患者100例”,之后又描述“于2009年6月对纳人患者的数据进行随机对照研究”。随机对照试验是前瞻性设计,需在纳人第1个受试者之前设计好完整的临床试验方案,并获得医学伦理委员会的批准,之后应该在相关的临床试验注册平台上进行注册并获得注册号。然而,我们通过作者的描述,得知这实际上是一个回顾性分析,并没有前瞻性的设计。这除了说明作者科研水平有待提高之外,也说明这个研究有可能是虚构的。
2、针对真实性学术不端问题的对策
面对临床医学研究论文中的真实性学术不端问题,医学科技期刊的编辑有责任和义务去发现、指出和解决,从而发挥科技期刊对论文的把关作用。那么作为论文出版核心环节的编辑,我们具体应该如何去做呢?笔者认可以从作者、编辑自身以及专家这几方入手,具体策略如下。
2.1、向作者索要原始数据
原始数据是产生信息、让我们获得知识,进而构建理论指导生产和发展的源泉,其重要性不言而喻。可是长期以来由于文章表达规范和版面的限制,我们不可能将全部的原始数据呈现在论文之中(增强出版可以很好地解决这个问题)。但在审稿及编辑加工稿件的过程中,编辑是可以向作者索要原始数据的,这可以帮助我们判断研究的科学性和严谨性。若是作者不能或不愿提供原始数据就需要我们高度重视,对其研究的真实性持有怀疑态度。需要更加仔细地审稿、推敲,怀疑的问题未经解决绝不能轻易发表。
2.2、从文章整体及宏观的角度入手,注意写作的严谨性和逻辑的填密性
不合理地改写或杜撰论文者往往关注论文中单个部分数据的分析和撰写,因为不是真实发生的,所以不存在数据的内部真实性,故当放眼全文阅读时,往往会出现首尾不相呼应、自相矛盾的情况。出现这些问题时,高度提示论文的真实性存疑。与此同时,我们还特别需要注意从宏观的角度去考虑问题,像是中医学所讲的“整体观念”“天人合一”。比如,笔者在工作中遇到过这样的情况:三伏天穴位贴敷治疗虚寒型肺疾病是传统中医疗法,该作者写于某年夏天于头伏、中伏和末伏对患者进行3次贴敷,写作规范,行文严谨,但是审稿意见是:真实性存疑。这是为什么呢?因为该年度有4个伏天,即头伏、中伏、闰中伏和末伏,临床实际操作过程中,遇到闰伏,需要对患者进行额外贴敷,故而总共应该是4次贴敷。而文章中是贴敷3次,与该年度的实际情况不符。所以我们认为不能仅仅孤立地去看文章,要把文章放在临床实际中,放在自然环境下去看,同时注意写作的严谨性和逻辑的填密性,从而对其真实性进行判断。
2.3、重视同行评议专家意见,必要时可请多位专家对论文进行评审
与很多西方科技期刊的编委会专家办刊不同,我国大部分科技期刊是编辑部编辑办刊。西方科技期刊审稿多采用的是同行评议审稿制度,其优势在于这能够更广泛地借助领域内众多专家、学者的聪明才智,弥补编辑部人员知识面相对有限的缺点,从而提高科技期刊的学术水平。目前大部分我国科技期刊的审稿流程是以三级审稿制度为主干,同时参考同行评议审稿人提供的外审意见。我们可以进一步加强同行评议的力度,一篇论文可请多位专家审稿,特别是对于有争议的论文更要如此。专家能够发现行业内不为编辑和其他领域读者所知的问题,对其科学性进行把关。
2.4、核查投稿系统中作者的基本信息
除了以上提到的几点之外,有同人研究发现可以利用作者在投稿系统中的基本信息审核论文的真实性。真实性存疑的稿件在投稿系统中记录的作者信息量非常少,往往只有必须填写的项目;部分作者手机号码归属地与研究开展地点和单位所在地不相符;邮箱、用户名、密码呈以“作者姓名+后缀”批量化命名的特点;与作者沟通的过程中,往往出现作者对研究内容不清,无法报出自己姓名的情形等等。通过对作者基本信息进行审查,编辑可以尽早发现不合理的投稿,这些投稿可能是代写、代投的稿件,其真实性值得怀疑。
3、结束语
真实性是科学研究的基础,作为科技期刊的编辑,我们有必要去传播真实可信的科研成果。对于临床医学研究论文而言,受试者、干预措施、疗效指标、统计学处理和研究方案是我们需要特别关注的方面,我们可以通过向作者索要原始数据等方式来协助判断研究的真实性是否存疑。在实际工作的过程中,若遇到涉及真实性的学术不端问题时,可参考出版伦理委员会( COPE)中提出的“如您怀疑捏造数据该怎么做”板块,如“考虑从另一名审稿人处获得第二份意见”“联系作者解释顾虑,但不做出直接指控”至“通知审稿人结果”等一系列流程来处理,切不可忽视和无视。洁净的学术空气需要作者、同行评议专家和编辑的共同努力。