运动员的“囚徒困境”_互动科普

使用社交账号登录

购买价格:
付款方式:

互动科普

主页 > 科普纵览 > 生物 • 医学

运动员的“囚徒困境”

admin  发表于 2017年12月02日

作为一名自行车赛车选手,最让你感到屈辱和挫败的,莫过于在一段上坡路奋力骑行时被对手无情地甩下。尽管已经上气不接下气、两腿酸软,但你还是要咬紧牙关,拼尽全力跟上领先的车手。因为你非常清楚,一旦被甩出第一集团,就会失去继续拼搏下去的全部动力,赢得比赛的希望也就化为乌有。

对此,我有亲身体验。1985年,我参加了不间断横跨美国的自行车大赛,赛程长达4,800千米。比赛进行到阿尔布刻尔克郊外一段漫长的上坡时,我已经赶上了乔纳森·博耶尔(Jonathan Boyer),这位健硕的公路自行车赛选手当时位居第二,并最终获得了冠军,他也是首位参加环法自行车赛的美国人。但这段上坡路实在太漫长了,刚爬到一半,我便感觉疲惫不堪,双腿也好像快断掉了。我只得大口喘气,竭尽全力苦苦支撑。

但一切都是徒劳。快接近山顶时,博耶尔早已消失在沥青公路尽头。望尘莫及的我直到大西洋城的比赛终点才再次见到他。那天晚上,美国广播公司(ABC)体育解说员吉姆·兰普利(Jim Lampley)问我,还有什么方法,可以让骑行速度更快?“我想,有个好爹妈或许最管用,”我冷冷地回答。所有人都受遗传因素限制,很难突破自己的极限——认命吧,不然你还能怎样?

然而我很清楚,可以做手脚的地方非常多。1984年洛杉矶奥运会期间,美国自行车队选手告诉我,他们曾在比赛前给自己输血,有的是输入他们自己在赛季之初抽出来的血,有的则是输入其他血型相同人的血。这种做法被称为“血液回输”(blood doping),在当时并不算违规。从实际情况来看,血液回输与在高海拔地区训练的效果相当:都可以增加选手体内红血球的数量,提高携氧能力。不过,当时我已年届三十,当不了车手,还可以做学术。我参加自行车比赛,主要是想了解自己的体能极限。为了成绩而弄虚作假,就与我参赛的本意南辕北辙了。

1512192086634641.png

但是,我们不妨假设:如果当时我只有20岁,全凭赛车这个职业糊口;如果我所在车队已经把禁药纳入“保健方案”,而且我明白,竞争力不够就只能卷铺盖走人;此外,我相信大部分竞争对手都在服用兴奋剂,并没有谁被查出来。我会做出怎样的选择?

许多自行车手声称,上面假设的种种情况,正是他们自20世纪90年代初以来一直面临的局面。同样的情况也出现在棒球等其他体育项目中,虽然细节有所差别,但滥用兴奋剂的总趋势却如出一辙(参见第28-29页)。许多选手认为,别人都在服药,如果自己还坚持独善其身,将无法与对手竞争。再看看监管层,美国职业棒球大联盟从未制定明确的规则,更谈不上在整个赛季中进行广泛的药检,再加上他们长期以来都有意回避兴奋剂这个问题,终于造成了如今的局面。

我们都不愿意相信,这些体育明星在偷服禁药。但面对越来越多的证据,我不得不承认:不论是自行车,还是棒球、足球、田径等体育项目,过去20年中的绝大部分顶尖选手一直在服用兴奋剂。现在我们应该追问兴奋剂泛滥的原因,而不是“有没有服兴奋剂”:首先,药物、药物混合法以及药物训练养生法在不断进步;其次,在药检执法者与偷吃禁药者的博弈中,执法者老是处于下风;第三,众多职业体育项目中,服药者总能获得胜利,助长了兴奋剂的流行。

 

体育中的博弈论

对局者在预知对手策略的情况下如何应对,以达到最佳结果,这就是博弈论(Games Theory)研究的内容。这一理论所针对的“对局”,不仅仅是指扑克游戏或侧重于战术策略的各种体育比赛,还包括需要作出经济、军事决策乃至国家外交政策的各种极其严肃的活动。所有这些“对局”都有一个共同点,就是对局者会依据公开的选项范围,分析对手的每一“步”行动。

著名的“囚徒困境”就是博弈论的一个经典实例:你和同伙落入法网,被分开关押,无法串供。你们事先约定,大家都打死不招,然而地方检察官给出了下面几个选择:

1. 如果你坦白交待而同伙拒不认罪,那么你将被释放,而他将蹲三年监狱;

2.如果他坦白交待而你拒不认罪,那就轮到你蹲三年大牢,而他获得自由;

3. 如果两人都坦白,每人各处两年有期徒刑;

4. 如果两人都不认罪,每人各处一年有期徒刑。

上表名为“博弈矩阵”,概括了上述四种结果。

从这些结果来分析,背叛同伴似乎是你的最佳选择。我们先从罪犯甲的角度来考虑,他唯一无法控制、又能影响结果的因素就是罪犯乙的选择。假定罪犯乙始终保持沉默,那么,罪犯甲坦白交代结果最佳,可以躲过牢狱之灾;如果他选择保持沉默,结果也还不错,只要蹲一年大牢。因此,对于罪犯甲来说,最好的选择就是坦白。现在,我们假设罪犯乙认罪。在这种情况下,对罪犯甲而言,情况依然是坦白交待胜过拒不认罪——坦白会让他被判两年监禁,否则迎接他的将是三年铁窗生涯。由于两名罪犯面临的情势完全相同,因此无论对方如何选择,对另一个罪犯来说,最好的办法都是坦白。

这不仅仅是理论上的结果,也得到了实验的证实。当参与“囚徒困境”博弈的受试者彼此间不允许通气时,只玩一次或固定次数的对局,他们常用的策略就是坦白交待。如果受试者玩次数不定的对局,那么最常用的策略便是“针锋相对”:开始时,受试者都会遵守约定保持沉默,但随后就会根据对方的表现来决定自己的选择:你义气我也义气,你不仁我也不义。多人囚徒困境的对局中,如果局中人玩的次数增多,彼此间形成信任,则可能出现更加合作的模式。不过研究表明,一旦大家都争相坦白而导致背叛成风,就会出现多米诺骨牌式的崩盘局面。

运动员的“囚徒困境” (2).png

在自行车、棒球和其他一些体育项目中,参赛者按照一组规则彼此竞争。自行车竞赛规则明文禁止使用兴奋剂。但这类药物极其有效,服用以后又很难检测出来(尽管还是有可能),再加上成功之后名利双收,使运动员们无法抗拒禁药的诱惑。一旦几位车手依靠兴奋剂获得佳绩,其他遵规守纪的选手也必定效仿,导致违规之风愈演愈烈。由于违规将导致重罚, 车手们全都对此保持沉默。因此,通过公开协商来扭转这种局面、使比赛回到正轨的想法,是不现实的。

以前的情况并非如此。20世纪40年代到80年代,许多车手都服用兴奋剂和镇痛药。直到1967年环法自行车赛中,英国车手汤姆·辛普森(Tom Simpson)因过量服用安非他明而在旺图山赛段爬坡时猝死,兴奋剂禁令才随之出台。即便在辛普森的悲剧之后, 整个70年代和80年代,反兴奋剂条例的执行也时紧时松。由于对服用禁药没有明确的规定,很少有人把使用兴奋剂视为作弊行为。但随着90年代出现的一个新生事物,博弈矩阵被改变了。

 

r-EPO的诱惑

这个“新生事物”,就是经过基因改造的重组促红细胞生成素:r-EPO。普通EPO是人体中天然存在的一种激素。肾把这种激素释放到血流中,血流再把它带到骨髓里的受体上。当EPO分子与这些受体结合后,就会促使骨髓产生更多的红血细胞。慢性肾功能衰竭或者化疗都可能引起贫血,因此在20世纪80年代末,作为EPO代用品的r-EPO被发明出来。它在造福慢性贫血患者的同时,也被用于耐力型竞技中。

r-EPO与输血的效果相当,但比输血过程简单多了。输血时,必须使用输血袋,还得将长长的针头插入血管。如果使用r-EPO,只须将它们装入小小的安瓿瓶,存放在保温瓶的冰块中或酒店的便携式冰箱里,使用时注射到皮下即可。r-EPO的效果主要体现在选手们的红细胞比容(HCT)上,即红细胞在血液中所占的体积百分比,这项指标是可以直接测出的。红细胞越多,能够输送到肌肉的氧就越多。对男性来说,HCT的正常值约为45%。训练有素的耐力型运动员,HCT值可维持在50%上下;使用EPO以后,则可提升到60%以上。1996年环法自行车赛冠军比亚内·里斯(Bjarne Riis)的绰号就是“60%先生”,去年他亲口承认使用过r-EPO, HCT水平才如此之高。

兴奋剂是在20世纪90年代初侵入职业自行车赛的。格雷格·莱蒙德(Greg LeMond)认为确切的时间是1991年,他曾在1986、1989和1990年三次赢得环法大赛的冠军。此后,莱蒙德把目光瞄向五次夺冠,以期改写环法大赛历史。1991年春天,他作好了第4次折桂的准备。莱蒙德回忆说:“我当时处在最佳状态,在春季训练中的成绩是整个职业生涯中最好的,而且身边还有一支相当出色的车队。但1991年环法赛有点蹊跷,有些成绩平平的车手一反常态,甚至在比较平缓的上坡赛段中就把我甩在了后面。”

运动员的“囚徒困境” (3).png

莱蒙德最终只得了当年环法赛的第七名,他暗自发誓来年一定要干净利落地赢回来,但事与愿违。1992年,“我们(车队)的表现简直糟糕透顶,我甚至没能完成比赛”。原因很简单:他们为了赶上服用过兴奋剂的车手,已经筋疲力尽了。莱蒙德讲述了队友菲利普·卡萨多(Philippe Casado)当时告诉他的一件事。卡萨多从西班牙的昂斯车队车手劳伦特·雅拉贝尔(Laurent Jalabert)那里得知,昂斯车队为他制定了个人服药计划,其中就包括使用r-EPO。而莱蒙德自己,由于拒绝使用r-EPO,在1994年环法赛再度遭遇DNF(did not finish,即未完成比赛),从此彻底告别了这项赛事。

由于成绩的压力,有些车手铤而走险服用禁药,最终付出了惨痛的代价。卡萨多离开莱蒙德的车队后转投了一个有服药计划的车队,结果在1995年猝死,年仅30岁。他的猝死是否与服用兴奋剂有直接关系还不清楚,但如果HCT水平超过60%,血液将变得非常黏稠,很容易形成血块。睡眠期间心跳速率会放慢,这时就非常危险;而耐力项目选手安静状态下的心跳速率之低是出了名的——每分钟只有30来下。两位荷兰冠军车手在尝试注射r-EPO后,死于心脏病发作。据说,此后有些车手睡觉时会在胳膊上套上心率计以防不测:一旦心跳太慢,心率计就会发出警报。

 

上有政策,下有对策

体育运动中,药检执法者与服用禁药者间的较量,就好比自然进化中捕食动物与被捕食者之间的抗争。依我看,执法者已经比违法者落后了5年,而且这5年的差距将一直延续下去。服药的好处极大,会刺激选手想出新招去对付那些禁药政策。除非执法者也面对着同样的利益刺激,否则他们将永远在这场竞赛中处于下风。1997年,由于当时还无法检测r-EPO(此种检测手段2001年才问世),主管自行车赛事的机构——国际自行车联盟(UCI)把HCT指标上限定为50%。很快,车手们发现他们可以超过这一上限,他们采用的是当时规则允许、并频繁使用的一种方法——注射盐水进行再水化(rehydration)。因此,该项规定很快就失效了。

20世纪90年代,威利·富特(Willy Voet)曾任费斯蒂所在自行车队的助理教练,负责全面照看运动员。在2002年出版的《打断链条》(Breaking the Chain)一书中,富特大曝猛料,讲述了他与同药检执法者们过招的情景:

为提防UCI的医生在清晨前来检查车手们的HCT含量,我已把一切安排妥当,让车手能够安然过关。我带着输液用的盐水来到车手的房间……整个输液过程需要20分钟,输入的盐水稀释了血液,使HCT指标降低了三个单位,足够蒙混过去了。

UCI医生到来后将等候车手从自己的房间出来,而这套输血装置在两分钟内就能安装好,因此我们可以利用这段时间大做文章。

反兴奋剂新规则出台后,选手们又有什么新的应对招数呢?我直截了当地向现年32岁的职业自行车手乔·帕普(Joe Papp)提出了这个问题,他曾因合成睾丸素(synthetic testosterone)药检呈阳性而遭到禁赛处分。回忆起他分到“神秘黑药”的那一天,帕普解释说,他面临的已不是道德上的抉择,而是经济上的考虑:“在一个有组织使用兴奋剂的车队里,面对兴奋剂,你就只能二者择其一:要么吞下它,跟上大伙;要么扔掉它,就此断送自己的职业前程。”

帕普承认服药之后,职业自行车赛协会给了他禁赛两年的严厉处分。但他面临的社会后果比这要糟糕得多。“这项运动让我彻底陷入泥潭,”他向我大倒苦水,“车队所有队员都在服用禁药,就像一条绳上的蚂蚱,大家都保守着这个秘密。如果被抓了现行,你也必须守口如瓶。我坦白交代后,立刻被朋友们抛弃,因为他们认为我可能会出卖他们。甚至有人打电话威胁我说,如果我揭发他吃药,就把我干掉。”

不过帕普还达不到参加环法大赛的水平,在顶级车手中,博弈矩阵(以及它对车手自己的自行车赛运动生涯的影响)会不会有所不同呢?我从另外一位知情人那里获悉,情况并无不同。在20世纪90年代,弗朗基·安德勒(Frankie Andreu)在美国邮政车队中充当领骑车手(lead pacer),为队中冠军车手兰斯·阿姆斯特朗(Lance Armstrong)提供支持。“多年来我一直在协助车队领袖,从未遇到任何问题,”安德勒说,“后来,大约是1996年吧,自行车赛的速度迅速提升。这事非常蹊跷,肯定不仅仅是训练的结果。”安德勒竭尽全力地抵制诱惑,但在1999年,他再也无法坚持了,“非常明显,竞技自行车运动这个圈子中使用兴奋剂可谓泛滥成灾,我也得干点什么才行”。他开始给自己注射r-EPO,每周两到三次。“这玩意跟红牛饮料不同,红牛让你马上就来劲,”安德勒说,“但r-EPO则是让你更有劲,更持久地跟上队伍,让你的速度从48千米/小时加快到51千米/小时。”

 

兴奋剂的威力

在环法自行车赛这样一场持续整整三周的残酷角逐中,r-EPO的作用妙不可言:它不仅会在短时间内让HCT指标突升,而且会让HCT一直保持高水平。阿姆斯特朗的前队友乔纳森·沃特尔斯(Jonathan Vaughters)向我解读了相关的HCT指标:“使用血液回输技术的好处是,你可以在三周里把HCT保持在44%的水平上。”如果比赛开始时“清白”的车手HCT为44%,经过三周的艰苦较量之后,由于天然的血液稀释以及红血细胞分解等原因,HCT指标理会降到40%左右。沃特尔斯指出:“把HCT稳定在44%,就使你获得了10%的优势。”

目前,对兴奋药物的效果所做的科学研究寥寥无几,而且通常研究对象并不是运动员或那些以运动为消遣的人,但研究结果却与沃特尔斯的说法极为吻合。(由于众所周知的原因,服过禁药的顶级运动员都不愿意公布自己的数据。)接受采访的运动生理学家们一致认为,r-EPO可以将选手能力提升至少5%~10%。如果r-EPO与其他各种药物混合使用,还可以再提升5%~10%。在1%的差异即可决定胜负的比赛中,这样的优势堪称巨大无比。

意大利运动生理学家米凯莱·费拉里(Michele Ferrari)同某些药检呈阳性或被指控服用兴奋剂的顶尖选手过从甚密,因而广受争议。他对兴奋剂问题也有自己的看法:“如果红细胞的数量增加10%,车手的运动能力(即有效动能产出的净增量)就可提升大约5%。这意味着在计时赛中,以每小时50千米的速度骑行的选手每千米可获得1.5秒的优势;而在坡度为10%的爬坡路段上,以每小时10千米的速度骑行的选手每千米所用时间缩短8秒左右。”

在环法自行车赛中,这些数字意味着,一位车手若能使HCT水平增加10%,他在50千米计时赛中的成绩便可提升75秒之多,而计时赛的胜负通常只在短短几秒之间。环法大赛在亚平宁山和比利牛斯山设置了众多坡度为10%、距离为10千米的爬坡赛段,HCT差异可使车手在每个路段获得整整80秒的巨大优势。如果顶尖选手中有人使用兴奋剂,竞争对手们绝不甘心坐以待毙——博弈矩阵就会进入背叛模式。

 

纳什均衡

在博弈论中,如果任何一位局中人单方面改变策略不能使自己获得任何优势,对局就处于“纳什均衡”。“纳什均衡”的概念是由电影《美丽心灵》的原型、数学家小约翰·福布斯·纳什(John Forbes Nash, Jr.)提出的。

为了恢复纯洁的竞技环境,必须调整兴奋剂对局的设置,使竞争处于纳什均衡。这就是说,每个体育项目的主管机构都必须改变博弈矩阵中期望结果的收益值(见左页)。首先,当所有局中人都按规矩对弈时,任何一位局中人老老实实对弈所获得的收益,必须大于作弊所能获取的好处;其次,即使其他局中人作弊,任何一位局中人遵守规矩参赛所获得的收益也必须大于作弊的收益,这点也许更为重要。总之,不能让遵规守纪者吃亏。

在囚徒困境的博弈中,在另一位囚徒坦白交待的情况下,减少自己坦白交待的好处,而增加双方保持沉默的收益,将有助于促进双方的合作。让局中人在开始对局之前有机会相互通气,是增进双方合作的最有效途径。在体育竞赛中,这就意味着要打破已成为潜规则的“攻守同盟”。每个人都必须清楚,存在一个问题需要解决。药检也必不可少,结果必须定期向所有人公开,直到所有药检结果全都没有问题。这样,每位选手都会明白,不论其他选手怎么做,自己光明磊落参赛的结果总要胜过作弊带来的好处。

如何让自行车赛(以及其他体育比赛)达到纳什均衡,从而使所有人都感觉,通过兴奋剂作弊得不偿失?我提出几点建议:

■ 大赦天下,对所有运动员以前(即2008年前)的作弊行为不再追究。由于整个体育界腐败成风,多数选手一直都在使用禁药,因此取消服药者的冠军称号,让同为药罐子的亚军顶替,着实没有意义。大赦之后,退役运动员说不定还能为整顿反兴奋剂制度出力。

■ 增加接受药检的选手人数(包括赛场内外的药检,特别是一场比赛即将开始前或结束后立刻进行的药检),以揭穿任何企图骗过药检的伎俩。药检应该由与主管部门、车手、赞助商及车队均无利害关系的药物机构实施。各车队也应该聘请独立药检公司检查自己的车手,第一步是对每位车手做季前测试,以此作为他们的基线资料。各赞助商应提供额外的经费以确保药检的严格实施。

■ 可以仿照艾克斯科技大奖的形式设立一项奖金,鼓励科学家开发能够检测那些目前尚无法检出的兴奋剂的技术(艾克斯大奖专为各种技术成就提供奖金,参见《环球科学》2008年第一期第73页《SA50 年度政策领袖》)。对药检执法者的物质刺激,应该不低于偷用禁药者从作弊中可能获得的好处。

■ 加大处罚力度,一次服药便终生禁赛。为了保证选手不会因为药检结果呈假阳性或因药检人员不称职而蒙受冤枉(这两种情况都存在),必须有公正可靠的仲裁与上诉制度。不过,一旦作出决定,那就是最终裁决。

■ 如果在赛事中某车队有任何一名队员药检呈阳性,则取消车队所有队员参加此项赛事的资格。违规选手必须把已领取的全部工资和奖金退还车队赞助商。这项政策将使车队所有成员承受到“哥们义气”带来的沉重社会压力,从而有效促使他们认真落实反兴奋剂措施。

这样的计划听起来有些不切实际,但事实上是可行的。美国Slipstream/Chipotle自行车队现任总监沃特尔斯已经启动了一项定期内部药检制度。“请记住,我的车手多数是运动员而非罪犯,”他说,“如果他们相信其他人不再吃药,并且从自行车赛的速度中确实感受到这一点,他们会告别兴奋剂,从巨大的压力中解脱出来。”

希望总是存在的。不过我深信,随着这些变化的出现,人们的博弈心态将逐步从背叛模式向合作模式倾斜。如果真的这样,竞技体育将恢复它的传统——选手们在取胜的意念激励下,表现得更高、更快、更强,赢得人们最大的尊重和奖励。


全部评论

你的评论