临溪笔记

[北欧行]Day 1.比勒费尔德-哥本哈根

Day 1. 2013年2月25日

一直想去北欧看极光。今年寒假决定将此想法付诸于行动,于是提前买了张InterRail的青年票(欧洲30个国家22天内可以任选10天乘坐火车,265欧)。又由于InterRail通票不能在目前居住国使用,也就是说我不能在德国境内使用它,所以我又单买了从比勒到德国、丹麦边境Puttgarden的火车票,最后2月25号独自出发,一路向北。

25号早上6点多的火车,经传汉诺威和汉堡,中午到Puttgarden,都很顺畅。因为德国和丹麦间陆路并不通,所以要靠渡船把火车连同乘客从Puttgarden运送到丹麦境内。渡船上提供餐饮、购物、换钞等服务。那天天气还算可以,乘客也可以到甲板上观光,但冬天海风比较大,很冷。进入丹麦后仍然一路顺畅,下午两点多到达哥本哈根。

在哥本哈根住的青年旅社叫”Sleep in Heaven”,但实际上这家青年旅社一半的房间都在半地下室里。北欧城市都不大,另外我每到一个城市前都会实先用Nexus 7下载好这个城市的谷歌地图,然后到时导航就行了,所以找旅社也都很容易,步行完全没问题。

哥本哈根火车站

哥本哈根火车站

Read the rest of this entry »

#刘欢批好声音编故事#

标题是最近微博上的一个微话题。微博上的微话题大多时候都很垃圾,但有时候也有一两个好的可以让人借题发挥一下。上次有个微话题我就计划写一篇长文来着,结果给耽搁了,现在也忘了那个话题到底讨论的是啥了。所以这次吸取教训,趁着还没忘,赶紧记录一下。下面是正文:

一般人们去判断一个人或一件事物的优劣好坏,亦或是真伪,并指导自己的行为,一般有两种方法。

一种是用纯感情,这很简单。这种方法是纯主观的,你只需要去感受外界传递给你的某种信号,并将这种信号转化成相应的情感,再顺势表达出来就好了。比如那些让你感到同情的事物,你多半会认为它是真实的或者是美好的,会让你产生保护的欲望;而那些让你感到愤怒的事物,则多半会被理解为虚伪的或者是丑陋的,让你产生攻击性行为。这种方法不需要训练,它是一种本能,即使是刚出生不久或两三岁的小孩儿,虽然还不会说话,也会用面部和肢体语言来表示出这种情感。

另一种是用纯理性,这很困难。这种方法是完全客观的,需要你在感受外界信号的同时对它进行分析。这种分析基于对情感的自我抑制,需要你站在完全客观的立场上,去运用相关的科学知识和方法分析后,最后再决定你的行为。比如前不久的幼师虐童事件,这个事件自然十分恶劣,“感情派”多半会在网上骂骂咧咧一通,以示自己的立场,而“理性派”多半则会意识到这种谩骂毫无意义,他们会反思相关法律制度的欠缺,呼吁将其完善,并已预料到该教师会被无罪释放。果然最后教师被无罪释放,而这时的“感情派”也许才会去想到法律制度的问题,并对法律制度或呼吁或继续谩骂,而“理性派”则或许已经走的更远了。(关于这个事件“锵锵三人行”做过一期节目,是我认为最近看过的几期里讲得最好的一期,推荐一下。)

现在回过头来说说“中国好声音”。这节目我没有怎么关注过,只是在网上浏览了几个别人分享的视频片段,以备话资。像这种选秀节目,比如唱歌的,一个像我一样的业余人士很难评判到底谁唱的更好,一个最公正的方法应该是找专业人士们来打分评判,对歌手们的唱功进行综合考量,最后结果也仅取决于这些专业评委。事实上类似的节目以前在某TV台办过,叫什么“XX歌手大赛”,但感觉收视率并不高(至少不像这次“中国好声音”这么火爆),我想其中一个原因就是因为这个节目太过理性,活生生把一个唱歌比赛办成了乐理科普大讲堂。不是说这样不好,只能说它没有迎合广大观众的口味。一个节目办出来,关键要有收视率才行啊,所以之后的各种选秀节目,比如“超女”,就加入了观众的评分因素(事实上也是效仿西方),才使得观众都有兴趣加入进来,而这时就出现了我刚才说的那个问题,大部分观众都是乐盲啊,很多人也许同时觉得三四个歌手唱的都不错,那么到底把这票投给谁呢?一种方法就是对观众进行科普,告诉他们A歌手唱的某首歌的哪句用了什么什么比较NB的技巧,而B歌手的声线又是多么多么的难得,比如音域啊音色啊什么的(我也不懂啊,乱说的,专业人士轻拍= =),但事实上科普了也很少有人能懂,或者适得其反让人觉得这很装B。所以如果站在观众的立场上来看的话,观众们在为歌手投票时不太可能成为“理性派”,所以参赛者只能当他们是“感情派”,通过制造一些对自己有利的(比如令人感动的)故事而为自己投票。由此,可以解释为什么“好声音”要编故事了,可以说这是一种博弈策略。但这种策略与“好声音”的初衷自然相违背,这时有专业出身的评委站出来对此进行批评也是可以理解的了。最近两期的锵锵三人行刘欢都在谈论这个事情,我没看,但基本能猜到谈论的内容是什么,如果有人有兴趣可以去看一下。不管外界对刘欢的评判如何,单从这件事上来看,我在刘欢身上还是看到了一点儿理想主义的影子,觉得他在音乐领域应该是个好老师。

之前说到“好声音”编故事是一种策略,但从另一个角度来说,这也是对大众情感的一种消费。我在之前的一篇文章《墨家思想与纳什均衡》里曾经指责过媒体在一些社会矛盾、法律制度等问题上对大众情感的消费以换取其点击量,但我觉得“好声音”这样的娱乐节目对大众的情感进行消费则无可厚非。就像读小说一样,我们不要把它当做真实而专业的内容来对待(事实上组织方也许压根儿就没有想到选出什么真正的“中国好声音”),也许就像弗洛伊德所说的,有时候,我们需要宣泄自己的情感,而“好声音”正是提供了这样一个宣泄的渠道,在这种情况下,观众甚至乐于被消费,而且和组织方可以达成一种共赢(对“好声音”如此,对诸如“非诚勿扰”一类的节目亦如此)。这时对那些“理性派”而言,也许真的是“认真你就输了”。

所以“感情派”和“理性派”是可以互相转化的,二者也无优劣之分,只是需要注意这两种方法的各自运用场合。在一些大是大非或容易引起矛盾、误解的事情上,还是需要多一些理性思考的,抑制情感、谨言慎行。前不久瑞典出了件事儿[1],某动物保险公司做了个广告,其中有猫从高空跳伞下落的镜头,但只要是稍有智商的人都能判断出这视频是特效合成的,但有爱猫人士看了以后就大呼“卧槽!你们丫居然让猫做这么危险的动作!这TM是虐待动物!我TM要告你们!”然后该公司受到无数攻击。最后CNN特意做了一期节目才得以澄清此事。在这里,过激的感情就导致了过激的非理性行为。

最后想再结合《乌合之众》说说。《乌合之众》里说群体的智商低于群体中的个人,这也许也能从“感情派”和“理性派”上阐述。当个人独处的时候,TA与其他人缺乏沟通渠道,这时他会慢慢发现自己的情感宣泄毫无用处(没有人注意也不会有人能体会),也许TA初时会是“感情派”,但当发现这种方法于事无补的时候,会慢慢转变成“理性派”;而当很多陌生人(“乌合之众”)在一起的时候,与他人融洽共处才是最佳选择,这时最好先成为“感情派”,比如为他人所陈述的一些悲伤故事表达一下同情,以示友好,而不是教育道“你在这儿说这个有什么用,还不如/你应该……”,也许还没等你话说完人家就跑掉了。于是群体中的每个人最后都将成为“感情派”,达成一种“均衡”,智商自然也会因此被拉低,而如果此时突然跳出个“理性派”,此“理性派”通常会被群体所孤立。

所以本人虽然可以算是个“理性派”,但在这个感情至上的世界里,还是感觉有点儿无奈啊~

[1]Caturday felid: synchronized skydiving cats(内含youtube视频,国内访客可能需翻墙)

青霉素、爱因斯坦的手书与沟酸浆属植物

我不喜欢宗教,但我又无意于卷入任何有关科学与宗教的争论之中,因为在我的朋友们里有教徒。我不希望我对宗教的任何攻击性言论使他们受伤,也更不希望把这些言论憋在心里使自己内伤,所以各位最好不要主动跟我讨论任何有关宗教的话题。但在德国这个连政党都以宗教命名的国家里,不接触到有关宗教的话题也真是件难办的事儿。

上周末在明斯特,一个中国的神学博士就跟我聊起基督教和科学的话题来。他的言论和观点我基本上是全部不同意,但碍于他是我朋友的朋友,而且我相信他是出于好意,所以我当时没有反驳什么,但是我现在还是想抽出一点儿时间,把我暂时的一些可能不成熟的想法和观点写出来,与大家探讨。

1.基督教“有爱”而科学“无爱”?

有人只盯着一战、二战和现代社会中的“大规模杀伤性武器”看,却不见中世纪十字军对所谓“异教徒的国家”长达200年的屠戮和对“异教徒”的血腥镇压。这样的宗教战争,就像《格列佛游记》中的两个小人国之间发生的战争,其原由仅仅是为了争论剥鸡蛋是应该从大头剥起还是从小头剥起,是何等的荒谬。如果不是那场死亡率高达30%的鼠疫间接促成了文艺复兴与宗教改革,黑暗还将继续持续下去。宗教战争一次次把人类文明推向崩溃边缘,而真正挽救和推动人类文明进步的只有科学。农业革命和两次工业革命后,宗教式微,也正体现出了科学比宗教更能积极地推动人类文明的进步。有人说今天的基督教在精神层面已经完全被净化,但在我眼里只不过是一只被打断腿的狼在摇尾乞怜罢了。再说说科学这个“杀人工具”。还是那句老话,任何事物都有它的两面性,关键要看使用他的人是谁。就算基督教100%是向善的,但是各位忘了太平天国是怎么一回事儿了吗?科学技术也是一样。另外伴随着一战二战而发展的不仅仅是坦克等军工业产品,还有青霉素等医药卫生制品。基督徒们生病难道不吃药吗?在精神层面,如果没有宗教,我相信真正有科学素养的人一样可以对自我进行道德约束,而不借助于任何“上帝”的名义。而后者又往往让我想到封建迷信。关于这个话题的展开我记得道金斯曾经做过一个访谈,现在暂时找不到,找到后补上。

2.爱因斯坦信教?

神学博士还举了孟德尔和爱因斯坦两个例子来试图说明伟大的科学家往往也是教徒。关于孟德尔,我推荐北大生命科学学院院长饶毅写的这篇科普文《孟德尔:孤独的天才》(),里面说的很明白:

(孟德尔)坦陈入修道院不是为了宗教信仰,而是经济原因。这一重要的人生选择中他权衡的不是神圣与世俗,而是智力追求与成家育子的权利。为了头脑,他舍弃了生殖权。对于血气方刚的青年,并非容易,而需要很大的决心。孟德尔的决定也和中国传统的一种说法(也是当代相当一部分华人的想法)不同:这些人读书是为了颜如玉,而孟德尔为了智力追求放弃颜如玉。

与此类似的是达尔文就读过剑桥大学基督学院就能说明他是个基督徒吗?

关于爱因斯坦,很巧的是,上星期刚刚有一份爱因斯坦写给朋友的手书原件在eBay上以三百万零一百美元的高价被拍卖出[1],而这封信的主要内容就是对宗教的批判。爱因斯坦本人也并不信仰任何神,对于他而言,真正的“神”是宇宙或者物理学定律。(信的原件大图请点击这里。)

3.物种形成过程不可见?

神学博士还跟我聊起了“微进化”。碰巧几个星期前我也刚被两个传教士拦在宿舍楼外,塞给我这个也算是半个生命科学专业出身的人一本叫《生命来自创造吗》的小册子,居然还是中文版。我还真认真地“拜读”完了,可惜没看到任何来自智设论的新颖的观点,还是那一坨,自然也包括对微进化和物种形成的质疑。而我看到的一篇论文[2]却又实实在在地再一次给出了有力的还击——我们真的可以在自然条件下,观察到物种形成的整个过程。

植物进化有一种方式叫做“异源多倍体进化”(allopolyploid evolution),主要指的是在植物配子的形成过程中因为差错而导致的新个体的染色体数加倍现象,这样的个体是无法进行有性生殖的,但它本身却可以进行无性生殖,因此将有可能由此诞生出一个新物种。19世纪英国引入两种沟酸浆属植物(Mimulus),一种是M. guttatus,另一种是M. luteus.前者有14对染色体,而后者呈现出染色体加倍的情况——有30对或31对染色体。二者可以杂交,但产生的三倍体是不育的。通过相关的诊断数据显示,最近新发现并命名的M. peregrinus就衍生于M. guttatusM. luteus杂交出的三倍体(这一进化事件发生于过去140年内)。M. peregrinus是6倍体,共有92条染色体,可形成具有46条染色体的配子,因而是可育的。具体数据和图像请见原论文

[1]Einstein’s anti-God letter goes for $3 mil+

[2]Mimulus peregrinus (Phrymaceae): A new British allopolyploid species

[笔记]睡美人问题

在维基上看到的一个问题:睡美人问题(Sleeping Beauty problem).对其中涉及的两个概念Self-Sampling AssumptionSelf-Indication Assumption还不甚明晰,在此先做个笔记,希望有机会能和大家一起讨论。

一个睡美人问题的简单描述是:

睡美人在周日晚上睡去后,一个硬币将被投掷。如果硬币正面朝上,那么睡美人将在周一醒来并接受采访,然后晚上再次睡去,不再醒来,结束。如果硬币反面朝上,那么睡美人将在周一醒来并接受采访,在当天晚上睡眠前吃失忆药,然后在周二再次醒来并接受采访,最后在周二晚上睡去后不再醒来,结束。问题是:在某一个睡美人醒着的时刻(不知道是周一还是周二),硬币正面朝上的概率是多少?

The Sleeping Beauty problem(图像来源:lesswrong.com)

这里就是针对这个问题的两种不同观点:

第一种观点被称之为The Self-Indication Assumption(不知道国内如何翻译,“自我指示假设”?),简称SIA.它的定义是:

All other things equal, an observer should reason as if they are randomly selected from the set of all possible observers.

根据定义,那么这里一共有三种等概率的可能:

P(Monday|Heads) = P(Monday|Tails) = P(Tuesday|Tails) = 1/3

换言之,硬币朝上的概率是1/3.

第二种观点被称之为The Self-Sampling Assumption(“自我取样假设”?),简称SSA.它的定义是:

All other things equal, an observer should reason as if they are randomly selected from the set of all actually existent observers (past, present and future) in their reference class.

(就是这里有点儿搞不懂了!)我的理解是,与上述第一种观点中“三种可能出现的情况”相对,事实上只会出现两种情况,一是硬币正面朝上,二是硬币反面朝上,因此,各自的概率是1/2,即硬币正面朝上的概率是1/2.

不知道看到这篇日志的朋友有什么想法。。

网上看到的一个讨论帖,mark一下

http://stats.stackexchange.com/questions/23779/most-interesting-statistical-paradoxes

[蜘蛛篇]蜘蛛为什么有八条腿?

在自然界中,我们能观察到的大部分“虫子”,无论是天上飘的、地上蹦的还是水里窜的,都是六条腿,它们基本上都能归属于六足亚门。从机械结构稳定性,或者说一个机器人专家的角度来看,六条腿也确实是完美之选(比如不久前刚刚开始火星探索之旅的“好奇号”)。但是不属于昆虫纲也不属于六足亚门的蜘蛛为什么是八条腿呢?

虚拟模型:好奇号(curiosity)火星探测器登陆(图像来源:space.com

这个问题看起来似乎有些蛋疼,但还是有科学家对它进行了认真的研究。2011年6月2号,美国国家地理网站发表了一篇名为《蜘蛛演化出了多余的腿》(Spiders Evolved Spare Legs 的文章(在我的iFrei.cn这个域名还在使用的时候,曾经对这篇文章进行过全文翻译)。我并不喜欢这篇文章的标题,因为它暗示了早已被摒弃的拉马克学说的正确性。事实上,生物不可能自主选择自己的演化方向,换句话说,生物不可能为了某种“多余性”而演化。也许我们确实能看到某些生物身上存在一些多余的器官,比如我们人类的智齿、阑尾等,但它们都是自然选择的结果,并非我们人类自身愿望的结果。从逻辑上来说,这种多余性体现的是一种从有到无的演化过程,而并非从无到有。或者可以这样定义生物学意义上的“多余性”:如果一种组织或器官出现在生物个体上,并使该个体的适应度降低,那么就可以说这个组织或器官相对于该种生物是多余的。蜘蛛的演化史约为4亿年,目前已知的最古老的蜘蛛化石被保存在一块距今已有1.4亿年的琥珀之中。与现存的蜘蛛一样,它也有八条腿。如此看来,“蜘蛛演化出了多余的腿”这个结论是不成立的。

需要注意的是,这个结论是这篇文章给出的,并非由原论文作者给出。另外这篇文章中除了标题,其实并没有谈到任何关于演化论的观点。前一阵我又想到这个问题,特意又去查了原论文。原论文标题为《腿的丧失:这对于圆蛛而言是否是一种障碍?》(Loss of legs: is it or not a handicap for an orb-weaving spider?),发表在2011年11月7日的《自然科学》(Naturwissenschaften)杂志上,作者为斯特拉斯堡大学的Alain Pasquet, Mylène Anotaux和南锡大学的Raymond Leborgne.因为下载不到这篇论文,我只能从摘要中对这篇论文有个大概的了解。研究者的研究对象是一种叫做丽楚蛛(Zygiella x-notata)的圆蛛。在野生环境下,根据种类的不同,成年蜘蛛的失腿率大致在5%到40%之间,而成年雌性丽楚蛛的失腿率在9.5%到13%之间,其中48%都是只缺失一条腿。在实验室条件下,研究者对比了缺腿蜘蛛和完整蜘蛛的捕食效率、产卵量和寿命,结果显示无任何差别。

雌性丽楚蛛(Zygiella x-notata)(图像来源:eurospiders.com

Read the rest of this entry »

[蜘蛛篇]捕风者

这是一个很老的冷笑话了:说有个科学家逮了几只蜘蛛,把它们都放到桌子上,然后冲它们大吼,结果蜘蛛……当然都跑了。还没完,这个科学家随后又把这些蜘蛛都逮回来,把它们的腿都切掉,再冲它们大吼,这次没有一只蜘蛛逃跑了……于是科学家得出这样的结论:蜘蛛的耳朵是长在腿上的!这个笑话的笑点当然是在“科学家”的这个荒谬的研究方法上,但如果究其结论——“蜘蛛的耳朵长在腿上”,倒也不能算全错。虽然没有我们生物学定义上的耳朵,但蜘蛛确实是是靠腿来“听”的。

靠腿怎么听?先别急,在回答这个问题之前让我们先来考虑一下哺乳动物——比如我们人类,是如何听到声音的吧。在我们人类的耳朵中,有一组重要的小零件,它们被统称为“毛细胞”(Hair cell).这些毛细胞位于内耳耳蜗的薄基膜上,在柯蒂氏器(Organ of Corti)的内部。根据解剖学和功能上的分类,这些毛细胞又可细分为“外毛细胞”和“内毛细胞”,而每个毛细胞上都生长出很多硬纤毛(Stereocilia)。

柯蒂氏器的解剖结构(图像来源:wikipedia

因为在实验上存在困难,科学家们对毛细胞的具体功能机制还不甚明晰。根据以往的研究,简单来说,外毛细胞起到放大声音信号的作用,而内毛细胞起到将声音震动转成电信号并通过听觉神经传递到脑干和听觉皮层的作用。单侧内毛细胞总数约3500个,外毛细胞约9000到12000个。毛细胞凋亡后不能再生,如果毛细胞损伤过于严重,将降低听觉敏感度,比如引发感觉神经性耳聋。不过根据近09年的一篇报道,英国科学家已成功在实验室内用干细胞培育出了内毛细胞,为耳聋患者恢复听力带来了希望。

说了这么多,看起来好像和蜘蛛没啥关系,但事实上——解决蜘蛛听觉之谜的钥匙也就在这些“毛细胞”上,只不过蜘蛛的“毛细胞”都长在了腿上而已,使得蜘蛛本身好像变成一个“耳朵”。这些毛又被形象地称为“听毛”(Trichobothria).利用听毛,蜘蛛通过解析声音引起的空气流动,来判断声音的来源。

蜘蛛的听毛(图像来源:http://ednieuw.home.xs4all.nl

2011年年底,几位物理学家对蜘蛛的听毛做了进一步的研究。他们发现如果外界的声频发生改变,蜘蛛听毛的摆动速率也会随之改变,进而发现蜘蛛的听力范围为40Hz到600Hz(人类的听力范围为20Hz到2000Hz).相关实验的视频请点击这里(Youtube).

谈到了蜘蛛的“捕风技”,最后稍微谈谈蜘蛛的“捉影技”——视觉。也许蜘蛛能算得上个“捕风”的高手,但至于“捉影技”——根据蜘蛛具体分类的不同,也是千差万别。蜘蛛家族里视力最好的当属跳蛛(蝇虎科),它们的视力近乎于人类,且有研究表明它们有分辨颜色的能力。再其次是狼蛛和猞猁蛛(lynx spiders).视力最不好的是洞穴蜘蛛,它们几乎没有视觉,捕食只能依靠听觉和触觉。

演化的时间复杂度与黄鼠狼程式

“突变率很低,地球年龄又很短,要想演化出人类这样具有高度文明的智慧生物是完全不可能的。”——这是智设论者用以攻击演化论的常见论点。2010年,美国宾夕法尼亚大学的数学家Herbert Wilf和遗传学家Warren J. Ewens则用数学方法对这种观点予以有力还击,他们给出的答案是:There’s Plenty of Time for Evolution[1].

可以把基因组的演化想象成一个密码破解的过程。我们对这个密码几乎一无所知,但知道它的长度为L,其中的每个字符都来源于一个有K个字符的字母表。按照智设论者的观点,这个密码是这样来进行暴力破解的:用字母表中的字符随机生成一串长度为L的密码,与正确的密码相比对,如果不正确,那么再重新生成(不记忆已比对过的字符串),再比对,直到与正确的密码相一致为止。这个破解算法的时间复杂度为指数级的O(K^L),也就是说平均要K^L次才能破解出正确的密码。这是什么概念呢?让我们想象一个拥有20000个可突变基因位点的基因组,即L为20000,另外在基因组水平上,根据生物学统计信息,这里的K值可近似取40(具体怎么算出来的见文末注解[2]),那么要想正确演化出这样的基因组平均需要10^34040代,即使按每年可繁衍、演化100代计算,也需要10^34038年,而生命的演化史也只有3*10^9年而已。。

智设论者的想法肯定是错误的,那么到底是哪里出了问题呢?很简单,就是他们忽略了演化的一个关键因素:自然选择。基因突变是演化的原料,自然选择则是演化的动力。修改一下上文的模型,可以设定这样一个“间谍”,在你每次进行破解之后,这个“间谍”会告诉你哪些位置猜对了,这些猜对的位置便不用再猜,只用继续再猜那些没猜对的即可,这个“间谍”即相当于起到了“自然选择”的作用。这也是符合遗传学规律的,那些适应性强的基因(比如与表达眼睛相关的)一旦固定就很难消失,不会因为其它基因(比如与表达肝脏相关的)未能演化出来而被淘汰。根据这个模型,Herbert Wilf计算出的演化时间复杂度为O(K*logL),并给出了用于描述平均需要演化多少次的公式:

这里的β(L)是一个关于logL的周期函数。(具体论证过程请参考原论文。)

现在用这个公式再计算下上文中所述的那个例子,代入K=40,L=20000,结果约为390,只需要390代即可。

当然,这只是一个非常简化的关于演化的数学模型,生命的演化过程远比我们想象的要复杂得多。事实上,在1986年,道金斯也曾提出过一个“黄鼠狼程式”(Weasel program)来回击演化中类似的常见误解[3],但未能给出数学上的解释和证明。其灵感来源于“无限猴子定理”。

Read the rest of this entry »

在50亿年后太阳变成红巨星之前能精确比对多少分子序列?

最近在构思一篇关于“计算人类末日”的文章,搜集了一些相关的资料,突然联想到了标题中的这道曾经的作业题,遂随手写下此文。。

(作者不是标题党,不过标题中的这个问题我还是要放到本文的最后再来回答。)

当分子生物学中唯一的法则“中心法则”饱受系统生物学家的攻击和批评[1]的同时,由基因组学发展出来的另一个“中心法则”——序列决定结构,结构决定功能——则显得更加无懈可击。而生物信息学也正是基于这一新的法则来分析海量的生物学数据的。由此,序列分析也成为了这一新学科的基础。这里的“序列”主要指的是生物大分子中的DNA、RNA和蛋白质。

序列分析中的主要工作之一是序列比对。通过检验不同序列间的相似性程度,可以对它们之间的同源性和进化关系进行判断。我们现在看到的那些进化树,虽然在一些细枝末节上还存在很大争议,但它们大多都是通过这种分子水平上的序列比对而构建起来的,比以往的博物学家们只能在形态学和解剖学上进行比较要精确得多了。

通过测序,我们可以把这些线性的生物大分子变成由特定字符集组成的字符串,存储到熟悉它们的计算机中。如DNA的字符集是{A,T,C,G},RNA是{A,U,C,G},蛋白质则是那20种基本氨基酸的单字母缩写。在计算机中用处理字符串的方法来分析这些序列,比用纯生物学的方法要方便、快捷、准确多了。

那么到底要如何比对这些序列呢?这里就不得不要提到一个算法——动态规划(Dynamic Programming).讲解“动态规划”的中文维基页面上用斐波那契数列的例子来解释这个算法是如何工作的。如果没有理解,也没有关系,因为心理学告诉我们,只要能把抽象的问题具体化,其实也没有什么是难理解的。所以这里让我们来考虑一下下面这个更加现实的问题。

假设你要去一个陌生的大城市旅游,但坏消息是你只有不到一天的时间,肯定不能把城市里所有的景点游览完。同时还有个好消息:你有这个城市的地图,可以提前规划路线。作为限定条件,在这个城市里游览的时候,你只能向东或向南前进,不能走回头路。那么你要如何选择路线才能尽可能多地浏览景点呢?这个问题也就是经典的“曼哈顿游客问题”(Manhattan tourist problem).

“曼哈顿游客问题”中的地图。(在这里我们可以忽略那条斜街。)图像来源: An introduction to bioinformatics algorithms

Read the rest of this entry »

圆为什么有360度?

从太阳、满月,到向日葵的花盘、水面的涟漪,自然界中的圆无处不在。“圆,一中同长也”(《墨经》),两千多年前的墨子是世界上第一个给出圆定义的人。圆形的轮子是人类历史上最重要的发明之一。由其衍生出来的齿轮在工业革命中起到了无法替代的作用。圆与我们的生活息息相关。但是,你真的了解圆吗?

圆为什么有360

大家都知道圆有360度,但是你知道为什么要这样划分吗?为什么不是300度、400度,而一定是360度呢?别急,这事儿要从公元前说起……

在古文明时期,人类把很多不能解释的自然现象归结为“天意”。 从对“天意”的判断与预知发展出了占星术,也促进了早期天文学的发展。经过长期肉眼的天文观测,古人终于有了一个重大发现——各星象的运动轨迹是一个圆!(……)它们在夜空中的位置每天都会比前一天稍移一些,直到一个周期——也就是一年后,又会恢复原位。现在你有没有发现,一年有365天与一个圆有360度之间的微妙关系?

其中一种理论认为,古巴比伦人继承了同为美索不达米亚平原上公元前三世纪苏美尔人的六十进制计数方法,将一年划分为360天(12个月,每月30天),因此根据上所述原因,一个圆也可以被划分为360等份,每一份即为“一度”。在巴比伦帝国被波斯人消灭300多年后,希腊天文学家阿里斯塔克斯和喜帕恰斯重新系统归纳总结了巴比伦人在天文学上的成就,“星座”和“天球”的概念首次出现,六十进制被继续发扬光大,天象划分基础被确立,“一个圆有360度”的说法也开始成为科学标准渐渐得到人们的肯定。

图1  未来一年在北京观测大熊星座运行轨迹(绿色显示为大熊星座)

Read the rest of this entry »

墨家思想与纳什均衡

()

很久没写日志,随便写写。

中国历史上曾经有过辉煌的百家争鸣时代,而当今国内的各种社会问题却被归因于国民的信仰缺失,这不得不说是一种讽刺。也许有人要说,即使没有掺杂政治的因素在里面,这些落伍的思想放至今日也是腐朽而毫无意义、早晚要被淘汰的,果真如此么?我看未必。不妨大胆假设一下,如果把诸子百家的核心思想拿到今天,哪个更有现实意义呢?

去年是令人心寒的一年。七月的动车事故与十月的药家鑫案,政府官员的冷漠与网络暴民的冷血,似乎仇恨才是推动社会进步的动力。于是我们看到小悦悦两次被车碾过,18位路人路过而不救。面对如此无爱的社会,我脑海中却闪过两个字:兼爱。

兼爱是墨家十点思想中最为核心的一点,意为不分社会等级、无差别的博爱。墨家创始人墨子(墨翟)出身工匠,同时也是位科学家,在力学、几何学、代数学、光学等方面都有重大贡献。蔡元培曾评价说先秦唯墨子颇治科学。建立在严密数理逻辑之上的墨家思想是诸子百家中最为理性的(我之前曾写过一篇词胜理胜)。我一向对理性的人或事物颇具好感,在读了很多关于墨家的评注文章之后,也深信着看似理想化的墨家思想在今天也一定有着其现实而积极的意义。但是想让人信服,却又似乎少了些什么。

直到今年2月份接触到博弈论。接触博弈论绝非偶然。因为专业内容涉及进化论,而进化论的主流核心观点就是物竞天择,用来描述物种间竞争策略的最好的数学模型则非博弈论莫属。在学习过程中参考了耶鲁大学的《博弈论》公开课课程。在一节讲解纳什均衡的课堂上,老师和200多位学生做了这样一个博弈:现在有一个项目需要大家投资。每个人有两个选择:A投资10美元,B不投资。如果最后有90%以上的同学选择了投资,那么投了资的同学每人都有5美元的净利润进账,否则大家的回报都是0.规则很简单。老师让大家自己抉择,把选择写在本子上,禁止互相讨论。之后举手显示选A和选B的人几乎各占50%.紧接着又做了第二次博弈,规则一样,结果选A的人降至了20%左右。再做第三次的时候,表示还投资的人只剩下了一个。

嗯?好像有什么不对。明明是都投资就都能挣钱、只赚不赔的买卖,到最后怎么都变得如此保守?表面的答案是这里面存在两个纳什均衡,一个较优的,都投资,极大欢喜;一个较劣的,都不投资,不赔不赚。(当然这其中还有更深层的原因,不过我想放到下一篇文章中再说。)事实上这个例子我跟我的好几个朋友都说过。当我第一次讲的时候,还没有把它和兼爱联系起来,直到某一次才注意到《墨子》中的这段话:既以非之,何以易之?子墨子言曰:以兼相爱交相利之法易之。’”(语出《墨子·兼爱中》。既已认为不相爱不对,那用什么去改变它呢?墨子说道:用人们全都相爱、交互得利的方法去改变它。

兼相爱、交相利,互爱互利,这不就是一种较优的纳什均衡么?爱是策略,而利才是实质。兼爱是为了更好的交利。而博弈论研究的正是如何使自己采用的策略能得到最大化的,是建立在之上的。自私性(不涉及道德评判、不含贬义)是每个有机体的自我属性(关于这方面最好的著作就是道金斯的那本《自私的基因》),而自私的一种体现就是使自己最大化获利(在生物学上的体现就是个体的繁殖、基因的传递)。墨子并没有回避,而是利用它使人们相爱,达到天下兼相爱则治的终极目的(在上述那个博弈论例子中就是大家都投资都赚钱)。
Read the rest of this entry »