一转眼 2021 年已经过去了一大半,回看上一篇书单里说大家跃跃欲试要复工旅游,到现在似乎差不多都已经实现了,虽然从全球范围来看疫情起起落落一直还没有实质性的好转,即使像在美国这样疫苗充足的地方每日新增也还是居高不下,但是似乎旅游业早已开始蓬勃复苏。不过我还是很怂地继续坚持“居家令”,在保证安全的前提下尽量提升生活质量。

阅读方面,继续上次的《An Anthropologist On Mars》等,这次也重点介绍几本关于我们人类自身的书。

Emperor of All Maladies: A Biography of Cancer》,作者 Siddhartha Mukherjee 是一名内科医生、生物学家和肿瘤学家,当然他还是一位知名作家,曾获得 2011 年普利策奖等各种奖项,而本书也是他的代表作。

简而言之这是一部人类与癌症抗争的史诗,惊心动魄,有些地方比小说还要精彩。客观来讲,直到二三十年前人们对癌症的生物机制都还并不了解,所以早期的许多努力都只有零星的效果,但也许人类自身主观因素造成的障碍反而是癌症的治疗和预防的战役中更加难以逾越的鸿沟。例如烟草行业为了利益而打压吸烟与癌症的联系相关的研究和报道这场旷日持久的战争,虽然看起来好像落下了帷幕但是其实只是将战场转移到了发展中国家而已。又比如激进的外科手术师或者化疗师为了自己的名誉大力推行不必要的超高强度治疗方式也是伤害了一代人。

这是一本很厚的书,除了强力推荐之外我这里并没有太多其他可以说的,好在本书读起来也非常舒服,对人物背景的阐述拿捏得当,不像某些科普书说是讲科学发展但其实全是讲科学家的各种八卦故事。历史长河中一个个人名来了又去,只剩下人类与癌症永恒的战场,现在我们更加了解了癌症的机制,才发现癌症本身就源自我们自己的一些非常基础的生物机能的基因变异,生与死犹如双生。当下的技术离对所有癌症都能治愈的时代似乎还很遥远,而且总让人不禁会问,癌症完全消失的时候,人类是否还会继续存在呢?

The Brain from Inside Out》,作者 György Buzsáki 是纽约大学医学院神经科学教授。

本书介绍了研究神经科学和脑科学的 Inside-out 方法。传统的 Outside-in 方法将大脑看成一个被动的“接收”和“表示 (represent)”外部的信息的机器,去研究大脑对不同的感官输入的编码和计算过程,同时也会去研究我们所熟知的外部“客观存在”的实体或者概念(例如时间、空间、记忆、数字等)在大脑内部的表达和编码方式。作者认为更合适的研究方式是反过来,因为这些“客观存在”的东西其实对于大脑来说并不存在或者具有任何意义,例如考虑大脑内的神经元如何对眼睛看到的一只猫进行表达,这个问题的提出者站在“第三人称”的观察者视角,观察者知道客观存在的“猫”的概念,然后试图去测量大脑在接受到视网膜传来的信号的时候的计算结果,由此来得到大脑对“猫”的视觉信号的神经表示。但是问题在于从第一人称的大脑本身的角度来说,如果它唯一的输入只有神经元传来的信号,那么它只会拿到一堆奇怪的神经信号,但不会有任何“猫”的实体的概念,也谈不上要去计算这个实体的“表示 (representation)”。

解决这个问题的方法是反过来从大脑自己的角度思考问题,大脑其实并不关心去对任何“客观存在”的东西做表达,或者说所谓的“客观存在”对大脑来说本身就不太有意义,例如像《黑客帝国》那样把所有大脑和外部通讯的感官都拦截了的情况,大脑并不能把它和“真实”区分开来。但是从一个生物器官的角度来说,大脑的存在目的就是要让宿主(或者宿主整个种族)能够最大概率地存活,为此,大脑需要对各种肌肉、器官之类的发出合适的指令同环境进行交互,所以大脑在视觉、听觉等不同的感官接受到信息的时候会互相 correlate 建立联系,更重要的是大脑会调动身体做出行为,看如何能和当前的这个环境进行交互,通过这样的交互 (所谓的“grounding”的过程) 大脑才真正建立起对外部世界“客观存在”的东西的认知。所以黑客帝国里的 Matrix 不止要拦截我们的感官,还要拦截我们的运动神经,并 simulate 它对环境造成的影响并将反馈再传回给我们的感官,才能让我们不会发现自己身处虚幻世界中。

换句话说不应该把大脑看成被动的对周围的事物进行表达、计算并作出反应的机器,而是更主动的类似于不停地在做 hypothesis testing 的一个实体。作者举出了一些比较有意思的例子,证明我们对外部世界的“感知”并不是一个“客观”的反应,而是随着我们自己大脑的状态变化而变化的。例如大声吼一下可能会让别人耳鸣或者几秒钟内听不见,但是这个客观的高分贝声音(通过颅内传播可能会声音更大)并不会让我们自己震耳欲聋,因为大脑通过 Corollary discharge 的机制告知感官自己要搞事情了。在视觉感官方面还有更多奇怪的例子,以至于有一种观点认为 Action is a prerequisite of perception – there is no perception without action。比较著名的例子有 Troxler’s fadingRetina stabilization。当然这讨论的是未初始化的大脑的情况,在大脑有一些基本的 grounding 之后,不同感官接收到的信号可以直接同记忆里存储的 experience 进行对比,而且许多实验证明即使在没有接收外部信号的时候大脑自己也会进行信号重放(例如睡觉的时候)。

来自 Wikipedia 的 Troxler’s fading 的例子,盯住中间的十字看,几秒钟之后图中的颜色就会消失变成灰色背景。

总之作者花了一些章节从不同的方面去为这个中心观点提供佐证,此外还介绍了大脑里的一些机制(例如 Brain Rhythm 和 Cell Assembly 等)可以帮助实现大脑的 Inside-out 的运作机制。不过后面的一些章我看得有点晕,一方面可能神经科学的一些背景知识还不太了解,另一方面感觉这方面的研究还很多都只是比较 high level 的概念讨论,我以 Computer Science 的思维来看就会觉得在没有实际的 working system 的情况下仅仅用一些比较模糊的概念去讨论一个系统,感觉天马行空各种角度都总能说得通的,比较难验证哪一方的观点才是正确的。但反过来确实神经科学本身也还处于发展早期,像理解大脑的运作机制这种大课题也不是一下子就能搞清楚的,许多概念上容易的实验由于仪器和手段的限制在现阶段也都还无法完成,作者写这本书的目的也是让大家注意到 Inside-out 这样一个方向,从这个视角去推进相关的研究吧。

此外作者对于所谓 Outside-in 的方式的批判感觉好像有点过,不至于观念不和就把对方归到和颅相学 (Phrenology) 这种伪科学差不多的范畴去。以及由脑内的 Weber–Fechner law 和 log scale 讲到苏联共产主义、印度种姓制度和古希腊民主啥的好像跑题有点太远了……

Creating language - Integrating Evolution, Acquisition, and Processing》,作者 Morten H. ChristiansenNick Chater 分别是康奈尔大学的认知科学教授和华威商学院 (Warwick Business School) 的行为学教授。

这是一本关于人类语言的书。和之前语言学里主流的 (generative grammar) 将语言的进化 (Evolution)、学习 (Acquisition) 和处理 (Processing) 这几个方面分开来研究不同,本书的观点是这几个方面是紧密相关的,其实是同一机制在不同的时间尺度下的表现,应该放到一个统一的框架下,并研究它们之间的相互影响和关系。并从这个视角出发,提出了一些新的研究观点,其中很多观点和之前看的介绍乔姆斯基学派的内容完(例如去年冬至书单中介绍过的 Steven Pinker 的《The Language Instinct》)全对立,还蛮有意思的。

关于人类语言的议题无可避免地要讨论 “why only us”。乔姆斯基学派的答案是 Universal Grammar (UG) ——人类进化出来的一种蕴含了抽象的语言学本征限制的生理天赋。本书第二章集中辩驳了这个观点,简而言之就是这样的进化在生物学上是不可能的,首先生物学上的适应通常针对当前的环境,而不会刻意为其他可能出现的情况提前做泛化的准备。例如人眼对于在”正常“环境中的光学原理高度适应,但是水的折射会导致人眼错误估计水下的木棍的长度;反过来,例如一种在水下吐水捕食飞虫的 archerfish 就有自动光学矫正的能力。所以,如果真的有一个内在的 UG 去 adapt 了过去的语言环境,那么这种 adaptation 肯定也是”整体“的,包括例如具体的单词顺序,phonotactic 的规则等等,而不太会只针对语言中最抽象的,对于所有不同人类语言都共通的特征进行适应,这和 UG 的定义非常矛盾。

其次进化需要一个相对固定不变的目标(大自然环境),而语言放到生物进化的时间尺度上显然不是一个稳定的目标。并且,人脑进化去适应语言的压力远远小于语言进化来适应人脑的压力,因为人类即使无法使用语言,也还可以像其他动物一样通过其他方式交流,但语言如果无法被人类掌握和使用,则将彻底消失灭亡。所以更有可能的情况是人类在进化过程中产生了一系列不同组件上的量变(而不是产生一个全新的“语言组件”这种质变)导致产生了语言能够通过文化传播萌芽的条件,然后语言在形成和完善地过程中逐渐“进化”的更容易被人类学习和使用。

另一个经常用来作为 UG 存在证据的例子是小孩具有超强的语言学习能力,似乎只需要超少的语料数据就能突破潜在的歧义性掌握正确的语言结构。本书提出的解释是这种差异来源于 N-induction 和 C-induction 的区别,前者是要对自然环境进行建模,而后者只是要在(同类)个体之间实现交流和协作。C-induction 可以让语言本身进化来适应人脑(更容易被人类学习),比 N-induction 要容易很多。例如给定序列 1, 2, 3, … 预测接下来是什么。由于信息量太少,N-induction 难以判定,有可能是 4, 5, 6,或者是斐波那契数列,或者之后一直是 3 之类的各种情况。但是 C-induction 不需要去猜测”真实“的结果,而只需要跟其他人的预测能够 coordinate 好就行,所以会容易很多,事实上只要一个群体存在(任意的)认知偏差,那么 C-induction 就一定会比 N-induction 容易。这样的结论是通过考虑语言的 Acquisition 和 Evolution 之间的关联性而得到的。

三个模块的互相关联和影响,也是本书余下内容的中心思想。例如第四章讨论语言 Processing 过程中的生理限制对 Acquisition 和 Evolution 所带来的影响。具体来说,由于人类短期记忆的限制,语言处理有一个 Now-or-Never 瓶颈,从这样的生理特性可以导出许多语言特有的结构属性,包括 UG 里经常讨论的 binding 的特性也可以从这个方面来解释。

第五章关于 form-meaning 映射的任意性是从 Processing 和 Acquisition 之间的取舍的角度来探讨的。人类语言里单词的(发音、拼写等)结构和其意义之间的对应关系没有什么规律这件事情上有点让人费解,因为这让学习难度大大增加,也会被当做人类具有特有的语言学习模块的证明。本书的观点是其实映射的任意性是从 Processing 的角度出发让信息量最大化的结果。为了让一个词能更容易被识别出来,其 form 和 meaning 的信息应该尽量独立。否则信息就是冗余的,例如如果所有与动物相关的词都以 d 开头,而上下文(例如身处动物园,或者句子到目前为止的文本上下文)能够推演出接下来很大概率是要谈到动物的情况下,听到 d 这个开头音能传达的额外信息就非常少。所以 form-meaning 这个映射之间的任意性有可能是进化过程中为了适应 Now-or-Never 瓶颈,能尽早消除歧义的结果。Monaghan et al. (2014) 发现 form-meaning 映射在更晚学到的词里的任意性倾向于更大。可以解释为早期学到的词更具有规律性,易于 acquire,而后期则为了 process 时从信息传递角度更加高效,规律性减弱。此外,虽然 form-meaning 映射非常灵活和随意,但是其实也并不是完全无结构的。例如给定两个不存在的词 kiki 和 bouba,让人把它们和两个图形对应起来,其中一个有很多尖刺,另一个比较圆滑,大部分人会做出一样的回答。

Processing 和 Acquisition 之间的联系还体现于本书直接将 Acquisition 视为练习 Processing 的永不停息的过程,可以和其他需要刻意练习的技术(例如乐器)类比。这也和传统的 Acquisition (特别是语法结构方面)是一个 one shot 的过程,和 Processing 相互独立的观点相对立。事实上,练习 Processing 过程中所获得的经验决定了人类语言处理系统的各种结构特征,通过语料数据库的统计分析会发现哪些结构被认为是语法合理的而哪些是不合理的这个特征会和其出现频率正相关,而不是像传统的抽象的生成语法所刻画的那样。抛开各种抽象语法所不能很好地解释的特例,就通常认为人类语言最根本的”递归“这个特性,似乎从抽象的角度来看待也不是很容易站得住脚。例如考虑下面两个句子:

  1. The cat killed the rat that ate the malt.
  2. The rat that the cat killed ate the malt.

两个句子都语法正确并且很容易被人类理解,这里的从句似乎体现了人类语言的”递归“特性。那么再看下面的两个例子:

  1. The dog worried that cat that killed the rat that ate the malt.
  2. The rat that the cat that the dog worried killed ate the malt.

基本上是上面两个句子的延伸,只是多加了一层递归,但是现在 (3) 仍然是可理解的,但 (4) 却非常难以理解,甚至有可能被认为是语法不正确的。书里还展示了再增加一层递归之后的效果。这样的例子表明人类可能并不天然具有纯粹数学上处理递归语法结构的能力,人类看似精妙的处理能力很大程度上似乎来源于处理某些特定具有递归结构的句式的经验。如果强行将复杂递归作为人类语言的基本要素,那这个语法就会生成出许多人类既不能理解也不会产生的句子来。常用的尝试解决这个难题的提议是区分无限的 linguistic competence 和有限可观察的 psycholinguistic performance,而后者被认为是受限于记忆和注意力以及其他大脑处理能力方面的限制。本书的观点是区别对待语言具有”递归结构“和人具有“递归机制”这两件事,一个类比就好像人类能够解”x 的五次方等于某数“这样的方程(结构)并不代表人类具有解通用五次方程的能力一样(机制)。事实上,在 Evans and Levinson (2009) 的研究中还发现其实许多人类语言中甚至都并没有递归机制存在。

总之本书有点像一个新的方向或者视角的项目企划,这种新视角得到了许多有趣的观点(许多是作者们自己组的研究),但是这些观点的系统验证、以及更深刻的对语言结构的理解以及实际的计算模型的建模等方面的研究都还有待发展,不知道近几年神经网络在 NLP 方面的突破会不会反过来影响语言学的研究让我们对人类自身的理解也达到进一步突破呢!另外本书的很多观点和传统的乔姆斯基学派的观点完全对立,至于谁对谁错可能还是要等时间来证明了,但至少看到不同的声音还是很有趣的。

Permanent Record》,是作者 Edward Snowden 的自传(虽然他现在还不到 40 岁)。

我通常不太看人物传记,但这本自传我读起来乐趣十足,主要是因为 Snowden 跟我们是差不多年代的人,看他从小到大的经历许多地方还是蛮有共鸣的,其中尤其是对早期美好简单的互联网的回忆。现在的互联网早已因为各种商业、政治等各种因素变得面目全非,着实让人感到非常难过。当然整本书或者说 Snowden 自己人生的高潮和重点还是在于他作为吹哨人将美国秘密对全国乃至全球人进行大规模监控的事情详细公布出来,虽然之前已经看了《第四公民》这个纪录片,但是再在书里看到详细会被监控并永久记录的各种信息和内容还是很震撼。如今八年过去了,Snowden 依然在流亡俄罗斯,各种保护隐私的法案都还远远谈不上完善,好在对于隐私、加密以及去中心化等的关注正在逐渐增加(例如 https 的普及),至少从技术上让跟踪和监控变得不那么容易,但同时监控摄像头、随时监听的智能音响、带 GPS 的智能穿戴设备又正变得无处不在,未来会怎样真是很难讲。而且信息收集又继续升级为信息输出,例如像川普选举中暴露出来的那样通过定点假新闻和政治广告来左右民众选举。也许未来权力机构和普通民众之间的不对等性只会越来越大,又或者是像《黑客帝国》中那样人类从此活在完全由 AI 运作的社会中哈哈。

书里到处都洋溢着计算机 nerd 的气味。最有价值的情报是 Snowden 查询了 CIA 和 NSA 的内部文档之后证实了外星人到目前为止并没有联络过地球,至少没联络过美国情报机构;而人类也确实登上过月球。

阅读的时候我发现书里经常会点题,或者提到一些导致他最终决定的铺垫,写的好像一切都是命运的安排似的,有时候有点太刻意或者太中二,或者说有点难以置信。不过话说回来 Snowden 整个事件本身就非常不真实,感觉有太多步骤有可能出错了,而且说人生中的重大决定会受到成长过程中各种事件的潜移默化的影响大概也算合情合理吧。

《甘尼米德的溫柔巨人》和《Giants’ Star》是今年立夏书单中提到的《星辰的继承者》三部曲的后两部。由于一些奇怪的原因我前两本看的是中文翻译版,最后一本看的是英文版。

第二部《甘尼米德的溫柔巨人》跟第一部一样精彩。美中不足的是作者笔力有限展不开,还有一些比如主角突然找接待妹子调情之类的对人物塑造也好故事推进也好都完全没有关系的桥段感觉根本没有存在的必要。不过瑕不掩瑜,光世界观这样逐步展开,解开人类进化之谜就满分啦!而且这种充满和平和温柔的科幻小说也是很少见。

《Giants’ Star》是完结篇,到第三本居然还能在世界观上给出新的精彩设定,不止重新诠释了人类文明的发展史,而且还填补了前两部中的未解谜团。感觉作者的笔力也有所提高,虽然还没有达到大师级水平,但是有了更多的事件的展开描述,即使节奏把握上还没有特别好,但也有一些比较紧张的场面。看到后半部分的时候一直在想作者要以怎样的结局来收尾才能不辜负这个最温柔的太空史诗(简直是“黑暗森林”的残酷世界的极端反面),结果没想到作者巧妙地避开了这个问题,没有说对这个结局有多喜欢,但是总不能黑化收场吧?最后:如果世界的真相真是像小说里描写的那样和平就好了!

总而言之,这个三部曲感觉在我看过的科幻小说里算是非常独树一帜的存在,有一些明显的不足的地方,但与其平平庸庸无功无过(例如后面要提到的《Sketching Techniques for Artists》),反而是像这种至少有一个突出的优点的情况更吸引人呀。

接下来介绍几本 Art 相关的书。

The Dramatic Portrait: The Art of Crafting Light and Shadow》,作者 Chris Knight 是一位人像摄影师。 这本书介绍了(戏剧性)人像摄影中打光的基础和方法,作者还提供了相关的在线课程,以及 YouTube 上的一些高质量的免费内容。书的内容大概是视频内容的静态版本,了解一下还不错,不过反正我也不要搞专业摄影,初衷是因为画画的时候在网上找的照片 reference 经常搞不清楚光线到底是从哪里来的,所以想了解一下摄影的时候多光源系统一般都是怎么设置的。另外虽然有点跑题,但是书在开始部分花了好多篇幅介绍 Portrait Art 的发展史,其中早期很大一部分其实是绘画史,倒是挺好玩的。

Framed Ink Vol. 2》,作者是 Marcos Mateu-Mestre。这是有名的用墨水画来讲构图的书《Framed Ink》的续集,示例图依旧简单但好看,视觉 impact 也很强,这一册主要讲一些“非正常”比例的尺寸下的构图方式,以及如何对已经有的构图进行微调让它适合不同的屏幕尺寸,原本觉得什么时候会用诸如 4 比 1 这种比例的画布,到后面才意识到画漫画和 graphic novel 的时候自己分镜其实经常会用到这类的比例。

《Stonehouse Anatomy Note》是韩国画师石政賢最近出的一本艺用解剖书,解剖图很美,内容很厚很详细,有时有点过于详细和跑题,倒是看着蛮好玩的,从生物进化机制开始介绍人体各大部分的由来和作用😅,时不时还穿插各种小知识,例如为什么狗狗的膝盖是向后弯的,为什么胸肌与手臂相连的地方有奇怪的扭结,亚洲人和欧洲人的身体比例差异的原因,以及各种显示男人气概或者女人味的姿势的由来等等(也由于这些方面似乎导致本书在网上收到不少种族、性别歧视方面的负面评价)。

《Sketching Techniques for Artists》,作者是 Alex Hillkurtz。介绍水彩加墨水笔的 sketch 技法。示例都非常好看,不过全书试图覆盖的内容范围太广了,像 portrait 之类的只有一页的内容想象不出来能讲多少有用的内容,倒是把书中的带步骤的详细示例增加几个可能会更有用。总之中规中矩吧。

《Women Who Read Are Dangerous》是一本展示历史上各种女性阅读的画(和照片)的集子,例如 Edward Hopper 的 Hotel Room。其中不少画都还挺好看的,每幅图还搭配了一些简单的背景介绍,作为一本画册来说挺好的。不过作者似乎想通过一些方式把它们串联起来讲述一些事情和道理(诸如阅读和性别平等的发展等)就有一点过于牵强了。

《Beautiful Evidence》是 Edward Tufte 的讲 visualization 的系列书中比较新的一本,介绍了一些糟糕的 visualization 的例子和他自己的观点,这本书还专门花了一章来批评 power point,虽然大部分观点都比较中肯,但是不得不说也有一些强烈的个人偏好在里面。不过作者试图用 visualization 的方法去解决一切问题,特别是有些用数值或者统计分析会更有效的场景有点牵强了。整本书感觉有点零散,像是闲聊,而且这种完全中立话题的书里穿插太多政治立场也让人觉得很不专业。