Elden Ring 是今年 FromSoftware 推出的一款动作角色扮演 (action RPG) 游戏,或者更确切的地说是一款开放世界的“魂类 (Soulslike)”游戏。它自宣布以来就备受瞩目和期待,多次获得“最受期待的游戏”等奖项,今年二月发布之后更是好评如潮。我自己也非常喜欢。

不过这次并不是要写 Elden Ring 的游戏评测或者感想之类的,而是想聊一聊自己在游玩过程中观察到的一个有趣的现象,感觉好像和 Theory of Mind 有点关系。

Elden Ring 虽然主要是一个单机单人冒险游戏,但是它也有一部分联机功能,其中一部分“异步在线”模块是指玩家可以在游戏世界里写下讯息,例如“前方小心陷阱”,然后别的玩家在经过这里的时候就会看到网友留言;另一部分则是“同步在线”模块,允许多人联机游玩,又可以分为协作与对抗两种模式,对抗(PvP,Player Versus Player)模式下一个玩家会“入侵”另一个玩家的世界,双方需要战斗到其中一方死亡为止。这样的机制在 FromSoftware 做的第一部魂系列游戏 Demon’s Souls 时就有了。我个人并不太喜欢同步在线游玩模块,特别是 PvP,在游玩过程中突然有其它玩家打断你的进度是比较烦人的一件事,特别是游戏 PvP 和正常推进(PvE,Player Versus Environment)时的战术技巧和装备之类都有一定的差别,所以正常 PvE 为主的玩家碰到熟练 PvP 玩家的时候经常只能挨打。好在至少在 Elden Ring 里如果你不进入多人协作游玩就不会被入侵,此时即使被入侵你也由于有协作队友的存在而具有一定优势,有了一定的平衡性。

刚才我提到 PvP 和 PvE 战斗时比较适合的武器、战术等都不太一样,出现这样的区别的一个原因是玩家角色和游戏里的敌人双方并不是均等的,例如许多敌人体型都比较大,但即使是人形敌人也不太会(像玩家那样)可以有效地通过翻滚避开大部分攻击。相比 PvP 的时候则面对的是和自己至少从战斗机制上是完全对等的(当然每个人都有各自不同的属性配置和武器、魔法装备等)敌人。但是有趣的是我发现这似乎并不是区分 PvP 和 PvE 两种情况下不同一样的最重要的原因。

Elden Ring 其实将协作与对抗作为游戏的一个核心机制引入,即使在完全离线状态下,游戏里的一些 NPC 的故事也是通过与玩家协作击败一个强敌、或者通过入侵与被入侵的方式与玩家战斗来展开的。在某些情况下出现的 NPC 甚至会直接复用上一个打败过该 NPC 的联网玩家的装备(铠甲、武器、魔法等),但即便如此,同 NPC 战斗还是与同真正的玩家战斗是一种完全不同的体验。

我觉得魂系列游戏里战斗的一大要素就是要求玩家能够有耐心,不骄不躁,因为任意心态失衡都会很容易被敌人抓住机会而带来严重的后果。在玩过比较多的魂类游戏之后我觉得自己已经能在大部分战斗场景中保持冷静和平和的心态了,但是在 PvP 中要做到这一点则困难得多。由于我并没有经历过非常多次的 PvP 经历,所以也没有太在意,但是最近——也许是看到网上关于 AI 语言模型是否有自我意识等相关的讨论的触发——突然想到这也许是一个可以解释这种差别的视角。

不过这里我们先不跳进“自我意识”等大坑,而是聊一下一个具体的叫做 Theory of Mind 的东西,这我在之前的博客中可能也提到过几次。Theory of Mind (ToM) 其实并不是像相对论 (Theory of Relativity) 那样的一个科学理论,而是指我们能够对别人的心理状态(包括意图、信念、情绪等)进行推断的一种机制。它之所以被叫做“Theory”是因为我们能够根据我们的推测对未来进行一定的预测,并不能直接对任何人的心理状态进行直接观测并验证我们模型的正确性,对应地,例如自然科学里的各种理论让我们能在一定程度上“理解”自然运转规律并预测未来,但是我们并不能知道理论模型是否是绝对正确的(可以证伪,但不能证实),并且像牛顿力学等即使已发现是非完善理论,但在很多实际应用中也是非常有用的。

其实我们并不止是有 Theory of Mind,也有关于其它日常交互的万物的“理论”,例如 Naïve physics 是即使没有经历过任何教育的人通常也拥有的内在物理“理论”,让我们能够做出诸如“无束缚的重物会垂直下落”等预测——即使大部分时候我们并没有意识到自己在应用某一种理论来做出某一个预测。Theory of Mind 亦是类似。

ToM 的存在性似乎已经是被广泛认可了,对 ToM 的研究包括测试人类婴儿从什么时候开始发展出 ToM(通常认为是四岁左右)、与大脑相关的医疗状况(例如自闭、精神分裂)对 ToM 的影响等。当然对于 ToM 的具体机制还存在各种理论与争议,例如有学派认为我们的大脑是像一个科学家一样建立一套关于别人心智的理论并用它来进行预测,而另外一些人则认为我们是直接用自己的心智机能(在某种离线状态下)对别人进行 simulation 来做预测的。

关于 ToM 最有名的一个测试是如下的 Sally-Anne 测试(图片来自 SimplyPsychology):测试中被试观察到 Sally 和 Anne 的互动,被试看到 Anne 将 Sally 的球从篮子里放进了箱子里,同时被试看到“Sally 并没有看到这一幕”。最后被试被要求回答当 Sally 回来要拿红球时会先去篮子里找还是去盒子里找。被试当然是知道球实际上是在盒子里的,但是如果被试有对 Sally 进行 ToM 建模的话,就会意识到 Sally 并不知道球被移动了,所以她应该会先去篮子里找。

ToM 的复杂之处不止在于要预测别人的意图(想要干什么),而且还需要知道别人对世界的信念(这里英文词是 belief,感觉翻译成“认知”之类的也许更合适,例如上面的例子里 Sally 对于球的位置的 belief 还是在篮子里,因为她没有看到球被移动了)。而更复杂的地方在于,如果(我们认定)对方也有 ToM 的话(例如“对方”也是一个人,而不是某一个简单的动物或者 AI,虽然关于动物是否有 ToM 还存在许多争议),那么我们就需要进行“高阶”ToM 计算了,有点“子非我,安知我不知鱼之乐?”的感觉,例如 Anne 平时就是个调皮的小孩,喜欢把别人的东西乱放,那么 Sally 回来之后会不会怀疑自己的球被动过了呢?这取决于 Sally 知不知道 Anne 的习惯和目的,但是我们(被试)并不是 Sally,所以我们需要对“Sally 脑中关于 Anne 的 ToM”进行建模和分析,如果我们看到 Sally 在离开的时候有点担心地看了看 Anne,会让我们更新自己关于 Sally 的模型,更倾向于觉得 Sally 知道 Anne 是个淘气小孩。

这样的高阶递归 ToM 在复杂的人际交互中几乎是无处不在的,这也是小说、电影等媒介能让我们“代入角色中”去身临其境地体验虚构的故事的根本。但是不论 ToM 的具体实现机制是怎样的,它的计算量都是非常大的,这也许是许多人在社交之后需要一定独处时间来“充电”的原因之一。

总之现在回到游戏,PvP 和 PvE 的重要区别在哪里呢?PvE 的时候我知道对方是 AI,我会去推测对方的意图,但是不会去尝试对“情绪”等进行建模,更不会做高阶 ToM 推理。但是一旦知道对方是人类玩家之后,情况立刻就不一样了:同 AI 的时候一样,我可能会推测对方是否是打算做一个假动作吸引我攻击,然后进行盾反击杀,但是当对方是人类的时候我会更近一步地去推测对方在“击败对手”背后更深层次的 intention(例如是否“对方是一个盾反高手,想要欺负一下新手玩家”)以及一些高阶 ToM 推断(例如“对方看出我是 PvP 新手了吗?”、“对方意识到我发现他使用的是一个作弊级别强大的装备但是有克制手段了吗?”)。在被对方痛扁一顿战斗结束之后看到对方角色在原地旋转时可能也还会揣测对方是否在笑话我只会不停地使用同一个攻击。结果 PvP 相比于 PvE 游玩时的紧张感让我更加难以控制。

当然不同的人可能会有不同程度的反应,就跟社交时是否会很累一样,有些人可能特别擅长 ToM 计算,所以不会感觉到巨大的差别,还有一些人可能 ToM 机制比较迟钝,低于一定阈值都直接处于弃疗状态,反而会“傻乐”般地在社交场合应对自如😃,反而是中间范围的人是最不擅长应对这些情况的。

再想一想上台演讲时的紧张感似乎也是类似的道理:自己一个人练习的时候并不会觉得紧张,但是当面对台下的观众的时候瞬间就肾上腺素飙升了,而两种主要的应对方式似乎也像极了对 ToM 的微调。一种常见的建议是尝试忽略观众的存在,把他们想象成布娃娃之类的,这很像是把 ToM 变得更迟钝;而我自己觉得对自己比较有效的方式是找到一些比较专注的观众,通过 eye contact 等方式加强交互,反而让自己更容易冷静下来,感觉有点像是让 ToM 超频工作哈哈。