如何提高自制力（知乎高赞回答，credits to @edmond）

以下内容均搬运自知乎，添加一些NotebookLM产生的贴图

我期待这篇文章成为迄今为止（2025年）中文互联网上，在自制力话题下最硬核的技术讨论，没有之一。

或许这个目标稍显大胆，但读者诸君倘若对此感到保留，请允许我邀请你快速滑动一下，感受一下本文的风格和内容，或许能稍稍增加你的一点信心：）

在这篇文章中，我想传达的核心思想是：自制力问题，未必只能是一个心理学或生理学问题，或许也可以是一个能用数学、物理学去解决的工程问题。

——基于上述理念，存在这样的可能性：人可以在没有DDL、环境约束，甚至任何外界监督的情况下，仅凭几个抽象而精妙的思想实验，即可对自身行为施加持久而深远的约束力，甚至在一定程度上改变整个生活的长时间稳态。

（当然，需要特别说明的是，即便再强大的方法论也只能部分地解决行为问题，许多严重的神经性、病理性问题仍需诉诸专业的医学途径来处理。）

为了验证这个想法，笔者作为一个从小被严重ADHD和自控问题困扰的人，花费了从小学到博士的十几年光阴，历经无数试错，才逐渐摸索出这篇文章中的两代自控技术。它们曾帮助我，在没有任何外界约束和药物治疗下，完成了从“长期挣扎却无法专注一小时”到“无DDL下，连续数月在家全天专注自习”的蜕变。

所以，我一直将写下这篇文章，当作一件必须完成的心愿：我希望把它们作为礼物，送给那些和曾经的我一样，被ADHD和自控障碍折磨的人们。亲爱的陌生人啊，惟愿它能帮助到你们，以及其他正在受苦的人，哪怕只是解决一点点因自制力问题而带来的烦恼。

接下来，我会慢慢把这两套方法讲给你听。它们分别叫做链式时延协议（CTDP）和递归稳态迭代协议（RSIP）。这两套方法的思路与目前常见的强调“放下手机”、“制定计划”、“目标分解”、“奖惩机制”、“延迟满足”、“内驱力”、“习惯打卡”的角度完全不同。

——我想做的，是从日常行为中抽象出底层的数学与物理机制，借鉴行为经济学、物理学、心理学等领域的思想，尽可能（部分地）破解拖延，启动困难，中途放弃，状态低迷这些常见的自制力难题。

当然，期间我会引入一些基本的数理概念，要彻底理解可能需要一点大一高数的基础。但请放心，我会尽力使用通俗易懂的科普语言，以定性和半定量的方式作概念性解释。此外，为了让更多和我一样有注意力障碍的朋友能顺利读下去，本文还将采用对ADHD更友好的口语化写作，配合图文穿插，并采用带有数字编号的分段方式进行组织。

一个小提示：在阅读过程中，你很可能会产生各种各样的疑问（比如读到神圣座位原理时，可能会想“如果作弊怎么办”、“如果反而不愿坐上去怎么办”），请千万不要着急，通常下一节就会解答这些疑问。而第一代方法的许多局限性，也会在第13节后引入的第二代方法中讨论与解决。总之，请慢慢读，千万别着急：）

1

alt text 在正式讨论之前，让我们来考虑一个最常见的场景：

假如现在是晚上七点，你刚吃完晚饭，坐在书桌前，面前是计划要完成的作业或一份想读的paper。与此同时，你的手机屏幕亮了，你瞥见小红书上一个有趣的推送。此时，摆在你面前的有两种选择：

玩手机：你会得到即时的放松和快乐，然而，这看上去有可能耽搁你今晚的学习计划，事后可能会产生焦虑和愧疚；
去学习：你会面对即时的枯燥和疲惫，然而，这将缓解你最近的任务压力，对学业也有帮助。

而在这个选择面前，几乎所有自制力短缺的人都会倾向于刷一晚上视频，然后悔恨不已，这到底是为什么呢？

这个问题，就是自制力问题下最经典的toy model。针对它，人们提出了各种各样的讨论，所谓意志力模型，多巴胺，奖惩机制，目标分解，延迟满足，环境控制，心理暗示，身份认同，to do list等无数的学术概念，经验法则，民间偏方云云。

然而，在本文中，我将尝试用一个简洁的数学模型去解释。

2

alt text 这就是本文的第一个假设：人在面临行为选择时，对某个选项的真实倾向，在数学上可以分解为该行为的未来价值函数 $V(\tau)$ ，和权重贴现函数 $W(\tau)$ 的乘积，从当下这一刻（ $\tau=0$ ）到无穷远处的积分：

$I = \int_0^{\infty} V(\tau) \cdot W(\tau) \, d\tau$

其中：

未来价值函数 $V(\tau)$ ，表示当前的你眼中，该行为在未来每个时刻 $\tau$ 带来的价值；
权重贴现函数 $W(\tau)$ ，则表示你对未来每个时刻 $\tau$ 的价值重视程度。

对行为经济学稍有了解的朋友便可看出，这就是经典的双曲贴现模型的等效数学表述。它揭示的是：我们面对选择的时候，并不是把所有“未来的价值”加在一起再决定，而是取决于未来所有时刻的价值加权总和，一般来说，眼前的价值权重更高，而未来的价值权重则更低。

就拿刚才那个“去学习 vs. 刷手机”的例子来说：

如果选择去学习，短期我们要面对切换成本与学习的枯燥，因此 $V(\tau)$ 为负；但中期因学习缓解的压力和满足感 $V(\tau)$转为正；而在更远的未来，一次学习带来的影响终究会逐渐消散， $V(\tau)$ 又趋近于0；
而刷手机则相反：短期即时愉悦使得 $V(\tau)$ 为正，中期却会因耽搁计划产生焦虑和愧疚，$V(\tau)$ 转为负；而玩这一晚上手机也终究不会改变人生，于是 $V(\tau)$ 也会慢慢趋于0。

理想情况下（也就是纯理性的情况），如果权重函数 $W(\tau)$ 是恒定的常数，那么学习的净价值总量明显会高于玩手机。

然而，我们的大脑往往极度短视，权重函数 $W(\tau)$ 在短期非常高，而在长期迅速趋于零。

在这种短视的权重分布下，刷手机在短期上的优势乘以权重后占了大便宜，积分结果反而会远远高于学习，这就是我们最终会选择玩手机的原因。

补充1：很多人对这个模型的适用范围有疑惑。其实，它本质上只是对双曲贴现模型，在时间上做了一个简单的权重分解。这个分解在数学上是显然的，即便存在所谓的“复杂情况”，也自然封装到了函数本身当中，比如：

精力/体力不足→去学习/工作的$V(\tau)$，因需要对抗疲劳而大幅衰减；
有不可抗力日程→与该日程冲突的$V(\tau)$，因放弃日程代价太高而大幅衰减（否则也不会是不可抗力）；

补充2：在本文中，我们对这两个函数采取“设而不求”的处理，只进行定性分析，来为后续的策略设计服务。事实上，由于在许多场景下定量分析并不现实，类似的定性模型是经济学，心理学等领域广泛使用的分析方法。

例如，微观经济学用效用函数来解释消费行为时，并不需要计算出吃一个苹果具体的“快乐数值”是多少，只需证明边际效用曲线是递减的，就足以建立消费决策的模型；博弈论中常用到的支付矩阵，在很多场景下也难以精确量化，但只要结构不变，便足以得出许多经典结论。

3

事实上，你会发现，这个看似简单的数学模型，几乎能解释生活中所有类似的经典场景：

比如，还是刚才那个玩手机的例子。你最终选择了拿起手机，想着只玩一会儿，然后会发生什么呢？

从你拿起手机开始，同样的故事就会无限重复：

刷完短视频A，再刷短视频B的短期诱惑又会高于放下手机；
刷完短视频B，再刷短视频C的短期诱惑又会高于放下手机……

在每时每刻的你看来， $I(\text{短视频}) > I(\text{放下手机})$ 都成立，于是你每时每刻都会选择再刷下一个短视频。

所以，你就这样刷了一整晚，直到凌晨两点，三点，晚睡的代价开始越来越可观，以至于慢慢抵消掉短视频带来的诱惑，你才终于充满悔恨地上了床。

（当然，也有一些人因为无法直面晚睡后的焦虑和自责，放下手机的心理代价越来越高，最终干脆熬了一整夜。）

但如果，你一开始选择的是去学习呢？你也许会惊讶地发现，一旦真正投入进去，继续学习反而会变得越来越轻松，你甚至渐渐觉得没什么兴趣去刷手机了。

这是因为心理学上的“切换成本”现象：当我们从一项任务切换到另一项时，这个“切换”本身就天然伴随着一定的心理阻力。在这个模型中也很好理解——想要从当前活动中抽身，你必须先把手头的动作停下来，清理大脑中已经加载的工作记忆，再强行切换到新的行为流程。

这个成本，在数学上就近似于在最敏感的 $\tau=0$ 位置，插入了一个负向的冲激函数！

这便是陷入放纵后也更难爬出来，但开始任务之后也更容易坚持的原因。

（为了后续表示更方便，我不会单独画出这个切换代价的冲激函数，而是自动将它合并到价值函数 $V(\tau)$ 中。）

不过，有些时候我们也可以自然地抵抗玩手机的诱惑。考前复习周，DDL前夕就是这样的时候。

前面提到，平时刷手机带来的短期愉悦，通常只会在中期造成一些焦虑，并不会真正对我们人生产生重大影响。

但考试周可就不一样了——如果你此时还沉迷短视频，你就会挂科，产生一系列严重后果，搞不好真的就改变人生了。

于是，玩手机的远期负面价值急剧膨胀，硬生生地以极低的权重打败了短期诱惑！所以，复习周的剧本通常都是一个泾渭分明的阈值，到了某个时间点后，你的时间投入会突然陡增。所谓的”ddl是第一生产力“，其实也是这个原理。

（当然，对一些人而言，这种后果的严重性也会“去复习”承担的意义越来越沉重，切换代价提高，越接近ddl反而越无法开始，最后真的挂科了）

诸如此类的例子还有很多。可以说，在单一行为来看，我们的自控成败只取决于一件事——价值分布函数 $V(\tau)$ 在时间上的分布是否有利。

4

既然 $W(\tau)$ 代表的是人类与生俱来的“短视性”，它几乎是固定的，我们很难从根本上改变它。那么，我们要问一个问题：自控又是“如何可能”的呢？

这里，我们可以作出本文的第二个：

人类一切有效的自控策略，本质上都是在构造一种对价值分布函数的变换 $V(\tau) \to V’(\tau)$ ，从而使行为倾向更接近于理性决策的结果。

举几个例子：

没用的方法1（远期奖励） 自我激励、想象“未来成功后的美好生活”，或者搞“游戏化”，给自己设定学习完成后的奖励。这相当于在学习行为的价值函数 $V(\tau)$ 上，在远期叠加了一个正向的线性激励——但由于远期权重极低，这种方法其实吃力不讨好，通常没什么卵用；
没用的方法2（远期惩罚） 给自己设置玩手机的惩罚，或者玩手机后就去跑步，写检讨。这相当于给玩手机的价值函数 $V(\tau)$ 上，远期插入一个负值——这种方法同样没什么卵用；
稍微有用的方法3（近期惩罚） 把手机锁起来，或者找人监督。这相当于在近期提高放纵行为的切换成本，即对其 $V(\tau)$ 近期插入负值——这种方法有用，但不多；
有用的方法4（非线性压缩） 比如很多人都熟悉的“番茄工作法”。其机理实际上是在学习开始后，变换“中途放弃”的 $V(\tau)$ ，将整个番茄钟的沉没成本打包、捆绑，然后非线性压缩到当下的一刻——这是比较有用的方法，在后面讲解 CTDP（第一代技术）时，我们会对其进行详细展开。

为了更直观地衡量这些方法的有效性，我们还可以定义一个指标，那就是自控策略的增益（G）：

$G = \frac{I^{'}(\text{学习})}{I^{'}(\text{放纵})} / \frac{I(\text{学习})}{I(\text{放纵})}$

简单来说，就是使用策略前后的理性决策倾向之比。如果用这个指标去检验市面上绝大多数主流的所谓“自控方法”，你会发现，它们的增益普遍低得可怜。要么仅仅在权重极低的远端做文章，要么甚至根本就不作用于价值函数 $V(\tau)$ ！

比如“Just do it”，“告诉自己，你始终是有选择的！”之类的营销号励志口号，这种玩意居然还能在知乎、抖音上获得成千上万的点赞，可见当前关于自控话题的平均认知水平之低。

而那些能靠这些鸡汤手段实现自控的人（这些人很多确实优秀），并非因为这些方法多么出色，而是因为他们本来就有优质的习惯、环境、自身条件，距离真正自控只差临门一脚，所以哪怕微弱的刺激也能推动他们实现正向行为。

可悲的是，正因为这些优势在个人成就中占据了极高比重，拥有这些优势的人反而很少需要追求真正高效的自控策略。他们在成功后分享的那些肤浅方法，反而成了最广泛传播的主流认知——这种反直觉的幸存者偏差，我们将在文章末尾进行更深入的讨论。

5

接下来，有趣的事情来了。 alt text 有了这个数学基础，我们可以构造出一个极其巧妙的策略，通过在不同时间点上对 $V(\tau)$ 进行非线性压缩和线性平移变换，来为单个理性行为套取惊人的正向增益。

更重要的是，它能够一举破解我们在自控中最常见的三个顽疾：中途放弃，破窗效应和启动困难。

而这一切，都建立在三个核心原理上。

第一个核心原理，叫做“神圣座位原理”。

我们不妨做这样一个思想实验：

假如某个自习室里，有许多座位供你自由选择。有一天，你突发奇想，指定其中一个座位为“神圣座位”，并为它制定了这样一条游戏规则：

坐在其他任何座位上，都没有特别的约束，你想干什么都行；但只要你的屁股一旦碰到这个“神圣座位”，你就必须用最好的状态，100%专注地学习满一个小时。反过来，如果没有自信做到专注，那么就干脆不允许自己坐在这个座位上，宁愿选择其他普通座位。

总之，这个“神圣座位”决不允许被不专注的屁股所玷污。

当然，仅仅是随便想象这样一条规则，本身并不具备什么真正的约束力。但是，假如你真的认真执行了一次呢？

某一天，你真的坐了上去，屁股一沾到那个座位，你就真的用最认真的状态学习了一个小时。

神奇的事情发生了：从你第一次成功执行这条规则的那一刻起，这个原本只是想象出来的座位，就真的在你心中被赋予了价值！此后，你大大咧咧地坐在这个座位上玩手机的可能性，就真的会远低于之前的情况！

这时候，你再加入一个新的游戏规则：

把第一次专注的纪录记为#1，此后每次花一个小时专注成功，都可以作为工作量证明，为这个“神圣座位”增加一个编号记录：#1、#2、…、#N。但只要有一次失败——比如你在上面刷了手机，或者只坐了十分钟就走人——那么所有纪录都会被清零，下次只能重新从#1开始。

随着这个链条不断延长，工作量证明不断积累，这个虚构的座位的价值会一次次地增强。当这个任务链的节点数增长到 #10、#20、#30的时候，这个规则的约束简直就要实质化了——你甚至可能变得谨小慎微，连大气都不敢出，生怕有一丝一毫对规则的不敬。

但神奇的是，随着链条的延长，对这个规则的慢慢习惯（以及后面“下必为例”积累后要求的降低），表面上你虽然谨小慎微，但这种强约束在内心带来的并非恐惧或压力，而是一种前所未有的平静与安全感。

这便是心理学中反直觉的“认知卸载”现象：由于此时“在座位上开小差”的选项变得过于不可能，以至于你的大脑不再需要消耗意志力，在“坚持”和“放弃”之间进行拉锯战。在这种“没得选”的状态中，人反而更能得到轻松——就像在没有信号的飞机上，或者在考场里做题一样，因为“不得不”专注，你却往往能简单沉浸于心流之中。

注：“神圣座位”只是一个例子，事实上它可以是任何标志性的事物，一个板凳，一顶帽子，一条给微信小号的消息都可以是“神圣座位”。

实操中，最好用看得见摸得着的便携物品，例如我现在用的神圣座位就是“深呼吸三次后戴上蓝色帽子”，只要执行了，就必须专注一个小时。

（聪明的你肯定想到了这个规则可能崩溃+你不愿意坐上去的问题，别急，这正是8,9节要解决的）

6

这种神奇的约束力，实际上是来源于人类对“保持纪录”这件事情与生俱来的执念。

许多健身或学习类App都设有“连续打卡”功能。很多人即使再困再累，也要勉强背5分钟单词，只为了维护Duolingo上那条“365天连续签到”的纪录；戒烟戒酒连续坚持了10天的人，看到10天这个数字，也会比刚开始的第1天时更难放弃。

——仅仅是一个想象出来的纪录，就足以产生近乎荒谬的约束力。

细究起来，这种约束力其实来源于两点：

一方面，纪录保持越久，你为维护这个纪录所付出的真实时间、精力也就越多。链条上每一个成功的任务节点背后，都是真实的“工作量证明”和沉没成本；
另一方面，这种纪录往往还伴随着一个妙不可言的“未来价值预期”：你认为这个纪录有价值→你害怕失去这个纪录→它就会产生约束力→这个约束力又有助于你未来的自控，你以后的自控就仰仗它了→这个纪录更加有价值。价值越高，约束力越强；约束力越强，未来预期越高；未来预期越高，价值越高……

然而，所有的”纪录“，都天然带有“一损俱损”的特性：一旦你打破了这个纪录，所有这一切辛苦积累的沉没成本和未来预期，都会立即，突然地在 $\tau=0$ 的瞬间彻底失去！

这便是“神圣座位原理”的背后数学本质：对 $V(\tau)$ 的非线性压缩变换。

当你坐在这个座位上时，整个任务链所有节点过去投入的价值，和未来的预期价值，就会在“放弃专注”这个选项的价值函数中，被急剧地压缩，凝聚成一个极度接近原点（ $\tau=0$ ）的负向尖峰——任何对规则破坏的短期诱惑，事实上都要立即面对全链已积累和未来价值的挑战。

而最妙的是，这一点在专注任务的每一刻都持续成立。当沉没成本积累到一定程度时，就再也不会有任何短期诱惑能够挑战这样一个惊人的屏障了。

到了这个地步，坚持和放弃的选项差距是如此悬殊，以至于你会根本感觉不到“放弃”这个选项，反而屏蔽了抵抗诱惑的纠结和损耗，更能自然无损地进入心流。

（注：此方法的适用范围因人而异，比如有些人对”沉没成本“完全不感冒，或者过于敏感，可能就不适合这个方法）

7

这种“一损俱损”的价值捆绑原理，也是很多经典自控策略真正起作用的原因：

比如番茄工作法，每一个番茄钟实际上相当于一个“小号的神圣座位”：它把整个专注时段的沉没成本和未来预期，打包、捆绑在了一整颗“番茄”里。一旦你在番茄钟期间懈怠或放弃，你立刻就要在当下瞬间承受失去整颗“番茄”带来的巨大代价。

这样一来，你每一刻的选择权衡，不再是“眼前诱惑与当下任务”之间的比较，而是变成了“眼前诱惑与整颗压缩后的番茄总价值”之间的竞争——这才是番茄工作法背后真正有效的核心机制。

再比如，很多人也有过这样的体验：

你某天学到了一个全新的自控方法，觉得非常有道理，于是兴致勃勃地投入了实践。在一开始，哪怕那个方法实际上毫无卵用，你都会发现它如有神助。

但奇怪的是，过了几天之后，最初的新鲜感逐渐消退，你开始频繁违规，方法的有效性迅速衰减，最终彻底失效、被你抛弃。

这就是一种类似“新手保护期”的错觉：任何自控方法在前几天看上去都是有用的，但真正起作用的可能并非方法本身，而是你对这个方法的“未来预期”。

当你将未来自控的希望寄托于这个方法时，这个“寄托”便短暂地，真的赋予了它约束力。然而，如果方法本身低效，这种临时的约束力终究无法支持它在复杂的真实环境中长期存活，一旦出现任何一次违规或磨损，整个方法的信誉和价值就会随着破窗效应迅速崩溃。

而“神圣座位”这个设计最美妙的一点，就是它在时间上天然是一种分布式的、去中心化的设计。它只对坐在那个座位上的，精选过，提纯过的状态负责，而无需暴露在所有时间中，对长期状态负责，从而最大化地避免了磨损。

换句话说，你可以在满状态下完成了#1号任务之后，去聚餐、喝酒、打游戏，荒废几天乃至一个星期，但当你下次重新走进自习室开始#2的时候，神圣座位依然是那个神圣座位，它的约束力丝毫不会减弱。

8

当然，即便在这个精选的状态中，“神圣座位原理”也并非完全没有漏洞。

前面说到，一旦坐上这个位置，就要以“最好的状态”专注学一个小时。那么问题来了，怎么去定义这个“最好的状态”呢？

如果我中途去上厕所，还算不算“最好的状态”？
如果我接个电话，去拿个快递，还算不算“最好的状态”？
如果有人发消息找我，我回复一下，还算不算“最好的状态”？
如果这些都算，我中途玩玩手机，刷两下短视频，也可以算“最好的状态”吧？

你会发现，“理想状态”根本就不存在，任何自控策略一旦进入实战，都必须面对复杂多变的真实情况。

自控问题的本质，可以看作”理智的制定规则的你”，和”非理智的面对诱惑的你”之间的博弈与攻防——任何由“理智的你”所设计的自我约束策略，都等价于大量隐含的，微小的“子约束”。在无数次重复博弈下，每个子约束都可以被考验、被挑战：

如果你允许自己灵活地自由裁量，那方法的约束力就会在一次又一次“这次特殊，下不为例”的侥幸心理中不断磨损，产生破窗效应，最终被腐蚀得千疮百孔；
但如果你完全不允许任何例外，这个方法就会变得刚强易折，当你遇到一次忍无可忍的情况时，规则便可能瞬间、彻底地崩溃。

一个经典的例子是，答主高三时用的一个非常中二的”立法“策略：通过在晚上睡前立下/修改毒誓，来为白天的自己设定规则。它曾帮我在高三的强约束环境下实现了自律，但进入大学的宽松环境后，这个方法便在几次违规后迅速崩溃，最终废弃了。

所以，这种“渐进破窗效应”，正是绝大多数类似于“游戏化”或“设立规则”的方法迟早都会失败的根本原因。运动员玩什么游戏不重要，把运动员和裁判分离的逻辑才重要。

为了解决这个问题，让我们引入更加精妙的第二个核心原理：“下必为例”原理。

（注意，是下必（bì）为例，不是下不（bù）为例）

既然你自己也清楚，只要有了第一次“下不为例”，就必然会产生无数次后续的耍赖行为。那么，不如反其道而行之，强制要求自己“下必为例”——也就是说，反过来要求自己以后必须耍赖！

具体而言，当你面临任何疑似违规的判定时，就像西方法律体系里的“判例法”一样，只能在下面两个选项中选择一个：

立即判定这个“神圣座位”的规则被完全破坏，链条断裂，彻底清空所有任务纪录，承认约束力完全归零；下次老老实实从 #1 重新开始；
判定这个行为允许，但是，只要这一次允许，未来遇到同样情况也必须一律允许，在这个任务链接下来的整个生命周期，它都会彻底失去对该行为的约束力。

你的“最好的状态”，并不是由任何主观或客观的标准定义，而是由无数个“判例”，去动态地形成定义：

中途去个厕所，还算不算“最好的状态”？可以算，但只要这次算，以后就必须都算；
中途回复消息，还算不算“最好的状态”？可以算，但只要这次算，以后就必须都算；
中途刷两分钟短视频，还算不算“最好的状态”？可以算，但只要这次算，以后就必须都算；

这样一来，你考量的就不再是一次孤立的选择，而是要不要在当下这一瞬间，永久地放弃掉这个规则对该行为的约束力。摆在你面前的代价，便是允许这个行为的真实长远代价。

现在在你眼中：

对于理智上本就不该允许的行为（例如玩手机），坐在座位上的你非常清楚：只要今天允许了这个“例外”，那么未来每一次坐上这个座位，你都会援引这次行为作为“先例”来耍赖（况且规则要求你必须耍赖），再也无法重新把这个行为定义为违规；
而对于理智上本来就应该允许的情况（例如上厕所），未来的你也能心安理得地给自己放行，不会对规则的信誉有丝毫顾虑。

最终，你所作出的判决就真的成了最符合长期理性的决策。因为，为当下着想的你（作为运动员），和为未来着想的你（作为裁判），已经在这种机制下奇妙地达成了共识——就这样，你自己和自己，达成了跨越时间的纳什均衡。

当这个方法长期运行下去，规则的约束边界并不会像传统方法那样逐渐腐蚀、崩溃，而是缓慢地、 $\epsilon$-$n$ 式地，以一种“永远刚好够用”的精度，逐步收敛到最接近理性决策的边界上：既能容许真正必要的例外，又能有效防止非必要的自我放纵。

这就是“下必为例”原理的精妙之处。

9

好了，现在我们有一个完美的“神圣座位”了。但一个新的问题随之而来：

越神圣的座位，你反而会越不敢坐上去。

的确，坐在这个“神圣座位”上的状态非常完美。然而，这个座位太神圣，太完美，以至于“坐在座位上”这个动作的承诺太沉重，你会越来越不愿意坐上去，也就是常说的“启动困难”问题。

这正是为什么人们总喜欢说“完美主义导致拖延症”（这里的“完美主义”其实就是预期太高之后，造成的切换成本上升）。

此时，就要轮到我们第三个核心原理：“线性时延原理”。

而这个原理，从数学的角度看，可以以一种优雅的方式欺骗贴现函数$W(\tau)$，一击破解长期以来困扰无数人的“拖延症”难题。

让我们再做一个简单的思想实验：

假设你找到一个典型的拖延症患者，问他：“你愿不愿意此刻立刻开始学习？”他多半会摇头拒绝；
但如果你换个方式问他：“那你愿意明天下午再开始学习吗？”甚至不用等那么远：“15分钟后再开始怎么样？”这一次，他居然多半会表示同意！而且，这个时延越长，这个人表示同意的概率就越高。

为什么会出现这个奇特的现象呢？

我们不妨再次回到前面的数学模型来解释一下：

当你考虑“是否现在立刻开始学习”时，正如前面分析的那样，价值函数 $V(\tau)$ 的负面价值恰好处于权重函数 $W(\tau)$ 的高权重的近期，因此你会感到强烈的抵触；
然而，当你考虑“是否愿意15分钟后再开始学习”时，情况就完全不同了：这实际上相当于将 $V(\tau)$ 在时间轴上向后平移了15分钟，到了 $W(\tau)$ 相对平坦的区域！和放纵的选项相比，这就几乎抹平了它在短期的巨大劣势。

这也解释了日常生活中非常普遍的一种现象：我们总是对未来的自制力抱有盲目乐观的幻想。

在双曲贴现函数中，权重随着时间的下降是先陡峭，后缓慢的——10分钟后的权重和1小时后的权重可能天差地别，然而1天零10分钟后的权重，和1天零1小时后的权重，则几乎相差无几。

当我们替未来的自己做选择时，就相当于用平移后的 $V(\tau - \Delta\tau)$ 和 $W(\tau)$ 积分，避开了它短期内陡峭的锋芒。平移的距离越长，实际参与积分的 $W(\tau)$ 就越平缓，自然也就越接近理性状态。这就是我们在制定暑假计划时经常盲目乐观，拿起手机时天真地以为自己真能刷五分钟就放下的原因。

而这个方法最高潮的部分来了：

我们可以在主任务链之外，再额外建立一个平行的“辅助链”，同样也被神圣座位原理保护，同样对所有情况都”下必为例“，而它所捍卫的约束规则非常简单：

设定一个简单的动作作为预约信号，比如打一个响指；
一旦触发这个信号，你就必须在接下来的15分钟内—— 坐！到！那！个！神！圣！座！位！上！去！

所谓堵不如疏，克服拖延的最好方法，就是首先承认并尊重拖延。

既然”预约15分钟后开始“的阈值，远低于”立即开始“的阈值，现在的你便毫无压力地启动了预约。

15分钟后，那条辅助链过去和未来的价值，就会渐渐在 $\tau=0$ 处压缩、凝聚成一根尖锐的，突破天际的撞针——硬生生地刺开那道“切换成本“和”启动困难“的大门。

（顺带提一个囧事：刚想出这个方法的时候，有一天晚上睡不着觉，不小心打了个响指，只能无奈凌晨三点爬起来学了一个小时）

现在，结合前面的三个核心原理，我们终于得到了完整的第一代自控技术：

链式时延协议（Chained Time-Delay Protocol, CTDP）

10

以下就是链式时延协议（CTDP）的完整表述： alt text CTDP 是一种基于三个核心原理（神圣座位原理、下必为例原理、线性时延原理）构造的行为约束策略。具体来说，它要求你构建两条平行的任务链（主链和辅助链），并且严格按照以下步骤进行：

Main Chain 主链（任务链）：

首先，指定一个具体的事物作为标志，作为”神圣座位“（事实上，神圣座位只是一个比喻，它可以是任何事物，一张特定的椅子、一支特别的笔、一顶帽子，甚至是发给你特定微信小号的一条消息都可以）
一旦你触发了这个标志，你就必须以“最好的状态”完成一个明确的专注任务；
每当你成功完成一次专注任务，就可以在主链中记录一个节点：第一次成功为 #1，第二次成功为 #2，第三次为 #3，依此类推；
如果在任何一次任务中途，你似乎做出了与”最好的状态“不符的行为，必须在下列两个选项中选择其一（“下必为例”原则）：
判定整个主任务链立即失败，清空所有当前已累积的节点记录，下一次只能从 #1 重新开始；
判定允许当前行为，但从此以后，该行为在后续任务中也必须永久允许，不得再视作违规；

Auxilary Chain 辅助链（预约链）：

定义一个简单的预约信号，比如打一个响指、打开一个闹钟，表示15分钟后将开始主任务；
一旦你触发这个预约信号，在接下来的15分钟内，你必须去触发那个神圣座位对应的标志，开始一个主链任务；
如果在预约触发后，你没有在15分钟内触发那个标志，那么同样适用“下必为例”原则：
要么彻底清空预约链的纪录，承认预约链失败；
要么允许当前的情况，但从此以后预约链将彻底失去所有对该情况的约束力；

至此，我们通过同时使用非线性价值压缩（神圣座位）+ 判例法约束（下必为例）+ 线性时间平移（预约机制）的三重巧妙机制，Hack掉了启动困难、破窗效应以及短视决策的影响。

在任务链积累的前期，每个节点的质量都接近完美，“对这条链的未来价值预期”提供了约束力；

而在任务链积累的后期，节点的质量虽随判例的增多而下滑，但足够长的连胜记录提供的正反馈，以及长链记录背后的沉没成本，又弥补了约束力的衰减。

仅靠几个思想实验，我们就构造出了一种在没有外部监督，甚至意志力不足的条件下，近乎凭空地为理性行为套取巨大增益的自控策略。而且，其约束力完全源于每个节点的工作量证明，只对这些分布式的精选节点负责，不会暴露在长期状态波动中而受到腐蚀。

依靠CTDP这个策略，我们对任何重要任务，都可以做到既容易开始、又容易坚持，长期还不会失效——这看似不可能的三角，我们全都要。 alt text

11

当然，前面讲述的CTDP更多是理想化的版本，现实生活中，它的应用远比刚才讲的要更加灵活有趣。

比如说，“神圣座位”真的一定要是一张座位吗？

其实并不一定，它可以是任何具体的、容易区分的标志。比如我自己平时用的标志便是一个专门的微信小号，每次开始任务时就发一条消息，用来触发任务，同时也记录节点和目标声明；

CTDP表面的画风

其次，任务链本身也不一定非得是严格的线性推进（#1、#2、#3……），你完全可以构造一种自上而下的层级组织：

比如说，三个单元级节点，可以组成一个3小时的任务组，记为##1；
三个任务组，组成一个日级的任务群，记为###1；
三个任务群，组成一个三日级别的任务纵队，记为####1；
两到三个纵队，又可以用一个周级任务集群来管理，记为#####1；

而每个单位，都可以有自己的要求，例如##任务组可以要求前两个#单元完成后都执行一次预约信号，就可以把三个#单元串起来了。这样一来，我们就像军事指挥序列一样，以一种”三三制“的方式，把庞大的任务链自上而下地组织了起来！

同样，任务单元的内容也不一定都是单调的专注学习，中二地来说，它还可以分成不同的”兵种“。

比如，学习，做实验、读论文=”突击单元“，信息搜集=”侦查单元“，制定计划=”指挥单元“，处理杂事=”特勤单元“，运动锻炼=”工程单元“，备餐做饭=”炊事单元“……

而一个大的任务群，任务纵队，又可以像现代合成部队一样，由多个兵种组合而成——

一个专注于工作的主战任务群，可以由7个突击单元+2个侦查单元合成；

一个周末休整的后勤任务群，可以是1个指挥单元+3个特勤单元+2个工程单元+1个炊事单元的合成；

在假期，一个兼顾运动和自学的三日级纵队，又可以按6突击组+3工程组合成。

CTDP实际的画风

你会发现，这个任务链结构就这样自然地完成了人们常说的”目标分解“，同时，”游戏化“也并不需要刻意设计——因为，当你真正面对一个大任务时，画风是这样的：

日程表，你记一下，我作如下部署调整：

以第四任务群，十一任务群加十五、十六两个独立侦查组，强化下周作业的ddl防线；二、三、七、八、九五个任务群，加六任务群十七突击组，集中力量完成笔记； 十突击群加一个突击组，在托福，GRE一线，阻击到复习时间的单词；十二任务群配合十二个独立单元，围剿此前找到的知识漏洞； 五任务群和第六任务群的两个侦查组，查找资料；十四任务群作总预备队，不动！

除此以外，还有一些有趣的扩展玩法：

【储君继承制】

比如，为了解决专注链崩塌后导致破罐子破摔的经典问题，可以用一个非常巧妙的反崩塌策略提高容错——为不同的状态创建不同专注链，分别为：

精锐专注链（仅在状态最佳，环境友好，动机强烈时执行，确保尽可能完美完成）
普通专注链（若干个，任何状态下都可执行，包括疲惫，碎片时间或无法保证完成时）

只有在感觉状态最好，几乎必定拿下时才启用精锐专注链；一旦精锐专注链意外崩溃，状态最好的普通专注链将继承大位，成为新的精锐专注链，巧妙规避崩溃后的摆烂倾向；

【二次预约信号】

在实战中，只用一个简单的预约信号还是过于脆弱，因为有时15min到了，我可能在厕所/室外，开始任务并不现实。所以，我会设计两个启动信号作为缓冲：

预约启动信号：信号是打一次响指，一旦触发，14min30s内必须执行”即时启动信号“（保留缓冲，预防真的用完15min）；
即时启动信号：信号是打三次响指，一旦触发，必须根据现有条件【尽快】开始任务。

【侦查任务】

如果使用了预约链，启动阻力还是太大怎么办呢？你还可以设置一个简单的“侦查任务”：只需要专注5分钟就算完成，如果能进入状态，也可以选择延长到60分钟。

这样一来，启动侦查任务的阻力极低，而真的专注5分钟后，你又能大概率愿意坚持；真的遇到坚持不下来的糟糕状态，也可以毫无负担的放弃，丝毫不影响你的任务链；

最后，这种“神圣座位+下必为例+线性时延”组合而成的策略，还可以轻松地推广到生活的任何方面：

比如，为了启动跑步运动，你可以用特定手势作为预约信号，做n下动作，就意味着必须跑步5×n分钟；
为了解决ADHD人群常见的洗澡、出门拖延问题，你也可以专门设置对应的洗澡预约信号，出门预约信号；

推广开来，你几乎可以用简单的手势或动作直接“遥控”自己的日常生活——以一种极其轻松、优雅的方式对付拖延症问题。

12

到这里为止，第一代的自控技术的内容已经完整地呈现出来了。

回头来看，这套技术无论从原理设计、实操落地，还是方法的精巧程度，都已经远远超越了市面上那些流于表面的激励口号、to-do清单或者游戏化设计。

果然，在CTDP诞生后的几年时间里，它在我自己身上爆发出了惊人的效果。

必须坦白地讲，我本人的自制力基础实在是非常糟糕：从小学到高中日夜沉迷游戏，长年饱受ADHD困扰，学习习惯和生活秩序都一塌糊涂，从小到大那是一节课都听不进去，最后考了个985大学。到了大学初期，环境放松后，甚至在考试周都能吊儿郎当地复习不下去。前面举的DDL越近反而越学不下去的例子，就是曾经真实的自己，可谓自制力基础的地板了。

但自从CTDP诞生后，我一生中第一次实现了长达数周甚至数月的持续自律。借助这个技术，我可以极其轻松地启动任务，并毫无负担地维持连续一整天的高度专注，ADHD的问题似乎在一夜之间得到了缓解。不仅大学后期成绩显著提升，甚至实现了出国交换、发表论文，顺利攻克了托福和GRE，最终还读下了一个硬核的硕士项目。

尤其是在状态最巅峰的时期（例如准备托福和GRE期间），它更是可以让我连续两个月每天高效动员8-10个小时，十几个任务集群、数百个任务单元的大兵团作战，都能令行禁止、进退有据、如臂指使、天衣无缝。

甚至后来有一次，我在考试复习期中途感冒了三天，还能冷静计算出它对十五天后考试的影响，并从容地从部署在七天后的总预备队中，调配八九个##任务组填补空缺。

（比如这是某次考前一个多月的计划表，每个单元格代表一个##级任务组）

在如此空前的高效自律面前，我一度乐观地以为，自制力的大厦已然建成，剩下的无非只是修修补补了。

然而，很快我就发现，CTDP并不是在任何时候都管用。具体而言，我观察到一种明显的两极分化现象：

在大状态本来就有利于自控时，尤其是有DDL等明确压力和目标的时候，例如考试前的复习期，有大量紧迫任务的时间，CTDP的确能最大化利用这些压力，让自制力和纪律性达到前所未有的高度，几乎可以做到每个小时都如臂指使，游刃有余；
然而，当大状态本来就不利于自控时，比如在家的闲散时间、身心疲惫、没有明确任务目标时，我往往连触发预约启动信号的意愿都极度缺乏，哪怕多次强行启动，也会在短短几个#任务后便告崩溃。

因此，在随后的三四年里，我曾无数次尝试对它进行改进与升级。然而，CTDP似乎已经穷尽了“1小时尺度的单个行为”这个微观视角下自控策略的极限。无论如何改造，在几年的时间里它都未能寸进，自控状态始终表现出强烈的阶段性和环境依赖性。

就这样，这个瓶颈困扰了我数年时间。直到五年后，我才终于找到了一个更深刻的视角去解释这一切，这也是本文最深刻的部分

——并不在传统的“动力”“奖惩”“约束”上着眼，而是用复杂系统科学的思想，从“尺度”的角度去看待整个系统！

13

在新的视角下，我们生活中的各种行为并非由简单的、孤立的，仅仅由眼前的 $V(\tau)$ 描绘的单一决策节点所组成。实际上，它更像是一棵由无数个连续的、交织的决策节点组成的“行为树”。

这棵行为树中，每个节点的走向都高度依赖于它前面节点的选择；而它在各个时间尺度的宏观走向，又被生活中的各种大大小小的尺度因素高度决定。而其中绝大多数节点，恰恰不适合我们有限的自由意志，或由自由意志驱动的自控策略去介入。

让我们回想一下最开始那个手机陷阱的例子：

某一天晚饭后，你抱着“就刷一小会儿”的心态躺在沙发上，随手打开了短视频App：

正如前面分析的那样，每刷完一个视频，你都再次面临”刷下一个视频“和”放下手机“的微观选择。但遗憾的是， $I(\text{短视频}) \gg I(\text{放下手机})$ 的关系对每个微观节点都成立，于是你也就在每个节点都放不下手机。

假如根据你所有过往的选择纪录，统计你最终走向两个分支的概率，你会发现两者的差距极为悬殊——或许高达99%比1%（此处只是概念性举例，并不需要实际统计）。

现在，我们可以引入一个关键的假设——“有限自由意志”假设：

自由意志是存在的，但也是有限的。选项之间的倾向差距越小，自由意志能够有效干预的概率就越高。如果是60%：40%的差距，自由意志尚可干预；但当选项之间的差距过大，比如达到 99%：1% 的程度，自由意志就几乎无能为力了。

实际上，在你躺上沙发、打开短视频App的那一瞬间，你的行为状态就如同被导弹雷达锁定的战斗机一样，陷入了一个难以逃脱的“不可逃逸区”。在这个区域内，你无法仅凭自由意志的微小挣扎从内部挣脱出来，在统计意义上只能坐以待毙。

直到晚睡的焦虑慢慢增长，刷手机的麻木慢慢滋生，两种选项的倾向差距慢慢缩小到自由意志能够干涉的范围时，你才能成功改出这个状态。

换句话说，当你选择拿起手机、躺到沙发上的那一刻，实际上已经在更大尺度的意义上决定了接下来数个小时的虚度。

基于以上观察，我们还可以提出一个进一步的定义：

当一串决策节点的概率差距超过某个阈值（比如90% : 10%）时，我们便可以认定它超出自由意志的干预范围。然后，直接将概率较低的选项忽略不计，把这些微观节点近似粗粒化为一个整体的“不可逃逸区”。

如果从更大尺度上俯瞰，在这些“不可逃逸区”内部，那些看似独立的决策节点，已经被更大尺度的因素（如眼前诱惑、当下情绪、身体的疲惫以及根深蒂固的习惯等）在统计意义上决定。而小尺度的，自由意志的选择，例如刷视频还是玩游戏，具体刷哪一个短视频，反而变得不重要了。

14

alt text 这种在不同尺度下，各个影响因素的重要性此消彼长的现象，并不只限于自控领域，而是广泛存在于各种复杂系统之中。

在统计物理学中，有一个优雅而深刻的理论，称作“重整化群理论（Renormalization Group Theory）”，描述的就是这种现象。1966年，美国物理学家利奥·卡达诺夫（Leo Kadanoff）提出了这样一个思想：

当你改变观察的尺度时，系统内部的自由度会不断被合并（粗粒化），系统的宏观行为会逐渐被少数关键变量所主导，而大量微观变量则逐渐变得不再重要。

为了简单理解这种方法，不妨想象这样一个小游戏：

图来源：Olena Shmahalo/Quanta Magazine

你面前有一个很大的格子棋盘，每个格子上都有一个箭头，方向要么向上（↑），要么向下（↓）。我们可以设计一些规则来影响箭头的朝向，比如：

可以加入一个规则，让每个箭头倾向于和邻居保持一致；
或者反过来，让箭头倾向于与邻居相反；
还可以添加局部的噪音、扰动；
再比如，有时还可以整体施加外界干预；

在这种密集交错的局部规则下，很多微小的扰动，哪怕一个格子的微小变化都有可能扩散到周围，形成复杂的连锁反应。你可能会以为，要分析出整体的规律，得把每一个箭头都统计清楚才行。

但卡达诺夫说：不必如此复杂。只要我们愿意“模糊”一点，看得粗一点，规律就会自动浮现出来。

他设计了一个聪明的“粗粒化”游戏规则：

把相邻的 2×2 小格子合并成一个大格子；
用“赢者通吃”的方式，决定这个大格子的方向（比如三个↑一个↓，那整个块就记作↑，如果数量相同，就随机选一个方向，或者按照某种简单规则处理）；
接着，用新得到的大格子继续重复这个合并操作……

图来源：Olena Shmahalo/Quanta Magazine

经过一轮轮“合并”的粗粒化后，我们的视角越拉越远，越来越模糊。最开始看起来细节纷乱的箭头图，最后只剩下几个大区域，也许大部分方向都趋于一致了。

在这个过程中发生了什么呢？

首先，那些作用范围小，各自为政的局部规则，会在合并时被淹没，或自相平均掉，最终在大尺度上完全消失。那些因此产生的结构因此逐渐式微；
相反，那些范围更广、一致性更强的趋势，反而能在每一层粗粒化中幸存下来，逐渐在更大尺度上凸显；
于是，这种粗粒化不仅会改变格子，还可以改变“规则”本身的强度！一个规则是否重要，取决于你在哪个尺度上看它。在微观尺度上举足轻重的因素，在大尺度中可能毫无痕迹；而那些看起来微弱但一致的趋势，反而可能成为系统最终的主宰力量。

让我们考虑一个简单的例子。

假如，在这个棋盘上，有两种力量在互相角力：

一种是短程的交换相互作用，非常强烈，但仅影响最近邻格子，使相邻箭头趋于一致；
另一种是长程的偶极相互作用，相对较弱，但可以作用于更远距离，试图让区域的箭头朝向相反。

（注：现实世界中还可能存在各向异性能，热涨落，缺陷，应力等复杂因素，这只是一个非常简化的启发式讨论）

Heutling, B., Uebrig, A., & Awerbuch, M. (2023). Wirbelstromprüfung von ferritisch-austenitischen Duplexwerkstoffen und Nickel mit Phasenauswertung in der Wärmetauscherrohrprüfung. DGZfP Jahrestagung 2023, Friedrichshafen, May, Germany

在没有外界干预的情况下，这两种力量之间开始了一场拉锯战：

交换相互作用倾向于让局部格子全都拉成一个方向，形成大量局部同向的小区域；
偶极相互作用又不允许整个系统朝同一个方向太久，它试图从远处“拉扯”这些区域，促使它们之间方向交替，形成相互抵消的排列；

最终，在这两股力量的竞争与妥协下，达成了一种精妙的平衡：你会看到，大片的箭头自动聚集，形成了一块块大小不一、方向交错的“岛屿”。每个岛屿内部方向统一，而不同岛屿之间则方向各异。这些岛屿相互镶嵌，最终稳定成了一种复杂而稳定的“拼图”结构。

在现实世界中，这种现象被称为“磁畴”（Magnetic domains），它正是经典的短程交换-长程偶极竞争模型的结果。

15

那么，当我们在不同的尺度下观察这个棋盘，情况又会如何呢？

在微观尺度下，我们主要看到一片片方向高度统一的局部区域： 此时交换相互作用非常强大，迅速让周围的格子方向趋于一致；而偶极作用由于太弱，在这个微观视角下几乎不可察觉。
但当我们粗粒化到更大的尺度后，我们看到的却是不同方向相互交替的大型区块： 此时虽然交换作用虽强，但作用范围过短，只能影响内部小尺度的统一趋势，话语权不会随粗粒化而增长；相反，偶极相互作用距离足够远，在大尺度下，它微弱的作用不断叠加、缓慢积累，逐渐占据主导地位，形成了明显的宏观结构。

这种现象，就是重整化群思想所揭示的最深刻的一点。

一个因素的重要性，往往取决于你所处的观察尺度——在小尺度中举足轻重的规则，在更大尺度下可能完全被平均掉；而那些在小尺度几乎不可察觉的长程趋势，却可能在粗粒化的过程中层层累积，最终主宰系统的宏观走向。

重整化群思想在不同研究对象中的应用。图来源：Klemm K. A zoom lens for networks[J]. Nature Physics, 2023, 19(3): 318-319.

这就是整个物理世界最普遍的规律之一：

一杯水在微观上是无数分子复杂而无序的碰撞，在宏观上却只用温度、压力和体积几个简单变量就能完整描述；
一根磁铁在原子尺度下磁矩杂乱无章，在宏观尺度下却凝聚出明确的南北磁极；
一根弹簧的每个原子都服从复杂的量子力学，但从外面看，宏观上却只是一个简单的胡克定律 $F = kx$ 。
在金融市场中，小周期的走势无论怎么复杂折腾，最终都会服从大周期趋势定下的剧本。

随着观察尺度的不断拉大，大部分局部的涨落，短程的波动，微观的规则，会自动被合并，被抵消，被吸收进其他变量中。而系统最终的宏观行为，只取决于极少数范围广，一致性强，能在更大尺度上不断积累存活下来的变量。

（注：这两节科普仅是用趣味性方式，说明复杂系统中“系统在不同尺度下由不同变量主导”的现象，仅仅作为对生活启发式的比喻，绝非严谨的推理）

16

alt text 令人震撼的是，像这样的重整化思想，其实可以推广到整个生活本身。

现在，让我们像前面合并小方块“赢者通吃”的规则一样，也为我们生活中的时间线设定一个规则：当一段时间内，各个行为选项间的概率之差超过某个阈值（比如90%:10%）时，我们便认为自由意志不可干预，然后，将这段时间合并，粗粒化为一个“不可逃逸区”。

——你会发现，我们的生活绝大多数的时间，就是由大大小小的“不可逃逸区”，像磁畴一样拼接而成的！

当你深夜躺在床上刷短视频时，就是一个负面的“不可逃逸区”，你大概率不会在中途突然放下手机；

你吃饭的时候，还是一个不可逃逸区，你大概率不会吃着突然停下来去图书馆学习；

你学习的时候，则是一个良性的不可逃逸区，你进入状态后，不遇到阻力也不会轻易停下。

或许你会说：“等等，我们似乎总有一些时刻还有选择的余地吧？”

但很遗憾，拉到更大的尺度来看，那些表面上的自由，又笼罩在更大的“不可逃逸区”下：

你昨天晚上只睡了三个小时，你的剧本大概率是一整天废了，哪怕勉强开始学习也难以坚持，会收敛到一边疲劳，一边在短视频和游戏中交替，靠手机的高刺激来维持清醒的陷阱中，它可以被粗粒化为一个日级尺度的“不可逃逸区”；
如果这个星期你完全没有ddl，作息颠倒，窝在家里无所事事，那么你的行为会收敛到持续性的疲劳→摆烂→作息颠倒→更加疲劳的死循环，这又是一个周级尺度的“不可逃逸区”；
随着期末考试的ddl临头，你这个月的剧本，往往是一开始拖延摆烂→到考前几天又能轻而易举地进入学习状态，最后悔恨为啥不早点开始；回过头来，你发现每到学期末，都会被这个月级”不可逃逸区”的剧本，安排得明明白白。

疲劳且没有ddl的边界条件下，在刷视频和打游戏之间交替循环，可以被粗粒化为日级尺度的稳态

我的朋友，像俄罗斯套娃一般层层嵌套的剧本、循环和不可逃逸区，就是我们生活的真相。

我们的一分钟有几种过法？或许有成百上千种：你可能在刷短视频A，也可能在刷短视频B，可能在读书，也可能在做某一道题。

但如果把时间尺度稍稍拉大一点，我们的一小时可能只有几十种过法；可能就是刷短视频/学习/通勤/吃饭；

到了一天，可能只有十几种过法；一个月，或许只有七八种典型的模式；拉到一年的尺度来看，你可能会惊讶地发现，我们的一年竟然只剩下三四种大致的剧本了。

随着视角拉远，我们将整个事件链逐级粗粒化后，那些小尺度细节的影响越来越小，被逐步平均掉，整个系统越来越被那些对应的大尺度因素所左右，比如环境、工作、习惯、性格等等。小尺度的变量控制着小尺度的剧本，大尺度的变量控制着大尺度的剧本：

你的注意力状态控制着你每一秒钟的思绪；
当下正在进行的事情牵引着你每一分钟的注意力；
今天的日程安排决定了你每一小时具体在做的事；
最近几天的精力和情绪状态，影响着每天的具体安排；
再往上，你的作息规律、情绪周期和环境条件，甚至你的家居布置，控制着你近期的整体生活状态；
而你的身份、性格和社会处境，则决定了你长期的节奏，最终塑造了你整个人生的模样。

在每个尺度下，相应的因素一旦给定，它们就会成为一种稳固的“边界条件”，让系统在当前尺度内，自发地形成若干个最能稳定存在的行为模式，作为当下系统的“稳态”。

在这些稳态当中，我们总是因为相同的原因，沿着相同的步骤，陷入相同的行为模式：

当“昨晚只睡了三个小时”的边界条件确定后，在刷视频和玩游戏这两个小稳态之间交替的《沙发放纵剧本》，就是一天尺度内最容易稳定存在的行为模式。在这个尺度下，几分钟的注意力，一小时的事项，就变得不重要了；
当“最近没有ddl”，”作息颠倒”，”窝在家中”等边界条件确定后，在晚睡，疲劳，沙发放纵几个小稳态之间循环的《全天摆烂剧本》，就是一周尺度内最容易稳定存在的行为模式。在这个尺度下，一下午的精力，一两天的日程，也变得不重要了；
当“考试时间”，“个人习惯”，“外界环境”等边界条件确定后，前期全天摆烂的小稳态+后期突击的小稳态，组成的《考前抱佛脚剧本》，又是这个月尺度最容易稳定存在的行为模式。此时，几天的状态，一个星期的上进心，又变得不重要了。

在这个多尺度的大套娃中，往下看，每种稳态都由若干个更小尺度的稳态组合而成；向上看，若干个这样的稳态又进一步交替重复，组合出更大的稳态结构。

其中，每一个稳态都高度稳定、高度重复，并且高度取决于对应尺度的边界条件。正是这些大大小小的边界条件和稳态，交织在一起，组合成了我们日常生活的“生态环境”。

这么看来，处于最底层的“自由意志”，真是人生中最大的错觉。

我们每一秒都完全地拥有自由意志，每一分钟都看似拥有自由意志，每一小时都比较拥有自由意志，而到了每一天，每个星期，似乎又不怎么拥有自由意志了。在宏观上，我们只是一片在环境，习惯，境遇，性格，利害关系组成的汪洋大海中身不由己，随波逐流的浮萍。

而人类一切自控策略的本质，其实又是用最小尺度的自由意志，在各种规则的支持下，去自下而上地克服大尺度不利因素，撬动更大尺度行为的尝试，这无疑是难如登天的。

所有的努力、口号也好，CTDP也罢，都只不过是试图在这片汪洋大海中掀起苍白而无力的一朵浪花罢了。这就是自制力薄弱的我们，天然会遇到的悲剧。

17

现在，我们终于可以回过头来，更清晰地理解像CTDP这样的局部行为干预策略，究竟会遇到哪些瓶颈。

第一个瓶颈，是“尺度受限问题”：CTDP天然只能影响局部行为，无法撬动这些行为背后的长期因素。

CTDP的核心原理，是通过一系列精妙机制，在短期（比如一小时的专注任务）内放大理性倾向、降低启动阻力，从而极大地提高单次行为的执行力。在微观尺度下，它的确展现出了惊人的有效性。

但问题在于：我们的生活并不是一连串孤立的小时拼凑而成的。“此刻不愿意启动任务”只是表面现象，而造成这种“不愿启动”的更大尺度因素，比如精力状态、情绪波动、明确的目标感、生活节奏甚至长期习惯，才是真正的本质。

当这些宏观因素对你不利时，即便用再强大的策略去强迫自己当下学习一小时，其效果也往往非常有限：

如果你最近熬夜频繁、身心疲惫，你连理智上都不会想学习下去，而CTDP无法解决熬夜本身的问题；
如果你近期完全没有明确的任务、也没有迫切的DDL，那么CTDP同样无法督促你去主动自学，毕竟你从来没有自学的习惯。

因此，CTDP的第一个致命局限，就在于它只能影响微观的节点，却无法向上撼动那些决定我们生活基调的宏观因素——它无法让你精力充沛，也不能让你心态平稳，更不可能动摇你的习惯或生活模式。

第二个瓶颈，是“稳态回落问题”：即便我们短暂改变了生活状态，系统也会自发回落到原有的稳定模式中。

如前所述，当更大尺度上的精力状态、生活节奏、心态、习惯等边界条件被确定后，系统便会自然形成一系列高度稳定的行为模式。比如说，假期刚开始回家时，“打游戏”和“刷视频”可能就是最容易维持的生活模式，于是你的日常大概率会在“打游戏”和“刷视频”之间循环往复。

CTDP的问题就在于，它只能临时地干涉系统的某些节点，即便强行将某几个小时的替换成高效的学习模式，但这又怎么样呢？

系统的稳态，依旧是原来的那套稳态！把时间尺度拉长，这几个小时的高效，还是会淹没在大片的打游戏和刷视频中。有没有那几个小时，在宏观来看根本没有区别。

对于那些被习惯、作息、情绪状态决定的更大尺度（日级、周级）的稳态而言，这几个小时的高效甚至掀不起一朵浪花，更别说对稳态本身有什么改变了。这种微观层面的抵抗，就像试图用一个小箭头的力量去翻转一整块“磁畴”一样苍白无力。

这种自发回落的机制，正是“反弹”、“恢复原状”、“间歇高效”现象频繁发生的根本原因。

第三个瓶颈，也是最为根本和绝望的，是“约束力耗散问题”：任何偏离稳态的尝试，都是在消耗资源（比如意志力）去维持一个亚稳态，而这必然无法长久。

当一个人的行为系统在大尺度上形成了某种稳定结构后，它就像一个自洽的生态系统，具备天然的“稳态吸引力”。任何想要摆脱这个稳态的努力，本质上都意味着需要持续投入各种资源：

或许是你珍贵的意志力；
或许是CTDP所积累的沉没成本；
或许是各种各样约束规则，打卡，监督；

但问题在于：这些资源是有限的。当你试图维持一个偏离原有稳态的“亚稳态”时，哪怕开始阶段非常成功，也会在持续的负面因素中磨损殆尽，最终约束崩溃，回落到原有的样子。就算激进地一次性改变整个状态，其所需要的资源和力量又让人难以维持。

有没有可能存在一个高于当前稳态的，“下一个更好的稳态”呢？

确实有可能。有时，即便在大尺度因素不利的情况下，你也可能偶然连续高效几天。但遗憾的是，这种状态往往可遇而不可求，过不了多久，你的生活又会回到原本的样子。

最可悲的是：几乎所有自控手段，都不具备长期地，整体地，一蹴而就地改变整个稳态的力量。

这些自控手段，都只是在用有限的资源，去支撑那点局部的约束规则，却无力整体迁移。

在负面稳态中那些横冲直撞的干扰下，这些策略就陷入了“按下葫芦起来瓢”的困境——这个策略约束住了学习，却因生活秩序紊乱而崩溃；那个策略规律了作息，又被突然的情绪波动打破，随后不了了之。

这是因为，一个宏观的负面稳态，往往是多个小的负面稳态交叉而成：晚睡导致毫无精神，无精打采时更容易沉迷游戏，沉迷游戏让你追逐刺激，追逐刺激让你更加晚睡。任何一个能在大尺度下站稳脚跟的稳态，背后都有着错综复杂，盘根错节的负面因素。

这些负面因素缠绕交织在一起，犹如常山之蛇，击其首则尾至，击其尾则首至，击其中则首尾俱至。任何改变的尝试，都会被这些因素间的各种耦合关系和连锁反应，缓慢而残忍地拽回原状。

最终，你不得不承认一个残酷的现实：

在资源有限的前提下，所有试图脱离当前基态的努力，几乎都面临同一个命运——短暂成功后迅速回落，无法实现真正意义上的稳态跃迁。

总而言之，这三个瓶颈共同构成了CTDP难以逾越的理论极限。想要从根本上突破这些局限，我们势必需要一种全新的、更具全局视角的第二代方法。

而在数年之后，我才找到了真正能解决这些问题的钥匙。

18

那是一个雨夜，当时我申博刚拿到offer，却又被签证问题卡住，百无聊赖之下点开了一个象棋解说视频。说的是1960年四川棋手访问武汉的表演赛上，李义庭对陈德元的那盘“单马擒王”名局。

讲到最后，解说提到：

行棋至此，红棋已经形成了“三步杀”的局面。

所谓的“三步杀”是什么意思呢？

意思是，进入了这个局面之后，黑棋其实已经必死无疑，无论它如何应对，红棋总能在三轮之内将黑棋杀死。黑棋所有的挣扎，都只能延缓一下自己被将死的时间，甚至如果挣扎不当，还可能让这个时间提前到来。

那么，黑棋为什么会落到这般田地呢？

当然是因为它的上一步棋走错了。如果黑棋能够悔棋，退回到上一步，或许就能避免陷入“三步杀”的死局；如果回溯到上一步时仍然是“四步杀”，仍然无法避免被杀死，那说明上上步棋就已经走错了。以此类推。

你会发现，倘若一直回溯，必然可以回溯到某一步，使得黑棋获胜的希望重新出现！（至少在计算机搜索范围内，红棋找不到必胜法）。

而这一点，恰恰是第二代方法的破局关键。

回到一开始躺在沙发上玩手机的例子。

当躺在沙发上刷视频时，其实我们已经不可避免地进入死循环了，但是，如果我们往前回溯呢？

为了避免开始刷视频（99%:1%:），我们就得避免在沙发上拿着手机（80%:20%）；
为了避免在沙发上拿着手机，我们就得避免把手机带上沙发（60%:40%）；
还可以继续，为了避免带手机上沙发，我们就得避免进入容易带手机上沙发的状态（50%:50%）……

往往在这一系列事件的回溯过程中，你越是回溯到更早的节点，两个选项之间的倾向差距就变得越小！

于是，我们终于发现了一个令人振奋的规律：

对任何一个看似无法逃脱的“不可逃逸区”，我们都必然可以回溯到某一个节点——在这个节点上，两个选项之间的倾向差距足够小，进入了自由意志的有效干预窗口，让我们只需稍加约束，就能避免进入最终那个负面的死局。

——也就是说，每一个看似强大的，大尺度的负面稳态，都可以映射到一个弱小的，小尺度的有效干预节点上！

而这个节点，才是“不可逃逸区”的真正边界所在，也是将小尺度的意志放大，以反抗大尺度的不利因素，唯一的机会。

从这里开始，我们可以做一个排除法：想要通过小尺度的因素（例如自由意志，计划，习惯养成等）来干预大状态，或许有无数种可能的策略。但是，有希望成功的策略，只可能从“从有效干预节点入手的策略”这个解集中诞生。

【注意！这里要澄清一个误解，很多人以为第二代方法讲的就是“回溯”，事实上，回溯这个idea只是其中最浅层10%的内容，真正核心的思想是20-21节论述的多个定式的联动效应，以及用递归回溯算法将它们自然组织起来，渐进改变宏观稳态的过程】

19

alt text

看到这里，有人可能会说了，这不是人人都能想得到的道理吗？你讲了这么多高深理论，又是重整化群，又是行为稳态，又是不可逃逸区的。结果到头来，无非说的就是不带手机上沙发的那一套。

这种东西早就被说烂啦。今天这个博主告诉你，不带手机上床就能改变人生；明天那个鸡汤告诉你，人生逆袭要从小事做起；远离诱惑，防患于未然的道理，几千年前大家就发现了。你拿一堆物理理论就为了说这个，不是大炮打蚊子，故弄玄虚是什么？

但是，我的朋友，请不要着急，这只是我们的第一块积木。

正如前面所述，对任意一种负面状态，我们总能将其映射为一个有效干预节点。倘若我们将有限的约束力精准地施加在这个节点上，就可以用极高的杠杆率，实现“四两拨千斤”的效果，以极小的成本，从一开始就避免进入那些负面状态。这个约束，就算是这个局面的局部最优解。

像这样的局部最优解有很多，举几个例子：

比如，“从一开始就不带手机进卧室”比“带手机进卧室后，忍着不刷手机”容易许多倍，那么，从一开始就不带手机进卧室，自然就是解决“睡前刷手机”问题的最优解；
“进家门后无事可做时马上洗澡”比“已经躺在沙发上玩手机时，强行爬起来洗澡”容易许多倍，那么，手机检测到回家后，自动设置15分钟倒计时，期间必须开始洗澡，就是解决“洗澡拖延”问题的最优解；

当然，“回溯”决不是唯一的技巧。除了上述显而易见的策略外，还有许多方法能找到这样的最优解：

你还可以用“分解”去简化一个行为：比如”晚上11点后禁止玩手机“能帮助你早睡，但做到并不容易；那么，不妨加入”晚上10:30后只允许站着玩手机“ 作为辅助。毕竟，从玩手机到不玩手机很难，但从玩手机到站着玩手机，和从站着玩手机到不玩手机，却都更容易；
其实，最优解未必要针对某个负面状态，还可以对整体状态实施正面改进：你或许知道，每天起床后做的事情，往往可以定下一天的基调。那么每天起床前30分钟不玩手机，只做正事，便可以大大改善一整天的状态；

（这些规定的约束力从何而来，在后面会讲解）

事实上，回溯也好，分解也罢，充其量只是找到最优解的技巧，并不是最重要的部分。

最重要的是：既然我们生活的每个尺度中，都只存在有限种类的，可重复的问题，那么针对这些问题的“局部最优解”，自然同样是可重复的！

在象棋、围棋等棋类游戏中，这样针对某种特定局面、可重复应用的最优操作方案，被称为“定式”。

所谓的定式，其实是无数前人经过深入研究后总结出的局部最优解：在特定局部局面下，黑白双方棋手都必须严格按照定式行棋；任何一方一旦脱谱，就会不可避免地留下破绽。

即便在千变万化的棋局中，棋手们通过熟练掌握一个个局部定式，也能够极大地提升自己的整体棋力。

而我们，也恰恰可以像棋手学习定式一样，用“分治算法”的逻辑来逐个破解生活中的负面状态：

首先，我们可以识别出生活中的典型负面问题；
每个负面问题又可以进一步拆解为若干个负面的稳态；
而每个负面的稳态又都能映射到对应的有效干预节点；
最后，每个干预节点，我们都可以为其量身定制一个精准的“定式”去破解。
每一个定式，都能或多或少地放大我们自由意志的作用，可持续地规避掉一个负面稳态。

如此一来，我们便能将有限的约束力资源，精准地集中在那些最关键，最脆弱，杠杆率最高的节点上，对那些高度重复的负面状态，一个个进行降尺度打击了。

如果四两可以拨千斤，那么何妨用八两去拨两千斤，用十二两拨三千斤，用十六两去拨四千斤？

20

alt text 更妙的是，八两拨动的，可能还不止两千斤。

假设我们真的找到了一个局部定式，并愿意投入一定的资源（比如方法设计、意志力投入，或外界约束）去实施，成功改造了你生活中的一个小局部——比如再也不会带着手机躺上沙发，或者每次回家后都能立即去洗澡。

那么，由于它的作用尺度足够长，这个“定式”一旦存活下来，便相当于为宏观稳态引入了一个“微扰”，像桥头堡一样钉在你的稳态中，成为众多边界条件中的一员！

此时的稳态，还是原来的那个稳态吗？

显然不是了。

如果把最初的稳态记作 $E_0$ ，那么，当第一个定式被成功引入后，你的生活会逐渐进入一个稍有改善的亚稳态 $E_1$ 。在新的稳态 $E_1$ 中，由于状态整体上变好了那么一点点，你再引入第二个定式的难度便会降低一些。

同理，第二个定式加入后，你又进入了更优化的亚稳态 $E_2$ ，在 $E_2$ 中引入第三个定式又会变得更加容易。

为何会这样呢？

前面提到，一个大的负面稳态，总是由大量盘根错节的负面因素，在连锁反应下相互交织而成。倘若直接对抗其中某个小因素，都要面对这种连锁反应的抵抗。

但反过来说，一旦彻底解决了某个负面因素，这种连锁反应，也会让其他所有负面因素都得到削弱。

举个例子，你如果做到了“不在沙发上玩手机”，发生“洗澡拖延症”的倾向，或许会从原来的81%下降到62%，发生“睡前玩手机”的倾向，也会连带地从原来的95%下降到87%。
紧接着，如果你又做到了回家后马上洗澡，得到了清爽的状态，“睡前玩手机”的倾向又会进而从88%下降到73%，第二天赖床的倾向，也会进而从67%下降到60%。

这些事件之间，看似没有直接的关系，但是，它们其实通过情绪，心态，生活节奏等底层变量，间接地耦合在了一起。每引入一个新的定式，都会和现有的定式联动，产生“1+1>2”的效果，并让其他定式更容易引入。

可能在加入了十几个定式后，远处几个看上去和它们毫无关系的难题，就在精力，习惯等大尺度条件的改善下，从99:1的天堑，变成了60:40的窗户纸，甚至悄无声息地自然消解了。

这就像“叠叠乐”的小游戏一样，每抽走一块木板，其他木板都会变得更不稳定，更容易被抽走；如果抽走的多了，可能抽走下一个木板，就会突然导致其他木板成片成群地坍塌。

正如《孙子兵法》所言：“善战者，胜于易胜者也。”

解决了简单的问题，原本中等难度的问题就变成了简单的问题；如果我们又攻克了这个新的简单问题，那么原本困难的问题，也变成了简单问题。

我们从头到尾，解决的都是简单的问题。

但是，事情真的会这么顺利吗？

诚然，我们可以找到一系列定式，像“切香肠”一样，不断引入微扰，渐进地改造整个稳态，最后诱导整个稳态发生相变。然而，随着定式的增多，我们最终还是不得不面对那个最根本的挑战——约束力局限问题。

正如前文所分析的，所有的自控策略，本质上都是在用有限的资源去支撑某种局部的约束规则。这就不可避免地导致了“按下葫芦起来瓢”的困境：刚刚从 $E_0$ 到 $E_1$, $E_1$ 到 $E_2$ ，在叠叠乐中抽木板，说得倒是挺美，但实际上可能发生的是，你根本没有这么多精力去维护这些定式。

比如说，当你试图加入一个新定式时，原来的某个旧定式可能突然崩溃；

再比如，你揠苗助长，一开始就强行上马一个要求过高的定式，还没等它改善整体状态，维护它就耗尽了所有的资源；

还有可能，你引入了一个与现有定式不兼容的新定式，结果导致整个系统瞬间崩盘。

这是因为，当我们加入一个定式时，会带来如下收益：

稳态改善：在加入新定式后，系统会进入稍微改善的稳态，让新的定式更容易加入；
路径探索：在用定式剥除对应问题后，一些原本复杂的大问题会得到简化，露出更深的症结；
习惯内化：随着定式坚持得越来越久，它会慢慢内化为习惯，维护成本越来越低，省下的资源可投入到新定式的开发中；

但同时也会带来如下成本：

维护成本：定式的维护需要调用整个方法的约束力资源维护，越难的定式需要的资源越多；
崩塌风险：随着定式的增多，在复杂多变的大状态下，定式发生崩塌的风险就越高，甚至可能连锁带崩一大片定式，导致挫败感和摆烂；

最后，问题就转化成了“稳态改善速度”，和“维护成本上升速度”之间的竞争问题。因此，引入定式的顺序本身也至关重要，并不是所有顺序能做到“胜于易胜”，支持你抵达下一个稳态。此外，这么多定式的约束力从哪里提供？

为了彻底解决这一难题，我们还需要引入一个新的巧妙算法——“递归回溯算法”。

21

alt text 所谓的递归回溯算法（Recursive Backtracking Algorithm），其实是一种在计算机科学中广泛使用的经典算法思想， 它通常被用来解决这样的问题：当你面对一个可能性极其庞大的系统（例如走迷宫、下棋）时，如何在有限资源的前提下找到一条可行的、甚至是最优的路径。

最典型的例子就是迷宫问题：

想象你被困在一个迷宫里，你不知道哪条路通向出口，也没有地图。你能做的，就是不断尝试每条可走的路径：

每次遇到岔路口，你先随机选择一条路径；
如果走下去发现这条路走不通了（死路），就退回上一个路口，尝试另一条可能的路；
如果新路也不通，就继续回退，再换方向，直到你最终找到一条通向出口的路径为止。

这就是“递归回溯算法”的核心逻辑：尝试 → 失败 → 撤回 → 换路径 → 继续尝试，直到成功。就像在下棋时，通过不断地悔棋来确保找到一条必胜之路一样。

（注意，这里的“回溯“是用来搜索定式加入顺序的，前面的”回溯“是设计单个定式的方法，两者不是一回事）

那么，我们该如何应用递归回溯算法，来设计这些“定式”的添加顺序呢？

假设我们针对生活中的各种负面状态，设计了一系列对应的定式，比如：

保证回家一定洗澡的定式 (A)；
保证不带手机上沙发的定式 (B)；
保证晚上不刷小红书的定式 (C)；
保证吃完饭尽快洗碗的定式 (D)
……

最妙的地方来了——我们可以用下面这种“定式树”的方式来组织和管理它们：

定式的添加规则：如果当天成功做到了某个定式的要求，可以将它作为子节点加入到定式树中，但是每天最多添加一个。 例如，我发现H定式和已有的F定式是高度相关的，那么我可以将H定式作为F的子节点加入；如果发现E定式看起来像是全新的一个领域，我也可以直接建立一个新的分支。
定式的删除规则：以“堆栈结构”来管理，一旦删除某个定式，就同时删除它的所有子节点。 例如，定式C有一次执行失败了，这就说明C定式以及后续的F,H组合并不稳定，那就大大方方地将其删除，同时删除其后续的F，H定式。（当然，未来还可以重新尝试将C定式再次加入树的末尾）

表面上RSIP的画风

在这种自组织的，演化式的搜索算法下，我们便自然解决了“定式加入顺序”的搜索问题，以及“约束力来源”的问题！

一方面，加入得越“自然”，越容易维持的定式，越容易稳定地留在这棵树的根部。

原因在于：在定式树的迭代过程中，如果某个定式的维护成本过高，在当前状态下无法稳定维持，它就会自然崩溃，重新退回到树的末梢；反之，那些加入得轻松、维护得毫无负担、无论状态好坏都能存活，能够“穿越牛熊”的定式，才会被保留在树的根部。

在这种自然选择的演化下，这个定式树最靠前的节点，反而全是些看似鸡毛蒜皮、却能带来巨大正面效应的小规则。你猜我现在的一号根节点定式是什么？竟然只是“在家吃完饭后必须尽快洗碗”。虽然听起来不起眼，却能切实避免掉一个更大的颓废状态。

正是这些简单微小的改良堆积在根部，才会让整个定式树的根基越来越稳固，像游戏中的”叠被动“一样，持续为大状态提供微小的改良，支持整棵树步步为营地前进，这才是真正的”胜于易胜“。

另一方面，这种堆栈结构，也会天然为新加入的定式提供强大的约束力。

试想一下，既然每引入一个定式都需要一天的努力，那么假如某个拥有四个子节点的定式突然失败了，这就意味着你整整五天的努力、整整五个对自控有效的定式瞬间白费——而这种损失，在你准备放弃的瞬间就会发生。

这便是它的第二个妙处：越靠近根部、子节点越多的定式，损失代价越大，因而被保护得越好。

直到最后，那些深埋于根部的定式，会因为执行时间已经很久，慢慢内化成为你的习惯，维持所需的资源越来越少，最终几乎可以忽略不计了。这时，节约出来的约束力便可以投入到新定式的开发中。

而这套方法，就叫做递归稳态迭代协议（Recursive Stabilization Iteration Protocol, RSIP）。

其实，自制力缺失者的处境，就好比在一盘棋局中，和一个局面更好，水平更高的对手（你生活的负面稳态）对弈，所以我们总是输了又输。

但是，RSIP赋予了你无限的悔棋权。通过一个个精心设计的定式，你诱杀了对手的小兵，又用象换掉了对方的一匹马，再让对方的炮动弹不得。渐渐地，棋局变得对你越来越有利，施展其他的定式越来越轻松，胜利的路径也越来越多。

而如果发现某一步走错了，某个定式操之过急，也没关系。在这场对阵强敌的棋局中，你可以无限悔棋，直到将对手——彻底将死。

终于，我们最终实现了自控策略的奇迹：将大量局部最优解集成到定式树中，累积起来，像庖丁解牛一般，将小尺度的自由意志，放大到足以影响全局的地步。

而从这里开始，你可以真的开始改造作息，培养精力，改善健康，调控生活节奏，戒掉你想戒掉的习惯，养成你想养成的习惯，让这些以前看似不可撼动的大尺度因素，开始为你所用。

22

alt text 当然，在实际应用中，如果想把RSIP游戏化，也轻而易举。

因为，在现实中，这套方法早已有一个几乎一模一样的对应物——那就是著名战略游戏《钢铁雄心》系列里的国策树（National Focus Tree）：

实际上RSIP的画风

在这款游戏中，每个国家都有一棵庞大的“国策树”，树上布满了各种形态各异的国策节点：

有的用于工业扩展；
有的强化军事建设；
有的决定外交走向；

每个国策都能为玩家提供各种各样的增益效果，而选择与设计自己国家的国策树，更是这款游戏的最大魅力之一。

现实应用中，我自己也喜欢用思维导图软件（比如MindMaster）来管理这样的国策树；为RSIP设计各种各样国策的过程，其实也极具趣味：

比如，针对晚上的洗澡拖延症问题，我设计的“国策”是： 利用苹果手机的自动化功能，一旦晚上定位从外面回到家里，就自动启动15分钟倒计时，必须在倒计时结束前进入浴室开始洗澡；
又比如，为了应对早上起床后玩手机，导致全天浑浑噩噩的问题，我设计的“国策”则是： 起床后的前30分钟内严禁使用手机，只能用来做一些正事，比如洗漱、整理、吃早餐或看邮件，从而激活一天的状态；
而为了确保RSIP系统本身能够持续稳定运行，我还专门设计了一个位于最根部的“根国策”： 早上起床这段时间，必须打开国策树的思维导图页面，并且，每天必须加入一个新国策。

同时，如果再好玩一点，国策还可以像游戏装备一样进行“强化升级”。

例如，一个叫“作息储备计划”的可进阶国策，则可以安排在早睡早起的国策下面，将手机宵禁/起床时间逐级提前——如果某一天成功做到了22:45/7:45，就记录为“强化+1”；又有一天做到了22:40/7:40，又可以升级为“强化+2”。

这种可升级的国策可以通过储备冗余，把它的基础节点保护起来。因为就算哪一次遇到事情不得不晚睡了，也大可以将其释放，退回到+0的状态，而你习惯的作息节奏不至于突然崩掉（从而导致它的子节点也难以维持）。

事实上，当下网上绝大多数对自制力的讨论，其实都是不成体系，极其零碎的”局部建议“。今天这个营销号告诉你把手机锁起来可以远离手机，明天那个鸡汤博主做了一整期视频，只告诉一个老生常谈的分解目标的道理。他们都言之凿凿地表示，听了他们的方法论，你的人生就颠覆了，改变了。可惜事实上，绝大多数这样的经验，都只是对生活的局部技巧罢了。

然而，我并不完全反对这些经验，而是提供一个框架，把这些局部有用的技巧设计成一个个“国策”，吸纳进这个系统中。

接下来的应用，诸君还可自由探索。

23

文章发布三个月来，我收到了海量的反馈。一个普遍的现象是：许多读者对 RSIP 的理解仍存有不少误区；在实战中，也普遍面临“国策设计”贫瘠的问题——他们往往只能想到诸如“早睡早起”、“坚持运动”这类空泛、高阻力且低效的目标，这既不符合RSIP的原理，也难以执行。

所以，在此补充两节，总结一下RSIP的思路，以及实战中应用的攻略，希望能让更多人少走一些弯路。（另一个建议是，如果理解困难，也可以将本文复制给ChatGPT，Gemini，Deepseek等AI辅助理解）

首先回顾一下思路。有不少人认为，RSIP说的，无非就是“回溯到最容易改正的点，然后循序渐进，习惯养成”这一套罢了，这是一个经典的误解。

事实上，”回溯”和“习惯养成”并不是RSIP的思路中最重要的部分。所谓回溯，只不过是遴选定式的一个小技巧而已，从这个意义来说，它在RSIP整个系统中的重要性连10%都不到。

RSIP的真正核心，是基于递归回溯算法，将大量局部最优解（国策）集成和组织起来，来干预宏观稳态的演化系统。它要解决的，是在资源有限的前提下，如何处理“稳态改善速度”与“维护成本上升速度”之间的竞争，步步为营地搜索出一条整体改变稳态的路径。

直接地来说，RSIP可以总结为如下十步推理链路：

第一个问题：为什么反抗”宏观负面状态”几乎必然失败？

重整化群理论告诉我们，同一个系统，在不同尺度下，会由不同尺度的因素所主导，由此形成大大小小、层层嵌套的“磁畴式”结构。许多小尺度下看似重要的因素，在大尺度下将被平均掉，反之亦然。
我们的生活亦是如此，状态，环境，习惯等不同尺度的因素，也作为生活中各个尺度的边界条件，产生了大大小小的稳态，也就是“不可逃逸区”。每个不可逃逸区，都被这些边界条件锁定，在统计意义上难以被自由意志改变。
无论是自由意志也好，还是CTDP这样的局部自控策略也罢，在宏观的负面稳态面前，都是无力，甚至可以忽略的。试图用这些微观因素反抗，就像在已成型的磁畴内部试图蛮力扭转磁矩一样，长期来看注定失败。

第二个问题：什么样的策略才有可能破解“宏观负面状态”？

然而，我们仍有破局的希望：任何宏观的“不可逃逸区”，无论看起来多么坚不可摧，都可以通过时间轴的回溯，映射到一个微观尺度的、自由意志尚可干预的“有效干预节点”上。唯有在这些节点上，才存在用自由意志阻断负面稳态的可能。
于是，我们可以做一个筛选：所有能长期，可复现地，以微观力量撬动宏观稳态的策略，都只可能在“对有效干预节点进行干预”这个解集中诞生。这个解集，便是我们接下来的搜索空间。
我们将这种策略称为“定式”（国策），每个国策都是一个局部最优解，能以”四两拨千斤”的方式放大我们的自由意志，可复现地解决掉一个负面状态——就像游戏里打BOSS，攻击BOSS幻化出的虚影（在宏观稳态内部挣扎）注定只会落空，只有找到本体（有效干预节点）并精准攻击（引入国策），才能真正让BOSS掉血。

第三个问题：那么，如何把这些策略组织起来呢？

好消息是：国策的加入往往有1+1>2的联动效应！每一个成功立住的国策，都相当于在宏观边界条件中加入的一个微扰，让系统进入一个稍微改善的“亚稳态”。在这个更友好的亚稳态下，引入其他国策都会间接地变得更容易。理论上，我们可以用“胜于易胜”的策略，引入大量微小的国策，像叠叠乐一样把负面稳态逐步瓦解掉。
坏消息是：维持这些国策也需要约束力资源。有些国策难度过高，有些国策性价比太低，有些国策之间并不兼容。如果引入顺序不当，维护成本的上升速度超过了稳态改善的速度，整个国策系统就会瞬间崩塌。因此，国策的加入顺序与组织结构才是问题的核心。
为此，我们可以采用“递归回溯算法”的思路，来探索国策的加入顺序：将所有国策组织成一棵”国策树”。每天最多添加一个新国策作为子节点，但如果哪个节点失败，就必须熄灭这个节点，并递归地熄灭它所有的子节点，使系统整体回滚。
这个算法可以像自然选择一样，自组织地演化出最符合“胜于易胜”的路径：越是性价比高，维护成本低的优质国策，越会自然沉淀到国策树的根部；深植于根部的国策由于失败代价极大，因此受到了最强的保护；相反，那些难度太高的国策，反而会自然修剪淘汰，退到树的末梢，等到系统改善到适合它加入的时机，才可能稳定存在。

24

alt text RSIP实战攻略：如何设计一个“好国策”？

理解了 RSIP 的核心逻辑，我们就能明白为什么“早睡早起”、”每天运动一小时”是反面教材式的糟糕国策。

因为，它只是一个简单粗暴的“要求”和“指标”，而不是对有效节点的干预，甚至连具体的动作都算不上。它的阻力和风险极大，而杠杆率却极低。

那么，一个好的“国策”应该是什么样的？我们可以参考以下原则：

攻略一：农村包围城市——与其死磕某个难题，不如先绕过去

alt text RSIP 实践中还有一个最常见的“反面教材”：在同一个高难度国策上反复“死磕”。

比如，有人反复尝试将“23:00必须睡觉”作为根国策，然后它反复崩溃；这个人不服输，第二天又重置国策树，再次将“23:00必须睡觉”作为根国策……如此循环往复，陷入了巨大的挫败感。

然而，既然这个国策一直失败，系统就是在用“崩塌”这个信号告诉你：现在还不是时候！这个国策，在当前系统的边界条件中，其实是格格不入的。

正确的战术是：农村包围城市。

先打分散和孤立之敌，后打集中和强大之敌。

当一个重要的“城市”国策久攻不下时，不如先放一放。转而像游击战一样迂回穿插，去点亮那些看似毫不相干的、简单的“农村”国策。

比如，“早睡早起”这个大目标，和“吃完饭后必须洗碗”这个国策有什么关系？

看上去当然没有关系，但是，它们其实通过情绪，心态，生活节奏等底层变量，间接地耦合在了一起。

在 RSIP 的自然演化中，每一个你成功立住的“小国策”，无论它多么鸡毛蒜皮，都能成为系统的一个新的、积极的“边界条件”，微弱地改善整个生活的“生态环境”，从而稍微降低其他所有国策的引进和维护成本。

你可能花了几周时间，点亮了十几个看似无关的“农村”国策：

“在家吃完饭后立刻洗碗”
“回家15分钟内必须洗澡”
“不在沙发上使用手机”

你一次都没有去碰那个“早睡早起”的难题。然而，等你把这些“农村”都占领后，回过头再看那个原先坚不可摧的“城市”时，你可能会惊讶地发现，在边界条件极大变化后，它已经像窗户纸一样，一捅就破了。

我们不妨做一个思想实验：哪种情况下，你更容易实现“早睡早起”？

A情况：在一个从早到晚浑浑噩噩，洗碗拖延，洗澡拖延，躺在沙发上玩手机的负面稳态中，强行要求自己“早睡早起”。
B情况：在一个从早到晚被十几个“小确胜”国策加持，生活井井有条，环境清爽的正面稳态中，顺势推动“早睡早起”。

答案不言而喻。

攻略二：零敲牛皮糖——从”鸡毛蒜皮“的傻瓜国策开始

alt text 许多人下意识想出的国策都有一个问题：只想要一刀切地实现某种效果/达到某个指标，例如每天8点起床，每天坚持记日记，却不考虑他们背后的维护成本和风险。

事实上，在国策树刚刚建立，大状态尚未改善的前期，最重要的原则是：只有在最糟糕，最摆烂，最逆风局的一天，也能轻松存活下来的国策，才适合放在根部。

如果把生活状态比作股市的话，一个合格的前期国策，应该有着“穿越牛熊”的能力——像早睡早起，坚持日记，每天运动一小时这样的宏图大愿，往往只有在状态良好的“牛市”才能大显神威；一旦大状态（如工作、健康，情绪）稍有波动，它们就会立刻崩溃，并导致整个国策树的连锁倒塌。

而那些能在状态糟糕的“熊市”也能苟活下来的，反而都是些最鸡毛蒜皮、最傻瓜、存在感最低的微末规则。这些规则虽然看似不起眼，却能保住国策树的下限，在意外的坏状态中也不至于全盘崩溃。

那么，怎么制定这种傻瓜国策呢？一个好办法是将目标其拆分成多个难度极低的小国策。

仍然以“早睡早起”为例，糟糕的国策是这样的：

国策1（早睡早起）：每天23:30必须睡觉，8:30必须起床。

而更科学的设计，是将它化整为零，拆分成以下五个小国策，依次点亮：

国策1（先发制人）：每天无论什么时候起床，起床后30分钟内不得使用“限制组”App（如小红书，抖音）
国策2（夜幕降临）：在手机上设置自动化规则，23:00-次日7:00自动将屏幕调为黑白模式；
国策3（预备仪式）：23:00后可以玩手机，但只能站着玩
国策4（电子宵禁）：23:30后不得使用小红书，抖音等“限制组”App；
国策5（作息储备计划）：每天8:30起床。该国策可强化升级，每升一级，起床时间和国策1-4中的时间均提前15分钟；

你会发现，在这种拆分下，每个小国策的执行难度都极低。

直接要求“23:30必须睡觉”，意味着要在23:29时，突然从“躺着玩手机”的巨大惯性切换到“放下手机睡觉”的巨大阻力，这很困难。

然而：

从”玩手机“切换到”站着玩手机“，很容易；
从”站着玩手机“切换到”站着玩黑白模式手机“，也很容易；
从”站着玩黑白模式手机“切换到”放下手机睡觉“，还是很容易！

就这样，通过一系列微小的”胜于易胜“，用极小的维护成本，兵不血刃地达成了那个最难的切换。其中，“夜幕降临”甚至干脆就是一个纯被动的国策，维护成本几乎为零，你连想失败都不知道怎么失败。

同时，这五个国策的整体容错率也非常高。假如某天DDL压境，你不得不通宵，晚睡晚起了一次，结果会怎样呢？

“早睡早起”的单一国策会直接崩溃。
而在这五个小国策中，只有国策5崩溃了，国策1-4依然存活！有了国策1-4的存活，再把国策5重新加入也是易如反掌。

这便是国策设计最重要的原则：好比朝鲜战场上志愿军”零敲牛皮糖”的战术一样，伤敌十指不如断敌一指——永远不要奢求一蹴而就，要用具体的、傻瓜式的”小确胜”，步步为营地瓦解一个大目标。能拆成三个国策，就不要用两个；能拆成两个，就不要用一个。

攻略三：把鸡蛋放在许多篮子里——用“国策组”来提高容错率

然而，就算我们使用大量轻量级的小国策，也无法确保它在任何情况下都能万无一失。在真实生活中，一个微小的、不可抗的意外（如生病、出差）就可能导致整棵树（以及几十天的努力）连锁崩盘；同时，大量的小国策也会带来条目繁多，管理困难的问题。

此时，我们可以使用另一个小技巧：国策组。

“国策组“的游戏规则是这样的：

我们可以将若干相关的国策（如上述5个作息国策）打包到一个“国策组”中。
国策组作为一个整体，可以像一个大号节点一样，成为其他节点的父节点。
每个国策组都有一个”容错名额”。例如，一个由五个国策组成的国策组，可以设定为”允许一个国策熄灭”。只要点亮的国策不少于四个，整个国策组就还算处于点亮状态，不会导致其子节点的熄灭。

这样一来，不仅可以更直观地分组整理国策树（如晨间国策组、精力国策组、安全国策组等），还能大大提高系统的容错率，确保你的系统不会因为一次“黑天鹅”事件而彻底归零。

攻略四：不破不立——崩塌与重建才是RSIP的生命力所在

RSIP另一个让人头疼的难点，就是久而久之，某些国策节点不可避免地会出现崩塌，导致系统回滚，这往往会带来极大的挫败感。

然而，这绝对是一种好事，我们应该大大方方、开开心心地让它崩塌。

第一个好消息是：崩塌是最高效的“调试器”。

只要一个国策节点崩塌了，无论什么原因，都100%地说明了一件事：这个节点对应的路径，维持得并不够”自然“，无法保证在长期生活中稳定存活——所谓长期，便意味着一切情况，一切状态，一切波动都应该被考虑在内。

而只有这样的崩塌，才能像考试中的错题一样，让我们发现路径的不稳定之处，以及可能的改进：

如果是维护成本太高，那是不是可以拆分成几个更简单的小国策？
如果在疲劳的状态下崩溃，那是不是可以在前面加入避免疲劳的国策？
如果是忘记了，那是不是还可以加入一个“提醒”国策，让自己避免进入“容易忘记的状态”？
如果是根本做不到，那是不是应该换成更合理的要求？

事实上，笔者目前的30个国策，也是在崩塌了四五轮后，花了上百天的时间才探索出来。每次国策的崩塌都能让我找到新的漏洞和解决方案，最终才形成今天的样子。

第二个好消息是：习惯的“内化进度条”不会丢失。 随着时间的流逝，在国策树中点亮的节点，也会慢慢内化成你的习惯，维护成本渐渐降低。而这个内化为习惯的“进度条”，并不会随着国策树的重置而丢失！

比如说，如果一个拥有20个节点的国策树坍塌了，这固然意味着你又要花20天时间来重新组织。然而，它也意味着，其中的1号节点或许已经坚持了19天，2号节点坚持了18天，以此类推。在崩溃时，这些节点内化为习惯的“进度条”已经走了一大段了。

这幅示意图，就是一个简单的模型：绿色越深，表示你越习惯这个国策。

如果这个国策树在第6天的时候崩溃了，所有国策回到了你的”手牌“（国策库）中，但它们成为习惯的进度条依然还在！在第二轮国策树的探索中，哪怕你换了路径，这些旧国策的加入和维持也会更简单，你也因此可以探索得更深。

这就像流行的Roguelike（肉鸽）游戏一样，每轮冒险死亡后，你都可以累积上次冒险得到的部分属性和BUFF，从而更容易打到更深的关卡。玩家们并不会指望第一次就打通关，在“失败-强化-再挑战”的重复中一步步前进，才是RSIP的真正精髓所在。

后记

alt text

25

这篇文章的诞生契机，源于我此前在小红书上偶然看到@Allvinn 的一篇关于ADHD的笔记。当时，只是感触于这些年来自己与ADHD和自控问题苦苦挣扎的经历，随手写了一些评论，没想到却因此萌生了将这些年积累的思考整理成文的想法。

坦白讲，我本人并不是什么特别优秀的人。只是一个非常普通的学生，从小在父母的溺爱和对游戏的沉迷中长大，长期被糟糕的习惯和严重的自控问题所困扰。在过去的人生中，我的成绩也时常在垫底和名列前茅之间反复起伏挣扎。幸运的是，后来一路磕磕绊绊，也读上了研究生和博士，成为了一个平平无奇的科研搬砖工，得以在一方实验台上安安静静做着自己喜欢做的事情。

其实，大多数人自蒙昧时代起，就会或多或少地思考一些与“自律”相关的事情，而我也不过是碰巧将这种思考持续得更久一点而已。

然而，到了文章的结尾，我其实更想传达一个信息：

我极为反感现在许多营销号、知识博主，对“自律”和“方法论”的过度神化和推崇。仿佛只要学会他们的方法论了，参加他们的训练营了，就自律了，努力了，逆天改命了，开始逆袭了。

我并不这么认为。

事实上，自控方法从来不是什么能让人生开挂的灵丹妙药。

即便你实现了绝对的自律，那又能怎样呢？这也仅仅只是你人生无数块拼图中的一块而已，甚至还不见得是其中最重要的一块。

在人生中，比这重要的拼图还有很多——身体和心理的健康，家庭环境，社会资源，个人性格，人际关系，再比如难以捉摸的运气，甚至你所处的时代本身，它们都能像命运的礁石一般，像道尔顿板上的钉子一样，将一个聪颖而自律的年轻人的努力，推向未知的远方。

我们这个时代，确实有不少人苦于缺乏自律；但过度自律，苦于内卷压力和对“优秀”的执念的人也不少。自律从来不是所有人都需要的东西；很多人更需要的，反倒是放松，健康而自由地做自己喜欢的事。

所以，这篇文章的努力，其实只是试图帮助部分的人，在部分程度上，解决部分的问题。

未必所有人都需要自律；

未必所有需要自律的人都适合本文提出的方法；

未必所有适合的人都能理解它；

更未必所有理解它的人都能真正从中受益。

但我自己却真切地体会过，在过去的十几年里，因为缺乏自律而经历的悔恨、错过的机会、产生的内耗与无力感。

人海茫茫中，会不会还有第二个我呢？如果真的有这样一个人，我愿意为他/她撑起一把小伞。

哪怕这把伞在世上每一千个人中，只能帮助到一个与曾经的我相似的人，那这一切，也就足够值得了。

26

说完个人，再说说社会。

时至今日，社会对抑郁症其实已经有了一定程度的理解和包容。但相比之下，对“自制力缺乏”、“拖延症”、“ADHD”等问题的理解与包容，仍远远不够。

如今，对于抑郁症患者，越来越多开明的人开始意识到，这是一种真实存在的心理疾病，而非简单的“矫情”或“想不开”。他们开始试着理解患者面临的注意力崩溃、兴趣丧失、睡眠障碍、情绪迟钝，乃至躯体化带来的真实痛苦。

然而，对于ADHD患者和长期自制力缺失者，人们的态度却往往仍然粗暴、刻薄，缺乏同理心：

他们的拖延、懒散、行动困难，往往被讽刺为“懒人找借口”；
他们陷入注意力涣散、容易成瘾的行为模式，却被看作“自控力差”“管不住自己”；
甚至许多用各种手段挣扎上进的ADHD患者，在为自己的失控悔恨之余，得到的却往往是“自我感动”、“心浮气躁”、“不过是假装努力而已”、“适合进厂”的冷血嘲讽。

在这样的文化氛围中，人们拒绝尊重“人类自制力存在局限”这一客观事实。很多人不愿意承认，人的主观能动性并不是无限的，它受限于神经结构、激素水平、心理状态、外界环境、长期习惯等诸多客观因素。

“自制力缺失”也从来不是靠激励，说服就可以解决的观念问题，而是一个客观存在的工程问题，系统问题，甚至医学问题。

试图用喊口号、讲鸡汤、鞭策激励、”告诉你自己如何如何”的说教去解决这类问题，就像用“你太脆弱了”、“多乐观一点”、“你看开一点不就完了吗”，来劝慰一个抑郁症患者一样可笑。

我很喜欢《了不起的盖茨比》里的那句话：

“每当你想批评别人的时候，要记住，这世上并不是所有人，都有你所拥有的那些优越条件。

正如人类的悲欢并不相通一样，在自律这件事上，人类的各方面条件也不相通。

有些人从小培养了良好的习惯基础，在充满上进氛围的环境中，他们或许只需要列一个计划表，每天对着镜子微笑几下，就能轻松实现Easy难度的自律；
而有些人却从小沉迷于手机，习惯懒散，家庭环境颓废，在这种基础上，实现自律可能是Hard难度的天堑。

自控这件事，作为我们从小普遍面对的问题，又几乎被每个人都或多或少地思考过。那么，如果上述这些人都曾思考过“如何自控”这个问题，结果会是什么呢？

这便形成了社会上对“自律”的普遍认知——或五十步而后止，或百步而后止。

自控方法的本质，不过是对自制力缺口的代偿。就像拐杖和轮椅，是残疾人运动能力的代偿一样。健康人是不需要拐杖轮椅的，伤势痊愈的患者，也不会再需要拐杖和轮椅。

一旦这个缺口被填上后，人们就不再去追求更先进的拐杖轮椅。于是，答案就变成了“小马过河”：Easy难度的人会说对着镜子微笑就行；Medium难度的人会建议你放下手机、制定计划；Hard难度的人则认为必须要靠外界监督，甚至开直播学习才行。

而一个极其反直觉的社会现象，正是来源于此。

在个人成就中，自律其实只是众多因素之一。那些Easy难度的玩家，除了更容易实现自律外，本身还拥有更好的习惯基础、环境帮助和社会资源，从而也更容易获取成就。因此，假如去观察那些取得成就的人，你会发现他们大概率正是从“Easy难度”中走来。在他们眼中，自律本就像在电梯里做俯卧撑一样轻而易举。

这样便形成了一个诡异的幸存者偏差——越是取得成就的人，反而越可能使用低效的自律手段。正如越健康的人，越缺乏使用拐杖和轮椅的真实经验一样。

更可怕的是，当社会将这些Easy模式玩家树立为所有人的榜样，赋予他们至高无上的话语权时，就形成了对真正自制力缺失者极为残忍的、“何不食肉糜”的氛围。

我不知道自己刷到过多少所谓“过来人”的评论，他们对自控方法这件事嗤之以鼻，在他们口中，“我们当年就是华山一条道，干就完了，努力就完了，哪来那么多弯弯绕绕？”

也不知道有多少次，和那些履历完美的精英朋友聊起这个话题时，他们的反应往往是两手一摊，带着一种看破红尘的松弛感，嘲讽道：“其实自律就是伪命题，人生是旷野，想吃就吃，想睡就睡，想玩手机就玩手机，用自己喜欢的方式生活不好吗？”

在这些精英们的感受中，似乎只有过度内卷的焦虑才算苦难。他们从未体会过自制力缺失导致的现实压力，于是学渣们的悔恨与挣扎，不过是执迷不悟的成功学执念，甚至不值得一丝一毫的共情。

还有一次，刷到过一个高考状元的访谈视频。当主持人问及“如何看待许多学生颓废、抑郁，没有动力、无法自律”的问题时，那位高考状元稍稍顿了一下，扬起骄傲而稚嫩的脸庞，诚恳而疑惑地表示：

“说实话，我是不太能理解为什么有人居然会没有动力的。”

也许在他的世界里，自律就如同呼吸和走路一样简单，动力就像每天的太阳一样理所当然。于是，他或许并非带着恶意，只是单纯地，无法理解。

更多的时候，我们还能看到许多顶着光鲜亮丽title的营销号和自媒体博主分享的所谓“自律经验”。点进去一看，全篇说的居然是“因为爱”“因为高能量”，这尚且算是正常的，更多的博主，则是在开班授课，张口“思维模型”，闭口“认知升级”，又是道，又是禅，又是能量升华，又是心灵疗愈的。

我并非批评那些顺风顺水的人，这并不是他们的错。

我只是试图指出一个事实——人类的经历，并不天然相通；人的主观努力，也从来不能脱离客观条件单独存在。

当然，我们不能指望所有人都理解复杂的心理机制、行为科学，我们甚至不能指望每个人都足够善良。

但是，我愿意在那些走了五十步、一百步的人之外，作为一个自制力基础极差的ADHD患者，从最低的起点，去踏上那长达十几年的万里长征。

以至于这两代方法背后，是数百个失败的idea，当前互联网上和相关书籍中出现过的成百上千种方法论，每个我都想过，试过，分析过。这之后，我才算是抵达了终点——终于拥有了一个正常人的自律水平。

或许吧，或许这条路只适合我一个人。但是亲爱的陌生人，若它能帮到哪怕一个人，哪怕只是你，那么我也觉得这一切足够值得。

我希望它，能在当下琳琅满目的“放下手机”“制定计划”想象未来“”告诉自己“的排列组合式的，模糊的“advice”之外，走出一条截然不同的，属于“technology”的新路。

“成吉思汗的骑兵，攻击速度与20世纪的装甲部队相当；北宋的床弩，射程达一千五百米，与20世纪的狙击步枪差不多；但这些仍不过是古代的骑兵与弓弩而已，不可能与现代力量抗衡。基础理论决定一切，未来史学派清楚地看到了这一点。”

这，才是我写下这篇文章最真实的原因。

27

最后再说一下，作者不会将这篇内容本身用于任何盈利，不会建立任何付费社群，也不需要关注和赞赏。金钱可以赚来也可以花去，关注可以汇聚也可以消散，但是思想和技术永远在那里。

倘若这篇文章能有幸使人从中受益，我唯一的愿望，并不是你的点赞和回报，而是希望更多人对条件，习惯，成就，学历不如自己的人能多一分尊重和同理心，我也就心满意足了。

（当然，能留下你的评论就更好了，我会认真看每一条评论）

最后，请让我效仿一个MIT License作为结尾：

任何人都有权利免费且无限制地使用、复制、修改、合并、出版、传播、再授权和/或销售本文中的内容副本，并允许将这些内容用于商业目的，而不必向作者征得许可或支付任何费用，只需注明原作者即可。所有将本文改编成视频，漫画，推文等内容产生的收益归改编者所有，本文作者分文不取。此外，所有打赏，礼物等收益将全部用于推广这篇内容本身。然而，若作者本人付出劳动，参与基于本文的商业化项目（如策划，合作开发等），则相关权益按正常商业标准另行约定。

这篇文章的目的，正是我在这篇回答的结尾中提到的——全世界的无产者，联合起来！