敬畏心
一个有底线的人,往往内心会有一种价值观:有些事可以做、有些事不能做
即便没有人看着,也不会轻易越界
这个判断的底层动力,就是敬畏心
但是,如果一个人缺乏敬畏心,那么,对应的底线感与边界感,也就没有了
首先,任何事情,其实都有它的底线和边界
缺乏敬畏心,会让人缺乏“底线”意识,这类人的特点:
- 对后果不敏感,觉得踩线“没什么大不了”,不了解系统性的代价
- 对关系不敏感,以为所有人都应该理解自己、包容自己
- 对规则不敏感,觉得规则不必遵守
- 对自己不敏感,不能很好的认识自己,往往过于盲目自信
这些特点叠加,会很容易失去底线感与边界感
为什么会有很多人,缺乏敬畏心呢?
一个人没有敬畏心,本质上是因为“看不见、更不相信比自己更大的东西”,底层逻辑其实就是:无知 → 无畏 → 无敬畏
敬畏心往往来自:意识到自己是有限的、意识到世界比我大、意识到边界存在、意识到代价真实存在
成年人要重新建立敬畏心,其实很难,但也有方法,核心逻辑是:通过有价值的反馈系统来理解和认识,才能慢慢重拾
成年人失去敬畏心,往往是因为看不到世界的复杂度。所以,要想改变,就需要去看到更真实的世界,比如和更高维的人接触,更系统性的学习,去看到和面对一些残酷的真相
敬畏心=“面对复杂系统的谦卑”,敬畏心也不是“被教出来”,往往是“被现实教出来”
缺乏敬畏的人容易失控,有敬畏的人反而稳、准、自由,因为他不会冲动越界,不会陷入自毁循环
驾驭杠杆
高效的赚钱本质上就是在“驾驭杠杆”
你只需要学会驾驭一个杠杆,或者最多两个,就足够把人生拉开巨大的差距
比如,管理杠杆、软件杠杆、媒体杠杆、资本杠杆……
每一种杠杆都有它的力量与特点,关键是,不要试图去驾驭所有杠杆工具
如何理解杠杆?
杠杆本质上是一个“用更小的输入撬动更大的输出”的机制
有三个核心特点:放大能力(既可以正面放大,也可以负面放大)、 可复制性和边际成本下降
这是一种有时间复利的能力
没有杠杆的人用的是“线性时间”,有杠杆的人用的是“指数时间”
所以理解杠杆,就是理解:
如何让你的时间不再按小时卖,而是被放大、被复制、被传播、被长期积累
但是要驾驭杠杆,其核心就是专业能力
比如,如果你不具备软件方面的专业认知,就很难驾驭它;如果不具备资本方面的专业认知,也很难驾驭资本杠杆
所以,专业能力本身不是杠杆,但它是“驱动杠杆的力量源”
专业能力做的是把“力量”变大;杠杆做的是把“力量结果”放大
对大部分而言,其实没有必要掌握所有杠杆,他只需要掌握“属于自己的那个杠杆”,管理、软件、媒体、资本这些杠杆,就像四种不同的武器,只需要精通一把,就够用了
好问题的意义
答案是成本,好问题才是收益,一个好问题,本质上就是认知催化剂,而且是那种低成本、高增益、快速反应的催化剂
如何理解?
- 催化认知
好问题能让大脑从线性思考跳到结构思考,直击本质
比如:
哪个环节是最大杠杆?
如果只能做一件事,会是哪件?
- 压缩与聚焦
比如:
这件事的本质只有一个,那是什么?
这件事的“反直觉点”在哪里?
真正限制增长的那个变量是哪一个?
- 催化结果
好问题的真正价值,不仅仅启发思想,而是推动行动
比如:
下一步最该做、并且只需要做的一件事是什么?
有没有一个动作能以最低成本验证我们的假设?
马拉松的意义
马拉松是一种把人生压缩进几小时的方式。
每一场马拉松,都让人把“坚持、痛苦、自我怀疑、突破、防崩、节奏控制、策略调整、身体反馈”这一整套人生课题,在42公里里体验一遍。
在这个过程中,有三个关键点:
- 你能控制的,其实比你以为的多
配速、呼吸、补给、步频、心态、预期管理……
这些都是可以通过平时的训练,可以持续优化、可以做得更好的地方。
久而久之,我们会在生活里也产生一种感觉:
原来很多事情,只要系统训练、长期坚持,都能变得不同
这就是跑者的底层自信
- 痛苦不可避免,但崩溃是可以管理的
跑到30km后,大部分人都在和自己的大脑谈判。
你会发现:
-
痛苦不是让你停下来的理由
-
但“如何面对痛苦”,是一个能力
-
这个能力可以练出来,也能迁移到工作、创业和人生里
于是你慢慢懂得:
不是不疼,而是你学会了带着疼继续前进
- 马拉松是最便宜的“人生再造仪式”
越是成年以后,越缺少可以让人“重新定义自己”的仪式
但跑一场马拉松,你就会获得一次很真实的、深刻的自我刷新:
-
你知道自己不是昨天的你
-
你看到自己还能突破
-
你变成了一个能对自己负责的人
人生里的很多“自由”,其实都来自这种“自我掌控感”。
马拉松帮你把这种东西稳稳地装进身体里。
元思维链
分享一篇来自论文《别光会给答案,还要教会怎么“想”和“改错”》的核心观点:让大语言模型不仅会回答问题,还要学会思考、探索与纠错
传统的思维链虽然能让模型“逐步思考”,但仍是“线性生成答案”的“系统1”式的思维,缺乏深度推理与反思能力。
论文作者指出:真正复杂的问题(如数学证明或逻辑推理)需要模型能在推理中进行搜索、验证、回溯与改错,即系统2推理。
1. 元思维链:Meta-CoT
论文提出一个新框架:Meta-CoT(元思维链),它在传统CoT之上再建一层“思考的思考”。
公式化表示为:
问题 q → 潜在思考过程 z₁→z₂→…→zₖ → 显性推理步骤 s₁…sₙ → 答案 a
其中 z 表示被省略的“思维过程”——即模型在生成推理步骤前的探索、假设和自我修正。
传统CoT只学习(s₁…sₙ),而Meta-CoT还学习(z₁…zₖ),从而让模型具备元推理能力
2. 关键机制与技术路线
- 搜索与验证
在推理时引入搜索过程,如 Monte-Carlo Tree Search、A算法,通过过程奖励模型评估每一步的合理性。
- 自举式学习
模型自生成→验证→筛选→再训练,逐步强化“如何思考”的能力
- 元强化学习
通过强化学习让模型在“思考策略层”上进行优化,学习怎样搜索、验证、纠错
-
端到端训练管线
-
先进行指令微调,用线性化的搜索轨迹作训练数据
-
再进行强化学习后训练,实现可泛化的System 2 推理
-
3. 效果与验证
-
性能提升:在数学推理任务上,具备Meta-CoT的模型在高难度题中显著优于普通CoT模型
-
计算规律:更复杂的问题会激发模型生成更长的思维链,说明模型在内部进行了“思考-搜索-修正”循环
-
与现有模型关系:论文指出OpenAI o1 系列与DeepSeek-R1已展现部分“内化搜索”特征。
作者提出“生成-验证”假设:
模型生成一个复杂推理远难于验证它是否正确。Meta-CoT的本质就是通过建模这一搜索-验证循环,让模型在内部模拟“生成-检验-改进”的过程。
这篇论文的逻辑概括:
别光会给答案,还要教会模型如何思考与改错。
4. 如何应用?也就是如何通过这个底层逻辑,来快速改造自己的提示词?
一共7个技巧:
- 从“结果导向”改为“过程导向”提示
原始提示词(传统CoT):
请一步步推理并给出最终答案。
改造提示(Meta-CoT版):
请不要直接求答案,而是:
先列出你可能采取的3种不同思路;
比较每种思路的优缺点与风险;
选择最优路径并完成推理;
反思:若结果错误,你会在哪一步改?
效果:
模型从线性推理变为显式探索+验证式思维,更贴近论文中“search+verification”的Meta-CoT流程。
- 引入显式“Verifier角色”
论文提出“Process Reward Model (PRM)”思想——让模型评价自己的过程而非结果。
可在提示中加入一个“内置审查者”。
改造模板:
你分饰两角:
思考者(Thinker):提出推理步骤;
验证者(Verifier):审查每一步是否符合逻辑。
请交替输出Thinker与Verifier的对话,直到Verifier确认逻辑成立。
效果:
让模型在一次推理循环中自带“系统2检验”,显著减少幻觉和逻辑漏洞。
- 嵌入“搜索预算”信号
论文强调模型在“推理计算预算”(inference-time compute)下的可变推理深度。
因此,可在提示词中加入动态探索深度控制。
改造模板:
你可以花最多5轮思考来寻找最佳答案。
每轮请记录:
当前假设
检查结论
若错误,请回溯(Backtrack)并尝试新路径。
效果:
通过“回溯信号”,引导模型在复杂问题中使用更深层Meta-CoT推理,而非早早收敛。
- 引入“错误制造+改正”机制
论文提出的“Backtracking Objective”训练方法中,给模型看错误样本并学会修正。
提示词中也可模拟这种“自我修正”流程。
改造模板:
请先假设你做错了,写出一个可能的错误思路;
然后分析这个错误的原因;
最后重写正确版本,并总结你从错误中学到的思维规律。
效果:
让LLM具备“错误—反思—优化”的认知循环,对应Meta-CoT的自校正机制。
- 结构化地分层输出(Search → Verify → Revise)
论文的Meta-STaR方法将搜索轨迹线性化为训练序列。
提示词中可直接规定输出结构。
改造模板:
效果:
输出自动具备元推理结构,可用于GEO内容生成、AI教学、Agent分析等多场景。
- 加入“思维轨迹可解释化”约束
论文提出“线性化搜索轨迹”理念——让模型显式地写出思考路径。
改造模板:
在推理过程中,请显式写出:
“我为什么要这样想?”
“我怎么知道这步是对的?”
“如果错了,我如何发现?”
每步必须有“思维理由”。
效果:
提升推理透明度与一致性,有助于知识图谱或AI教学Agent输出。
- 引入“多Agent协同推理”
论文提到“Meta-CoT = 多路径探索 + 验证聚合”。
提示词可模拟多人合作。
改造模板:
设有三个专家:
A:快速直觉型
B:系统分析型
C:批判验证型
他们依次讨论并共同决定最终答案。
效果:
复现论文提出的“多路径生成+合并+反思”机制,相当于在提示层模拟Meta-CoT搜索树。
论文原文: