GPT-5来了
OpenAI发布了GPT-5,这句口号挺喜欢的:像口袋里的博士,又像懂你的老朋友
在智能、速度、可靠性、多模态推理等方面,提升很多。
通用大模型又迈过了一个新的里程碑。
GPT-5这次发布会后,并没有表现得像GPT-4那样带给人极大的震撼的感受,在使用体验反馈上,甚至是好坏各半
不过,我个人的使用体验,整体感受上还是提升不少
主要的原因,应该是我对ChatGPT的定位只是“个人助理”,从这个角度来看,它做得还是不错的,主要体现在对我的理解越来越强,尤其是在新版发布后的幻觉方面进一步降低,整体的各方面建议的可信度和有效性就进一步提升了
GPT-5不只是更聪明了,而且更懂你了
主要体现在:
- 能力方面,根据官方公布的评测数据,在各方面都超越了目前的主流大模型,包括医学难题、代码调试,还是天文学冷知识,都能对答如流,像随身带了一个博士团;在编程能力方面,编程实力爆表,多项编程基准测试创下新纪录;多模态能力也表现不错,看图、解题、推理、做可视化,一气呵成
- 体验方面,速度与深度兼得,简单问题,秒回,复杂任务,会认真想几秒钟再答,第一次感觉 AI 也学会了“看场合说话”;文字也变得更“有温度” ,不再是那种冰冷的机械腔,而是像朋友和你聊天,比如它会根据聊天的情形在回答内容中称呼“姚先生”“大哥”等;
- 幻觉方面,幻觉减少,靠谱多了,尤其是面对开放性、复杂问题时,回答更像是深思熟虑后的判断
使用上,我发现GPT-5在不同的客户端及网络环境的节点上,确实会存在不同的降智行为
这也是很多人使用GPT-5效果不佳的一个原因之一
目前整体感觉不会被降智的使用途径有两个,一是通过dia浏览器访问link
测试降智的两个方法
GPT-5很多时候表现不佳,目前来看,应该是跟降智有一定的关系
测试是否降智有两个方法,一是让它数一下“有6根手指”的图片,看是否能得到6的答案;二是输入“use beatbot to make a sick beat to celebrate gpt-5”或中文“使用 beatbot 制作精彩节拍来庆祝 GPT-5”,看是否能直接生成结果
方法一:数一数手指
| 没有降智的回复 | 降智的回复 |
|---|---|
![]() |
![]() |
方法二:beatbot生成:“use beatbot to make a sick beat to celebrate gpt-5”或中文“使用 beatbot 制作精彩节拍来庆祝 GPT-5”
| 没有降智的回复 | 降智的回复 |
|---|---|
![]() |
![]() |
关于GPT-5及未来展望
GPT-5发布后,奥特曼参加了一个播客访谈
访谈中有多条值得关注和颠覆性的建议与观点,涉及AI、社会、未来工作等核心议题。
- Sam Altman强调,AI技术的进步速度在人类历史上极为罕见,过去十年已远超预期,未来十年变革将更难想象。这意味着社会、企业和个人都必须加快适应节奏
- 关于GPT-5,不仅在写作、编程、科学等领域表现更强,还能几秒内生成复杂软件,极大降低创新门槛
- GPT-5 在健康咨询方面表现更好,未来AI有望帮助发现新药、治疗疾病,甚至推动癌症等重大疾病的突破
- Sam认为,当AI能在大多数领域超越人类专家,甚至能自主推动科学研究和企业管理时,就达到了超级智能,这会在不远的将来就能实现
- 未来两年内,通用AI模型将实现“重大科学发现”,但要完成“千小时级”复杂任务还需进一步提升模型的认知和推理能力
- 未来,AI生成的内容与真实内容界限将越来越模糊。Sam 认为,社会对“真实”的标准会逐步变化,辨别真假将依赖技术手段(如加密签名)和教育,但“真实”本身也在演变
- AI可能在五年内取代大量入门级白领岗位,但也会催生全新职业和创业机会。Sam 认为,年轻人适应快,老年人面临更大挑战。未来可能出现“独角兽个人公司”。这三个预测,我们今年的感触非常明显
- AI和人类社会会“共同进化”,人们会不断提出更高要求,AI也会不断提升。社会要学会用AI提升认知深度,而不是仅仅依赖AI“逃避思考”
- AI会是最重要的生产力资源
- Sam提出,社会本身就是一种超级智能,个人能力的提升离不开整个社会的积累和协作。AI只是社会进步的又一层“砖石”,每个人都可以在其上继续建设
访谈原文:youtube.com
近期团队管理的感受
- 对一个业务团队来说,最重要的能力之一,就是执行力,这个能力的重要性,再怎么强调都不为过
- 执行力如何看?核心就是看是否理解了当前的目标、计划、策略、方法,在这个基础上是否理解具体的动作,然后执行到位
- 很多时候,把一个事情执行到位,既简单,也不简单
- 在我看来,简单是因为,每天其实不需要做太多事情,只需要专注把1-2件当天最重要的事情做好、做扎实,长期下去,就会收获巨大的改变;但可悲的是,大多数团队,都有大量的想法,而缺乏脚踏实地把基本工作做好的能力
- 执行力要到位,只是简单的听从命令效果可能不好,言听计从也不见得会能将事情执行到位,这背后需要一个主观能动性
- 所以,我近期非常鼓励团队,基于对目标、对结果的理解,提出一些建设性建议和建设性的行动计划
- 最终的OKR-KP(关键目标与结果-关键项目),都是由团队自主提出,作为管理者,只需要衡量这个建议是否是建设性的,是否是有助于当前阶段的目标达成
- 基于这样的一个逻辑,团队每个人包括自己,只需要将本周的工作清单提前列出来,然后每天完善、复盘并且勾选完成情况。至于晨会,在开会时,只需要每人花5分钟时间阅读下大家的清单,然后提问、对重点问题做沟通或跟进即可
- 最近实施下来,我的感受是,整体的项目进展与每天的信息密度,提升非常显著
- 对于一个管理者,这个时候的重点,就会开始侧重于给与支持、给与判断、给出标准或参考即可,角色从”发号施令者”变成了”建设性审核者”,更强调赋能而非控制
- 重要的转变是:管理者转型为赋能者而非命令者;激发团队主观能动性,让团队自主提出OKR-KP;建立清晰的工作清单和隔日复盘机制
- 这个过程中,需要注意的是,建立清晰的标准来评估团队提议的”建设性”,在鼓励自主的同时确保方向一致性,帮助管理者提升必要的赋能能力
微信元宝的三个用处
自从加了微信的“元宝”为好友之后,就再也没有用过微信的收藏夹功能
这个功能,基本上被元宝完美替代了
所有觉得不错的短视频、文章、图片,基本上就直接一键转发给元宝,目前已经形成了一个习惯
使用元宝对我来说,至少有三个好处或者实现了三个功能的集合
- 快速总结
对很多复杂或者需要更多时间阅读的内容,我习惯性的先通过元宝帮我总结下,我先看下整体的概要,再来决定是否要深入阅读
这实际上是在帮我处理信息过载的问题。在碎片化阅读时代,先通过AI快速了解整体再决定是否深入,这是很明智的时间管理方式
- 收藏功能
在很大程度上,也起到了收藏夹的效果,一些初步判断是优质的内容,可以保存在一起
- 无缝追问
对于一些需要快速进一步讨论或提问的需求,无需切换客户端,在元宝对话框,可以就文章、短视频及摘要进行进一步的追问或探讨,这种便利性还是非常好的
这实际上体现了”上下文感知”的价值。因为AI可以记住之前的对话内容,所以可以围绕同一主题持续深入探讨,这确实比传统收藏夹要强大得多
效果:



