
刚刚,Andrej Karpathy 在推特上发了一条简短的个人更新:“我加入 Anthropic 了。”短短一句话,却在 AI 圈里炸开了锅。有人开玩笑说这像是 KD 加盟已经很强的勇士队,也有人感慨顶级人才的流动又把行业竞争推向了新高度。
我一直挺关注 Karpathy,这个消息出来后忍不住想系统地聊聊他是谁,为什么他的每一次动向都这么受关注。
Karpathy 1986 年出生在斯洛伐克,15 岁随家人移民加拿大。他走的是一条典型的顶尖学术路线:多伦多大学本科,英属哥伦比亚大学硕士,然后去斯坦福读博,导师是李飞飞。博士期间他参与了斯坦福著名的 CS231n 课程--那门把卷积神经网络讲得深入浅出的课,后来成了全球深度学习入门者的“圣经”之一。
真正让他走进大众视野的,还是教学能力。他特别擅长把复杂的技术讲得通俗又不失深度。YouTube 上那套 “Neural Networks: Zero to Hero” 系列,很多人都是靠它从零开始搞懂 Transformer、训练自己的小型 GPT 的。Karpathy 讲课从来不端着,他会把代码一行一行敲给你看,边敲边解释为什么这么写,这种实在的风格在 AI 领域特别稀缺。
职业经历上,他算得上 AI 工业化的亲历者。2015 年就加入了刚成立的 OpenAI,是早期团队成员之一。那时候 OpenAI 还没今天这么声量巨大,大家还在探索强化学习、生成模型这些方向。2017 年他被 Elon Musk 挖到 Tesla,担任 AI 总监,一干就是五年,主要负责 Autopilot 的计算机视觉系统。Tesla 那套从数据收集、标注到端到端神经网络训练、再到自研芯片部署的闭环,很多都是在他那个时期逐步成型的。
2023 年他短暂回归 OpenAI,参与了 GPT-4 相关工作。2024 年又出来创办了 Eureka Labs,想用 AI 真正改变教育,而不是停留在聊天机器人层面。结果没多久,今年 5 月 19 日,他宣布加入 Anthropic,重新把重心放回大模型的研发上。
他在帖子里说,接下来几年 LLM 前沿会特别具有塑造力,他很兴奋能回到 R&D 一线,同时也没忘提教育--等时机合适还会继续做相关事情。这话挺符合他一贯的风格:既务实,又带着点理想主义。
更多AI科技、提示词内容,微信搜索橙市播客小程序
为什么他的加入这么受关注?一方面当然是因为个人影响力。他不是那种只发论文的学者,也不是只管产品的管理者,而是一个既懂底层技术、又带过大规模工程团队、还愿意把知识分享出来的人。另一方面,这也反映了当前 AI 实验室之间对顶尖人才的激烈争夺。OpenAI、Anthropic、Google、xAI……大家都在抢那些真正能把模型推向前一步的人。
AI 领域变化太快,今天的新闻明天可能就被新的突破盖过去。但有些人的存在本身就是一种连续性。Karpathy 就是其中之一。无论他在哪家公司,估计都会继续写代码、训模型、分享思考,而我们这些跟着看的人,也会继续从他的工作中受益。
你怎么看这次跳槽?欢迎留言聊聊。
更多AI科技、提示词内容,微信搜索橙市播客小程序
微信扫描下方的二维码阅读更多精彩内容

声明:本站所有文章,如无特殊说明或标注,均为橙市播客原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。如果你是AI总结,务必加上此版权说明
