对话陈佳玉：从核聚变到机器人，是攀登AI珠峰的过程

本科毕业于北大工学院，早期研究聚焦于自动驾驶；博士后期间在卡内基梅隆大学，利用强化学习解决核聚变反应堆控制问题。陈佳玉的科研生涯，始终围绕着复杂系统的智能控制展开。

2025 年，陈佳玉开启了全新的阶段：他同时担任博导与原力无限资深研究科学家，研究对象从核聚变转向了通用家用机器人。他试图结合学术界的理论深度与产业界的工程资源，寻找通往通用智能的路径。

在本次专访中，陈佳玉回应了关于“天才少年”标签、中美科研环境差异以及具身智能落地路径等话题。他认为，标签并不重要，重要的是能否精准地定义研究问题，并在有限的资源下找到最优解。

核聚变与机器人，在数学本质上是一样的

DeepTech：回望你的学术生涯，从自动驾驶到强化学习理论，再到核聚变控制，最后回归具身智能。每一次方向转变背后的逻辑是什么？

陈佳玉：我刚开始做科研是从技术角度出发的。起初做自动驾驶的感知，后来做决策，自然而然地接触到了强化学习。博士阶段，我希望能把这个方向做深，于是转向了偏理论和算法的设计，暂时与具体应用解绑。

到了博后阶段，我又想把算法重新落地到应用层面。无论是核聚变里的等离子体控制，还是具身智能里的机器人控制，本质上都是用强化学习去求解复杂的控制问题。一旦锁定了强化学习这个方向，我就一直在沿着它做。

DeepTech：为什么对强化学习这么情有独钟？

陈佳玉：强化学习起源于认知科学，后来经由 Richard Sutton 引入计算机科学。它的学习过程是非常类人的（Human-like）。如果说人工智能的终极目标是发展类人智能，我认为强化学习研究的问题比其他范式更本质。

同时，它也是一个非常综合的学科，涉及到控制理论、统计学、优化理论，对数理基础要求很高。这一点我也比较喜欢。

DeepTech：可以理解为你比较喜欢挑战难题、追求本质意义上的问题吗？

陈佳玉：关于挑战难题，这可能是我刚读博时的一个误区，认为最难的东西必定是最有用的东西。但我现在的 Philosophy 是不要单纯为了做难的问题而做难的问题。如果单纯为了挑战最难的问题而做研究，其实有点太自我了。我现在更倾向于从需求出发，从实用主义出发，用一个有用的技术，解决大家最想解决的问题，这才是做工程、做企业需要着力的点。

关于本质，我认为这也跟你想做的研究的最终目标有关系。我们最终要发展类人智能，所以我认为强化学习是一个有前景的方向，这是本质的。当然，做研究和做企业不同。做研究是追求用最简洁的方式解决最本质的问题。因为解决了本质问题，影响的点会很多，所以本质也是有用的一个方面。

DeepTech：你在 CMU 做核聚变控制是非常硬核的物理科学，现在做人形机器人拿水杯是日常生活场景。这两类问题在数学本质和决策逻辑上有什么异同？

陈佳玉：方法论是一样的。无论是基于真实交互数据，还是基于模拟器建模，从数学本质上讲，它们都可以建模成一个马尔可夫决策过程（MDP）。

对话陈佳玉：从核聚变到机器人，是攀登AI珠峰的过程

凯美瑞更多>>

特斯拉更多>>

比亚迪更多>>

蔚来汽车更多>>

小鹏汽车更多>>

大众汽车更多>>