登录
首页 > 大众汽车 > 对话陈佳玉:从核聚变到机器人,是攀登AI珠峰的过程

对话陈佳玉:从核聚变到机器人,是攀登AI珠峰的过程

发布时间:2025-12-07 16:30:39

本科毕业于北大工学院,早期研究聚焦于自动驾驶;博士后期间在卡内基梅隆大学,利用强化学习解决核聚变反应堆控制问题。陈佳玉的科研生涯,始终围绕着复杂系统的智能控制展开。

 

2025 年,陈佳玉开启了全新的阶段:他同时担任博导与原力无限资深研究科学家,研究对象从核聚变转向了通用家用机器人。他试图结合学术界的理论深度与产业界的工程资源,寻找通往通用智能的路径。

 

在本次专访中,陈佳玉回应了关于“天才少年”标签、中美科研环境差异以及具身智能落地路径等话题。他认为,标签并不重要,重要的是能否精准地定义研究问题,并在有限的资源下找到最优解。

 

核聚变与机器人,在数学本质上是一样的


DeepTech:回望你的学术生涯,从自动驾驶到强化学习理论,再到核聚变控制,最后回归具身智能。每一次方向转变背后的逻辑是什么?

 

陈佳玉:我刚开始做科研是从技术角度出发的。起初做自动驾驶的感知,后来做决策,自然而然地接触到了强化学习。博士阶段,我希望能把这个方向做深,于是转向了偏理论和算法的设计,暂时与具体应用解绑。

 

到了博后阶段,我又想把算法重新落地到应用层面。无论是核聚变里的等离子体控制,还是具身智能里的机器人控制,本质上都是用强化学习去求解复杂的控制问题。一旦锁定了强化学习这个方向,我就一直在沿着它做。

 

DeepTech:为什么对强化学习这么情有独钟?

 

陈佳玉:强化学习起源于认知科学,后来经由 Richard Sutton 引入计算机科学。它的学习过程是非常类人的(Human-like)。如果说人工智能的终极目标是发展类人智能,我认为强化学习研究的问题比其他范式更本质。

 

同时,它也是一个非常综合的学科,涉及到控制理论、统计学、优化理论,对数理基础要求很高。这一点我也比较喜欢。

 

DeepTech:可以理解为你比较喜欢挑战难题、追求本质意义上的问题吗?

 

陈佳玉:关于挑战难题,这可能是我刚读博时的一个误区,认为最难的东西必定是最有用的东西。但我现在的 Philosophy 是不要单纯为了做难的问题而做难的问题。如果单纯为了挑战最难的问题而做研究,其实有点太自我了。我现在更倾向于从需求出发,从实用主义出发,用一个有用的技术,解决大家最想解决的问题,这才是做工程、做企业需要着力的点。

 

关于本质,我认为这也跟你想做的研究的最终目标有关系。我们最终要发展类人智能,所以我认为强化学习是一个有前景的方向,这是本质的。当然,做研究和做企业不同。做研究是追求用最简洁的方式解决最本质的问题。因为解决了本质问题,影响的点会很多,所以本质也是有用的一个方面。

 

DeepTech:你在 CMU 做核聚变控制是非常硬核的物理科学,现在做人形机器人拿水杯是日常生活场景。这两类问题在数学本质和决策逻辑上有什么异同?

 

陈佳玉:方法论是一样的。无论是基于真实交互数据,还是基于模拟器建模,从数学本质上讲,它们都可以建模成一个马尔可夫决策过程(MDP)。

Copyright 2018-2025 汽车星 版权所有  京ICP备2019162790号