家乡:上海
毕业中学:上海市实验学校
专业:主修计算机科学与技术(计算机科学),辅修数学与应用数学(数学)
在来上海纽约大学之前,2022届的陈昕玥毫无编程基础。四年后的今天,她将以主修计算机科学、辅修数学的专业组合毕业,并收获了包括加州大学伯克利分校、多伦多大学、康奈尔大学、德州大学奥斯丁分校等多所北美名校计算机科学博士项目的全奖录取通知书。她还是两篇发表于机器学习领域顶级会议研究论文的第一作者,以及一篇在投论文的第二作者。取得这样的“跨越式”发展成就,在陈昕玥看来,得益于上纽大通识核心课程的设置鼓励学生灵活自由地探索专业兴趣,以及教授一路以来的悉心指导与严格要求。
陈昕玥来自上海实验学校。她的高中成绩虽然不错,但因为不够稳定而没有自信。她担心如果高考发挥得不理想,分数达不到某个专业的录取线,就要选一个不那么喜欢的专业。而上纽大可以让学生进校后自由选择专业,这一点深深吸引了她。
基于上纽大通识核心课程的设置,大一上学期除了三门必修课,学生还可以修读一门选修课。在研究了众多课程选项后,陈昕玥决定学习“计算机编程入门”(Introduction to Computer Programming)课。“当时只觉得编程是一个很实用的技能,也想看看自己有没有这方面的潜力,”陈昕玥说,“我知道对于女生学计算机,社会上有一些刻板印象。但我和学业咨询顾问聊的时候,他们都很鼓励我先去尝试,并与我分享了很多学姐在这一领域取得成功的例子。”
虽然对编程毫无所知,但试过之后,陈昕玥发现自己其实很擅长编程,并很享受通过编程实现自己的想法,“我也认识到,编程更重要的是背后的逻辑思考,代码本身只是实现想法的工具。”
一天,她参加了学校每年秋季学期举办的专业介绍会,其中,工程与计算机科学学部主任Keith Ross教授在计算机科学和数据学科的专业介绍会上,提及自己会在下一学期讲授“机器学习”(Machine Learning)课。“机器学习是现在很火的人工智能的基础,关注的是如何在经验学习中改善具体算法的性能。在学过了计算机基础课程后,我想挑战更有难度的课程。”
于是,陈昕玥发邮件请教Ross教授自己作为大一学生是否有能力修读这门课。Ross教授建议她可以先学习“线性代数”的知识,再看看开源网站上的课程内容,试着做下相关题目。在完成了这两件事之后,陈昕玥认为自己可以一试,便在大一下学期修读了“机器学习”课,成为这门课上唯一一位大一学生。
陈昕玥非常认同Ross教授的授课方式。虽然“机器学习”是计算机科学领域的课程,但Ross教授不仅只讲授算法或代码知识,而是会在展开任何一个话题前,先和学生推演并厘清算法背后的数学理论基础。“大家可能认为学好机器学习,只要会写代码,进行数据分析就行了。但Ross教授会用近一半的课堂时间讲解背后的基础理论和数学知识,这给我们打下了非常坚实的基础。如果日后要做研究,你需要真正理解每个算法背后的工作原理,知其然知其所以然,这样才能有针对性地调取使用一个工具,并在遇到问题时高效地排除问题。”
在讲解完背后的数理知识后,Ross教授喜欢在课堂上提问,来考察学生的理解程度。陈昕玥都会积极思考,主动回答,“教授提出什么问题,我只要有想法都会讲出来,不用担心是不是说错了。有时,即便同学们的答案‘只是沾了点边’,也会得到教授的鼓励与夸奖,这给了我很大的信心。”最终,陈昕玥的期末考试和结课项目都得到了很好的分数。
尝到了在学习中获得成功的喜悦,进一步激发了陈昕玥对机器学习这一方向的兴趣。于是,她问Ross教授能否跟着他一起做研究。“也许教授认为我表现出了做研究的潜力,就给我了一个机会。”
大一时,陈昕玥在教学楼的计算机实验室进行研究
从大一暑假开始,陈昕玥便加入了Ross教授负责指导的“本科生科研基金项目”(DURF)研究小组,研究如何将深度强化学习(Deep Reinforcement Learning)应用于机器人技术,训练计算机模拟机器人执行跑步等各项任务。研究小组当时有两名上纽大本科毕业直博的博士生,以及另外三名本科生。“教授组里的研究氛围非常好,我们博士学长学姐会手把手教导我一些基础知识,例如如何构思算法并及通过代码来实现一个算法,如果代码出现bug,也会耐心地帮我一起找出问题所在。”
有一次,陈昕玥花了大量时间尝试了很多方式来实现一个新的算法,并得到了一个看上去很有希望的结果,于是她赶快向教授汇报。“没想到,Ross教授并没有很高兴,而是先问我,‘这是不是运行了很多次实验得到的平均结果,是否能很稳定地达到很高的性能’。”这也让陈昕玥理解了做研究应有的严谨的精神,“我认识到做研究需要有一种‘钻牛角尖’的精神,如果觉得某个方向有希望,就应该用多次反复的实验来验证这一结论。如果要否定某一个想法,也应通过多次实验来证明确实不可行。”
功夫不负有心人,最终,陈昕玥以第一作者身份撰写的研究论文“BAIL: Best-Action Imitation Learning for Batch Deep Reinforcement Learning”,在人工智能领域国际顶级学术会议“Neural Information Processing Systems”(NeurIPS)上发表。
此后,陈昕玥继续跟着Ross教授做研究,并在大二、大三两年与Ross教授和研究小组撰写了两篇研究论文,并于大三暑假参与加利福尼亚大学圣迭戈分校的暑期科研项目。她对于发表在机器学习领域公认国际顶级会议之一“International Conference on Learning Representations”(ICLR)上的这篇“Randomized Ensembled Double Q-Learning: Learning Fast Without a Model”,感到非常自豪。
“在我申请博士项目的过程中面试了很多教授,好几位教授都表示看过这篇论文。比如加州大学伯克利分校的教授们有一系列相关研究论文,在跟我交流时,就提到我们的这篇论文给了他们新的角度,”陈昕玥说,“虽然有了这样的成绩,但我清楚地知道,做研究的过程远没有当初想得那么美好,其间伴随着一次次的失败、挫败,需要你不断调整心态再出发。”
“昕玥在编程、数学和算法方面具备扎实的知识和出色的技能。可以说,她已经是深度学习和强化学习方面的专家,”Ross教授说,“她的学业成绩优异,而她最大的优势在于创造性的研究思维与能力。她对研究充满热情,又有天赋,已经具备了博士生水平的成熟度。很高兴能在过去的几年里与她一起工作学习。”
两篇顶级会议发表的研究论文以及本科四年来的科研经历,让陈昕玥叩开了直博的大门。对于最终会选择哪所大学,陈昕玥仍在考虑中。“希望未来会做有关机器学习领域的新的研究,成为这个领域的专家,能去推动这个领域的边界。哪怕只是向前推动了一点点,也是个人对于人类社会的小小贡献,”陈昕玥说,“我认为,机器学习研究的价值既取决于它的实验表现,也要看它对塑造我们所处世界的潜在影响。我一直密切关注机器学习研究中的公平性问题。而机器学习模型 ‘不公平’的一个重要原因是其不平衡的数据集,我的目标是尽可能在这个问题上取得进展。”
回顾在上纽大的四年,陈昕玥最喜欢的一点是学校鼓励学生以自由灵活的方式,探索自己的学业兴趣。“在这里,大家都会鼓励你找到自己真正的兴趣和潜能,学校不会设限,而是会助力支持你取得跳跃式发展,”陈昕玥说,“我也和一些想从事计算机科学研究的同学分享过自己的经历,其中很多位都是女生。我对他们说:‘不要害怕尝试之前没有尝试过的事,不要觉得一定要做好万全的准备,才能去学一门学科。只有迈出第一步,才能发现自己究竟适合不适合。如果是自己真正擅长的,你会有无尽的动力冲出条条框框,不断探索与拓宽边界。’”