今年秋季,王明苑正式成为上海纽约大学的一员,担任计算机科学助理教授一职,执教“计算机和数据科学入门”(Introductions to Computer and Data Science)。
王明苑先在浙江大学攻读数学与应用数学专业,完成了本科学业;后赴美深造,在普渡大学专攻理论计算机科学专业密码学(cryptography)方向,获得博士学位。之后,他前往加州大学伯克利分校,加入“2022年人工智能全球最具影响力学者”Sanjam Garg教授的团队,担任博士后研究员,继续科研探索。
旅居美国近十年后,王明苑决定回国发展,继续深耕阈值密码学(threshold cryptography)、安全多方计算(secure multi-party computation)、信息加密防泄(leakage-resilient cryptography)、信息论密码学(information-theoretic cryptography)、黑盒分离(black-box separation)等研究领域。他致力于探索密码学、理论计算机科学与安全之间的联系,以期取得新的突破。
能否简要介绍一下您目前主攻的三个研究领域?
密码学的一项基本任务,是我们通过加密或验证签名(signature),保护信息的私密性或提供真实性。而阈值密码学的总体目标,可以说是将密码原语(cryptographic primitive)阈值化,将密钥分配给多方,增加系统的稳健性和安全性。
比方说两人用邮箱通信,信息在传递过程中,由邮箱的公钥加密,做到内容仅双方可见。而公钥一旦丢失,所有信息都将无法解密。当我们使用去中心化(decentralization),将信任(trust)分摊给多方,并构建各密钥子集和密钥本身之间的连接,这就意味着,我们只需部分密钥子集,即可完成验证、解密信息。
同时,单一实体持有密钥,也很容易成为单点故障(single point of failure),持钥者越多,安全系数越高,因为这加大了恶意软件或黑客将其逐一“击破”的难度。
安全多方计算起源于中国科学院院士、图灵奖获得者姚期智教授提出的“姚氏百万富翁问题”:两个百万富翁想比较谁更富有,又不想透露家底,这要怎么办?安全多方计算研究的就是如何以密码学技术,搭建计算模型,在双方输入各自数值且不被泄露的前提下,正确计算函数的结果。
信息加密防泄是保护信息安全的重要手段。要知道,加密程序的运行时间、电脑的温度这些看似额外的、无害的侧面信息,都可能成为破解原始数据的“最后一根稻草”。而信息加密防泄,是将上述信息在内的一切纳入考量,通过加密算法和密钥将明文(原始数据)转换为密文,防止未经授权的访问和数据泄露,保证明文的安全。
能否举例说明您的研究在日常生活中有哪些应用?
在任何涉及用户数据隐私的领域,我的研究都有可能带来益处。换言之,只要看重用户隐私的场景,都可以尝试使用加密技术。比方说医疗行业,如果两家医院想合作研究肺癌是否与吸烟有关,他们得把数据放到一起,找出二者之间可能存在的关联。这就触及到患者的隐私,我们可以利用安全多方计算来完成这类任务。
再比方说账户资产安全。我们采用阈值加密,通过多方持钥增强安全系数,但俗话说“方便了自己,也可能方便了别人”,反之亦然。一定程度上,密钥持有者数量与安全系数呈正相关,但密钥子集越多,构建连接的复杂程度就更大、更耗时。我正在研究如何以更高效的方式保障隐私安全。
现在生成式AI越来越火,其产物有时能以假乱真,比如之前网上流传的一些特朗普的照片,最后被证实是AI生成的。以通用聊天机器人ChatGPT为例,用户与ChatGPT之间的对话互动包括普通聊天、信息咨询、撰写文本、修改代码等。面对这样的技术背景,如何鉴别学生的作业是否摘自ChatGPT?我们可以给AI生成的文本嵌入数字水印,而非简单地“加盖”水印,通过检测学生作业中的水印信息与ChatGPT生成文本的水印是否吻合,有效判断文本的来源。
我们正在研究如何更高效地验证此类信息是否产自AI,因为就“水印”而言,当前技术的不足在于唯有从ChatGPT中获取很长的标记序列,即数千字的文本,才能嵌入水印。而且,由于文本中加入了水印,ChatGPT处理文本的速度和响应能力会有所下降。
所以我目前的研究,基本目标都是为了提升效率。在密码学应用的各个领域,有衡量效率的不同方法。我期望能优化现有的加密方案,使其更加高效、更易于实际应用,加速技术从理论到实践的转化进程。
为什么选择密码学为研究方向?
偶然的成分更多些。我刚开始读博时,对理论计算机科学感兴趣,这是一个高度数学化的领域,我本科是学数学的,感觉做此类研究,会更擅长。
读博的第三年,我遇到了Hemanta K. Maji教授,他研究的领域是密码学和算法,特别是安全计算和信息论密码学。当时,我选修了他执教的一门课,听他从理论计算机科学的角度讲解密码学,教我们如何运用数学方法搭建这些保障(guarantee)、验证理论。我喜欢这门课的所有内容,主动联系了Maji教授,还参与了几个与密码学有关的研究项目。后来,他成了我的博导。
我发现研究密码学是一件很酷的事情,当你思考加密技术应用于证券等不同领域时,你不会想到这背后蕴藏着多么丰富的数学原理,设立了多少道保障隐私的“关卡”。密码学研究的就是“水面之下”,它更像一种实证分析(empirical analysis),侧重应用,通过数学方法处理领域内的问题。
Maji教授有着非凡的数学天赋,与其说他是密码学家,不如说他更像是数学家。他甚至专门开了一门课,内容涵盖从事理论计算机科学研究所必需的全部数学知识。不夸张的说,我从他那里掌握了密码学研究所需的一切工具。初学时,我未曾料到这些知识将来会在何处派上用场。随着我在密码学的求索不断深入,那些课堂所学总能在我的职业生涯中发挥作用。
因何机缘加入上纽大?
我是南京人,在国外生活了这么久,还是想离父母近一点。来这之前,我对上纽大就有些了解,因为我和上纽大计算机科学助理教授郭斯瑶是熟识,她曾就职于美国东北大学网络安全与隐私研究所,我们都是“加密”这个研究圈子的人。
博士毕业后,我决定在学术道路走下去。其中一个主要原因就是,我喜欢和学生一起工作,这种教学相长的感觉,我很珍惜。
和斯瑶聊天,我能感受到上纽大与我的适配度。上纽大的学生群体构成十分多元,学生们很积极活跃,课下也会来我办公室交流功课。我非常欢迎学生找我答疑,这种氛围,很像我和Maji教授、Garg教授的相处模式,也是我做研究时喜欢的工作方式。我们随时都可以拿起笔,在白板、白纸上写写画画,讨论问题。我曾经的老师们是这样的指导风格,我的指导风格也是如此。之前还有本科生来找我,说想做一些密码学方面的研究,问我能不能一起探讨他读过的论文和讲义,我是非常乐意的。
就密码学而言,国内不少大学都人才济济。上海正积极吸纳该领域的学者,致力于推动密码学研究的发展。我一直非常期待能与这些优秀的同行们建立联系,共同探索潜在的合作机会。之前我都是在上海短暂停留,可能就待一个月左右,就要飞往伯克利了。现在,我终于有充足的时间,能和国内的同道中人多多交流了。
对教学和研究有哪些展望?
教学方面,上纽大计算机科学专业计划每学期都开设一门密码学课程,尽管目前尚未实现,我希望可以推动这门课的开设,吸引更多学生接触密码学,激发他们的学习兴趣。密码学是我的专业领域,也是我热衷分享的话题。
科研上,我基本还是在做与之前差不多的内容,探讨已发论文的后续问题。比方说安全多方计算,围绕这个课题的项目仍在继续,我们正致力于探索更为严苛的安全理念。
拿验证签名来说,密码学将敌手(adversary)控制持钥者的行为称为“腐化”(corruption),并根据腐化的时间和方式,分为静态腐化(static corruption)和自适应腐化(adaptive corruption)。
静态腐化指在协议开始前,敌手固定控制一组持钥者,但持钥者“本质”不变,好的永远不会被腐化。自适应腐化更复杂,敌手通过观察持钥者特征,挑选腐化对象,抓住其弱点,采取金钱诱惑等手段改变其“本质”,获取密钥。这种方式更贴近现实,也更难防范。因此,我们想要搭建一个系统,阻止敌手在任何情况下获得签名。
以往,我们所能证明的安全保障大多是基于静态腐化。然而,当敌手采用自适应腐化时,这些保障就显得力不从心了。系统要具备更高的适应性,才能保证安全性。我们正努力将安全概念从静态提升至自适应层面,实现所谓的自适应安全。
对想从事密码学研究的学生有何建议?
也不好称之为建议,只能说帮大家在决定走进密码学的大门时,少些心理负担吧。
首先就是不要被数学吓跑。我和学生聊天时发现,每次一说到哪篇论文,还没开始读,只是看到那些数学内容,他们就会被劝退,结果读完后发现,也没那么难懂。一般来说,只要你懂代数,就可以阅读密码学领域的很多论文了。
然后要在应用中学习,而非单纯地为了学而学。有位数学家曾说过类似于“数学家也不喜欢学习新的数学知识”的话,他们也是碰到问题、求解无门时,才向新知识“求助”。所以说,如果你想掌握一门技术,最好的办法就是投入到实践项目中,在实战中学习。
再一点可能更关乎加密研究本身。我认为,当你开始学习一种新的密码原语时,思考加密特权(crypto privileges)的定义还挺重要的。试着想想看,人们为什么要这样定义某个概念,比如何为安全,是不是稍微改变一下安全的定义,已有体系就不适用了。这样的思考很有意义,你跳脱出既定理念的框架,设想如果稍做变动,这个框架会“框”不住哪些内容,框架本身会否不再合理。
最后我想说的是——大胆提问。这也是我对上一点的补充。当你实际思考微妙之处时,这些看似与你的研究或课业不相关的点,通过你的提问、由此展开的讨论,可以连成线再到面,如此一来,对你深入学习知识是很有帮助的。