美国考虑AI「登月计划」,重磅发布了陶哲轩62页的报告!

2024-05-08

新智元报道


编辑:Aeneas 好困


【新智元导读】就在刚刚,陶哲轩领导的62页报告发布了,总结和预测了AI在半导体、超导体、宇宙基础物理学、生命科学等领域带来的巨大变化。如果这种预测能在几十年后实现,美国会考虑AI。「登月计划」就把成真。


就在刚刚,陶哲轩领导的一份关于全球研究潜在影响的AI技术报告发布了。


本报告近62页,总结了AI在材料、半导体设计、气候、物理、生命科学等领域的变化,并预测AI未来可能发生的变化。



报告地址:https://www.whitehouse.gov/wp-content/uploads/2024/04/AI-Report_Upload_29APRIL2024__SEND-2.pdf


陶哲轩等人除了总结AI工具在科学领域发生了变化的插曲外,还发出了三个呼吁。——


必须赋予人类科学家更多的权力;


每个人都必须负责使用AI工具;


国家层面需要共享基本的AI资源。


AI基础设施一旦到位,就是新的科学。「登月计划」将成为可能


众所周知,AI——它可以帮助研究人员从数据中获得更多的洞察力,并确定最可能的解决方案;它可以帮助处理日常任务,使研究人员能够专注于核心研究;可以帮助实现实验室过程的自动化;可以帮助完成之前难以实现的模拟;各种形式的数据可以通过多模式的基本模型聚集在一起,在不同的科学支系之间创造新的协同作用。


当资源到位,可以提供计算率、安全数据共享服务、开源AI模型等关键基础设施的访问时,我们就可以开始规划那些非常复杂和巨大的「登月式」科研项目。


这类项目可以包括:


- 一种模拟人类细胞复杂性的基本模型,允许在计算机上(而非试管或活体内)研究疾病和试验性治疗;


- 一个详细的整个地球模型,用传统和AI模型来描述地球系统的组成部分,同时不断更新高度多样化的实时动态;


- 实用的室温超导体是通过平台收集、处理和AI协助分析当前数据和文献,以及自动化实验室合成和检测可行的备选物来发现的。


伴随着共享AI资源基础设施的出现,全新的合作形式将在规模效应中获得实质性的好处,换句话说,随着项目规模的扩大,产品成本将会降低,效率也会提高。


同时,这种合作还可以减少不同团队之间的重复工作,提高研究效率。


学科领域即将被AI颠覆。


目前,人类科学已经到了这个阶段的临界点。在很多领域,每个人都面临着巨大的障碍,一旦这些障碍被克服,这些领域的进步就会进入一个新的阶段。


令人兴奋的是,这些现在靠自己很难再推动太多的突破,靠AI很可能会被处理!


当然,为了实现这些想法,我们也面临着一些必须考虑的潜在风险,我们还需要实现目标所需的资源。


AI设计半导体,让美国成为第一。

现在,支撑世界经济和国家安全的现代电子产品,都需要依靠「芯片」来运行。


伴随着这些芯片功能的提高,其复杂性也随之提高——目前最先进的芯片已包含数百亿个部件。



由于需要庞大的工程资源和复杂的基础设施,只有最大的企业才能制造这些高端芯片。AI可以显著提高ic设计质量,同时减少所需的时间和数量。


当然,这些AI工具并非取代设计者,而是通过提高设计者的工作效率来缓解专业芯片设计者的短缺。


现在专门为芯片设计师开发的AI辅助工具很多,可以让初级设计师花很多时间去处理那些原本需要高级设计师的问题。



与此同时,一些ic设计AI智能体也可以对错误报告和设计文档进行总结,或者根据简单的英语提醒为其它设计自动化工具生成脚本。


https://arxiv.org/pdf/2311.00176


即使是在开发中的AI,也能制造出比传统方法更快或更小的电路。.


AI在实际配备可能的电路时,通过使用强化学习技术,会收到正面的电路。「奖赏」和负面的「处罚」,因此,它可以调整其设计策略,最终找到具有理想特征的电路原理方法。


伴随着半导体技术的飞速发展,每一次变化都需要重新设计成千上万的标准设计模块,从而适应新的制造工艺。对于很多厂商来说,这个过程可能需要80个月的劳动力。


相比之下,生成式AI是用来纠正设计规则错误的数据聚类和强化学习,可以自动化这个设计过程,将所需的工作量减少1000倍以上。



论文地址:https://dl.acm.org/doi/pdf/10.1145/3569052.3578920


同时,FPGA的应用促使最新的AI驱动放置和走线技术能够快速迭代,提高了效率的三倍以上。



为了保证其符合要求的标准和制造过程的约束,在ic设计的创建过程中,必须对设计进行多种分析。


过去,为了准确掌握,「寄生」特性,首先要做好电路布局图,这一步常常会使设计周期的每一次迭代都增加几天的手动工作。


现在,整个设计迭代过程可以在几分钟内完成,从而快速得到符合预期规格的电路。


不久,更强大的LLM将化身为「ic设计助手」——他们不但可以回答问题,评估和验证设计,而且可以执行一些常规的设计任务。


此外,AI技术可以大大提高设计师的工作效率,可能会增加十倍甚至更多。设计师只需要把注意力集中在算法和系统上,把更详细的设计交给AI。


而且AI的合成和分析工具会大大缩短设计周期,从高层次的设计描述到完成测试的布局只需要几个小时,现在这个过程需要几个星期。


PCAST预测,美国将继续保持半导体设计领域的领先水平,通过将这些前沿技术融入芯片制造过程,有效改善该领域严重的劳动力短缺。


甚至实现了美国半导体产业的宏伟蓝图——开发了一个全新的平台、方法和工具,只需要现在十分之一的人力就可以促进芯片生产。


揭示宇宙基础物理:1分钟模拟超算1个月

至于宇宙,这些谜题从来没有回答过。


是什么「暗物质」把星系结合起来?


又是什么「暗能量」促进整个星系之间的距离加速膨胀?


最近观察到的那些古老的星系,意义何在?


对宇宙的基本理解,可以使我们在技术上取得飞跃。


比如,我们可能很难想象一个基本理论比广义相对论更抽象,更脱离实际。然而,它是全球定位系统GPS的基础,解决了我们以前从未想过的定位和导航问题,其经济效益以1000亿美元计算。


如今,AI已成为科学家和宇宙学家在实验和观测过程中的重要工具,用于设计、实现和分析大部分步骤。


一些AI的应用是基于当前的方法,通过计算模拟来比较和测试理论和数据。例如,如果一个理论是正确的,数据看起来会是什么样子。


新物理通过条件密度估计进行无监督分布内异常检测


对超级计算机来说,这些模拟可能是最困难的任务,因为它们需要计算每个颗粒、行星或星系行为的每个步骤。


但是AI的优点是可以从这些模拟中学到更多的模型。通过这种方式,科学家可以缩短这些超级计算的任务,这样他们就可以在不到一分钟的时间内看到一个超级计算一个月工作量的相似值。


通过AI,研究人员可以扫描数百万种可能的理论,每一种都有我们字体差异的初始图像,他们可以看到哪一种可以更好地解释我们在实际使用眼镜时看到的数据。


到了2030年底,我们可以使用AI来分析Nancy。 Grace Roman眼镜十年数据。


Nancy Grace 太空望远镜Roman


通过AI分析数据,科学家很可能会发现惊人的证据,证明我们的字体不会在指数膨胀的冷静中结束,而是会反复发生大爆炸和循环重启。


AI具有集中发现复杂数据模式的能力,变量的数量远远超过人类可以追踪的总数。


如果有新的发现打破了常规规律,就会脱颖而出。


一些颗粒科学家已经举办了一场比赛,寻找这些搜索。「异常」最好的方法,后者很可能指向新的物理发现。而且比赛的优胜者都是围绕AI发现的。


宇宙流体力学的有效物理定律是通过拉格朗日深入学习生成的,暗物质的超密度、恒星质量、电子动量密度等。可以在混合模拟中预测。


在下一代CERN和费米实验室加速器实验中,这些AI方法很可能会发现一些极其罕见和意想不到的颗粒,这有助于构建统一的理论,将重力与其他力结合起来。


基础物理和宇宙学都集中在数据统计分析上,因此有必要对数据解释中的概率有深入的了解,这也促进了AI在处理概率严谨性方面的发展。


因为,AI应该做的不仅仅是提供最有可能的答案。(「这是一张猫的照片」),相反,开发AI系统可以提供一系列可能的答案,并为每个答案提供正确的可能性。(「有69%的可能是一只猫,22%的可能是土豚,8%的可能是汽球,1%的可能是冰箱。」)。


科学家们正在寻找一种理论来统一量子物理和广义相对论。


对一个关键数字的测试,它会给出一组可能值,例如68%、概率为95%或99.9%。


对于基础物理来说,评价不确定性尤为重要,严格遵守概率的AI也会给很多其他科学领域带来改变,对于科学事故的应用也极其重要。


也许20年后,科学家们会用AI看到量子计算机和黑洞之间的对比,开启一种全新的台式方法来检测广义相对论,以及一种强大的新时序技术。


新材料:超导体,冷原子,拓扑绝缘体,超导量子比特

曾有一段时间,人类生活质量的重大改善,是由黄铜、铁、混凝土、钢等材料的科学进步推动的。


现在,我们生活在硅、氮氧化合物和磷酸盐的时代。在不久的将来,也许是纳米材料、生物聚合物和量子材料的时代。


而且AI的辅助,会打开许多过去只存在于想象中的可能性,包括室温超导、大规模量子计算机架构。


在劳伦斯伯克利国家实验室的A-Lab中,机器人复合材料


现在,科学家们已成功地利用深度学习模型来发现许多材料。


例如,一家私营公司的跨学科研究团队使用AI设计了数百万种新材料,近一半的AI预测的新材料具有足够的稳定性,可以在实验室中成长。


另外,AI还可以用来改善当前的材料,提高材料成分,减少对环境有害的物质。



密度泛函理论示例用于预测材料拓扑性质。


美国国家科学基金会为解决重大社会挑战而设计和开发新材料。(NSF)已投入7250万美元。


具体而言,下列遇到障碍物的材料领域,很有可能会被AI处理。


超导体

去年夏天的室温超导热,让全社会都感受到了奇点临近的兴奋。


超导体是磁共振成像仪、粒子加速器、一些实验量子计算技术和国家电网必不可少的,因为它可以无损耗地传输电能。


但是,超导体面临三大问题。


首先,目前已知的超导体必须冷却到接近绝对零度,即零下273摄氏度,这就需要使用液氮,导致设备极其昂贵。


其次,与铜等传统导体不同,现有的超导体不具有可塑性, 超导性会随着时间而丧失。


三是前驱材料的成本,或者制作成导线的成本,也都很贵。


从前,我们的尝试都是依靠组合化学方法,需要选择大量的材料组合。


人类已努力了100多年,以获得常温常压超导。


所以,许多很重要的材料发现,都是出于意外,在此期间经历了大量的试验和错误。


如此多的变量,使得材料价格低廉的要求如此之难,使得超导体的发现基本上不可能用传统的方法来处理。


而且AI,将在三个领域发生变化。


第一,AI模型的预测能力,使我们能够通过连接和利用大量的现有材料、处理条件和性能数据来发现新材料。


通过这个数据集中,可以确定化学、物理和工程材料的方法,为研究者提供新的方法。


基于GNoME的发现,显示了基于模型的过滤和DFT如何作为数据飞轮来改进预测。


其次,人工智能模型可以预测性能(例如,相对于时间、热电材料的效率或超导体的临界压力),从而减少检测可行备选材料的浪费。


三是通过将过程信息与材料构成相结合,可对材料设计进行实际限制,加快新材料应用的商业化进程。


除超导体外「硬」材料、聚合物、液体等。「软」材料,因为材料科学中复杂的结构-性能关系,同样需要巨大的数据水平和预测能力。


此外,冷原子、拓扑绝缘体或超导量子比特等量子计算机的基本构建部分,都可以通过AI进行改进或生成。


超导芯片具有4个量子比特


生命科学

美国国家科技委员会认为,AI驱动的工具、分析和结果将从根本上改变我们探索和理解生命的基本组成部分的方式,也将影响包括农业和医学在内的生命系统。


揭开细胞功能的谜团


由于细胞结构极其复杂,相互关联,解读细胞内部复杂的运行机制,是几个世纪以来困扰生物学家的难题。


因此,AI提供了强大的工具。


举例来说,AI为蛋白质提供了一个新的视角。


基于AI的蛋白质折叠预测系统,通过机器学习算法,可以预测数百万种蛋白质的结构。



基于大规模深度学习的结构建模范围从单个蛋白质扩展到蛋白质组装


这类系统从已知的蛋白质结构数据中学习,也从原子间距物理约束等基础化学知识中学习。


最近,研究人员还使用AI来破解蛋白质的功能,包括蛋白质如何相互作用,从而揭示细胞信号转导、代谢和基因调节等分子机制。


为了达到与受体和其他目标特异性相结合的目的,人工智能工具也被用来设计蛋白质。


人工智能驱动的蛋白质设计在疫苗研发和新药物方面取得了成功。其中一些设计方法正是使用的。「扩散模型」以及图像生成系统的添加和描边技术。


利用三轨神经网准确预测蛋白质结构和相互作用


构建生物科学基础模型


构建生物信息学模拟工具,一种很有潜力的方法就是构建多模态、多层次的生物科学基础模型,面向整体细胞。


AI法使科学家能够对各种类型的数据进行多模态表征,或者「嵌入」,包括蛋白序列和结构,DNA、来自电子健康记录的RNA数据、临床观察、显像数据和数据等。


普通生物分子建模采用RFAA进行


例如,结合DNA,开发集成大型数据集的基本模型EVO,、为了澄清细胞整体功能背后的相互作用,RNA和蛋白质数据。


这一多模式、多层次的模式,可以提供从原子到生理的各种规模的结果预测,以及分子和行为的形成。


生物学基础模型有望让科学家探索健康和疾病的本质,比如建立癌症模型,探索细胞的相互作用,以及如何在模拟中破坏或破坏癌症背后的网络。「治愈」。


AI指导药物研发,AI可通过虚拟筛选隐性化合物,减少不必要的浪费,然后开始昂贵耗时的试验。


五点建议


PACST委员会提出了以下五点建议,以实现上述技术进步。


建议1:基础AI资源共享普遍公平

广泛支持容易浏览的共享模型、数据、标准和计算能力,尤其重要的是要保证学术研究人员、国家和联邦实验室以及能够利用AI为国家创造利益的小公司和非营利组织。


在美国,最有希望的试点项目之一是国家人工智能研究资源(NAIRR),PCAST建议尽快将NAIRR扩展到特殊工作组构思规模,并获得全额资助。


完整的NAIRR可以作为美国或国际AI基础设施项目的基石,连接行业战略合作伙伴关系和联邦和州的其他AI基础设施,从而促进高知名度的研究。


建议2:扩大对联邦数据集的安全浏览

PCAST强烈建议扩大现有的安全数据访问试点计划,制定联邦数据库管理指南,然后加入最先进的隐私保护技术。


这些数据集包括允许获批的研究人员有限、安全地浏览联邦数据,并允许将匿名数据集发布给NAIRR等资源中心。


此外,PCAST希望进一步实施此类授权,包括在联邦资助研究数据上共享培训的AI模型,并提供足够的资源来支持所需的行动。


建议3:支持AI领域的基础和应用研究,包括学术界、工业界、国家和联邦实验室以及联邦机构之间的合作

联邦资助的学术研究与私营部门的研究之间的界限是模糊的。许多研究人员将在学术机构、非营利组织和私营公司之间流动。其中,私营公司目前支持AIR&D的比例相当大。


为充分利用AI在科学领域的潜在优势,必须对各种有前途、有成果的假设和方法进行研究。


因此,为了促进创新研究与不同部门的合作,资助机构需要放宽对如何与工业界合作的态度,以及哪些研究人员可以得到支持。


建议4:选择负责任、透明、值得信赖的AI使用原则,在科学研究过程的所有阶段。

在科学研究中,AI的使用可能会导致不准确、偏见、有害或不可复制的结果。因此,这些风险应该从项目的初始阶段进行管理。


PCAST建议,联邦资助机构可以更新其负责任的研究行为规范,要求研究人员提供负责任的AI使用计划。为了最大限度地减轻研究人员的额外行政负担,机构需要在列出主要风险后,提供降低风险的示范流程。


同时,国家科学基金会(NSF)以及国家标准与技术研究所(NIST)等待机构应继续支持负责任、值得信赖的AI科学基础研究。


其中,衡量AI准确性、准确性、公平性、韧性、可解释性等属性的标准标准;当标准不在定义范围内时,监测这些特征并进行调整的AI算法;以及评估数据集中的误差,区分生成数据和真实世界数据的工具。


建议5:在科学工作过程中,激励选择创新方法,将AI协助融入科学工作流程。

这是一个很好的科学职业。「沙盒」,在训练、研究和评估人员和AI助手之间,我们可以采取新的合作方式。


然而,这里的目标并不是为了最大限度地提高自动化水平,而是让人类研究者在负责任地使用AI辅助的同时,实现高质量的科学研究。


资助机构应重视这些新工作流程的出现,设计灵活的程序、评估指标、资助方式和挑战性问题,鼓励组织和实施新的AI协助科学项目的战略实验。


另外,这些工作流的实施也为各学科的研究人员提供了机会,从而促进了人机合作领域的知识。


更广泛地说,我们还需要更新资助机构、学术界和学术出版业的激励制度,以支持更广泛的科学贡献。例如,通过传统的研究生产力指标,无法充分认可规划高质量、广泛可用的数据集。


参考资料:


https://mathstodon.xyz/@tao/112355788324104561


本文来自微信微信官方账号“新智元”(ID:AI_era),作者:新智元,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com