中国第一个:清华、腾讯云和英特尔试图使用它。 AI 使数据库理解自然语言。

03-13 10:41

IT 世家 3 月 11 据腾讯云今日消息,清华大学、腾讯云、英特尔于于 3 月 7 日在北京宣布启动“数据库” AI 联合创新计划,围绕数据库和大型交叉技术进行深入研究,推动数据库智能化升级,同时推动数据库智能化升级 AI 构建高效数据基础设施的应用。它也是国内第一个数据库 AI 产学研联动工程领域


由于大型语言模型技术的爆发,数据库系统面临着从“被动存储”向“主动服务”转变的挑战。传统数据库依赖于人工编写复杂的查询句子,而大型自然语言交互能力可以大大降低使用门槛;另一方面,AI 在分布式架构、缓存管理等环节,训练和推理所需的海量数据处理也迫切需要数据库来实现性能的飞跃。


IT 根据这一趋势,世家公告了解到,本次合作规划了两条技术攻坚路径:


另一方面,基于大模型的智能查询生成和优化软件的研发(Text2SQL),使用自然语言的用户直接操作数据库,实现难度较大的数据库系统也能理解“人话”;


另外,为大模型推理打造分布式缓存商品,处理 AI 关键问题,如任务调度、存储资源配置等。


在 Text2SQL 项目组提出端到端技术框架,重点突破语义理解、模式匹配、SQL 验证等关键环节。微调大模型,加强学习(DPO)与检索增强(RAG)技术,系统可以将用户提问拆解成多级任务,动态匹配数据库表结构,最终产生高精度。 SQL 语句。


通过两个阶段的任务调度,项目组通过两个阶段的任务调度,制定了分布式缓存系统,KVCache 优化及 GPU 直接连接存储系统,显著减少了计算资源的浪费。


清华大学数据库研究小组表示:"未来的数据库不仅仅是一种存储工具, AI 产业链数据大脑。希望通过这次合作,为全球数据库技术的发展提供中国计划。”


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com