腾讯云正式发布AI Native向量数据库,大幅企业数据处理效力
7月4日下午,腾讯云正式发布AI Native向量数据库Tencent Cloud VectorDB,可广泛应用于大模型的训练、推理、知识库补充等场景。腾讯方面表示,这是国内第一个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库。
根据官方数据信息,腾讯云向量数据库最高可支持10亿级向量检索规模,延迟控制在毫秒级;与传统的单机插件数据库相比,检索规模扩大了10倍,同时还具有百万级每秒查询(QPS)的峰值能力。
“如果你看好AI模型,就应该看好向量数据库”,腾讯云数据库副总经理罗云表示,随着大模型的不断发展和普及,AI原生数据库将成为企业数据处理的标配。
向量数据库通过向量化数据,然后进行存储和查询,可以大大提高效率,降低成本,能解决大模型预训练成本高、没有“长期记忆”、知识更新不足、提示词工程复杂等问题,突破了大模型的时空限制,加速大模型在工业场景的落地。
腾讯官方数据显示,使用腾讯云向量数据库对大模型的预训练数据进行分类、去重与清洗,相比传统方法可以把效率提高10倍,如果把向量数据库作为模型推理的外部知识库,成本可以降低2-4个数量级。
罗云表示,腾讯云重新定义了AI Native的开发范式,提供了接入层、计算层、存储层全面的AI解决方案,让用户在使用向量数据库的全生命周期,都能借助AI能力。
具体来说,在接入层,腾讯云向量数据库支持自然语言文本的输入,同时采用“标量+向量”的查询模式,支持全内存索引;在计算层,AI Native开发范式可以实现全量数据的AI计算,一站式解决企业构建私有领域知识库时的文本切分(Segment)、向量化(Embedding )等难题;在存储层,腾讯云向量数据库支持数据的智能存储分发,降低企业50%的存储成本。
根据腾讯官方信息,使用腾讯云向量数据库后,企业接入大模型数据所需时间可从一个月缩减至三天左右,大大降低了企业的接入成本。
在产品商业化层面,罗云表示,目前可以单独提供向量数据库,未来不排除将向量数据库和其他相关产品打包出售的可能。
在具体应用层面,腾讯称,该数据库基于腾讯每日处理千亿次检索的向量引擎(OLAMA),数据接入AI的效率比传统方案高10倍,运行稳定性达到99.99%,目前已应用于腾讯视频、QQ浏览器、QQ音乐等30余款腾讯内部的产品中。
以腾讯视频的应用为例,视频库中的图片、音频、标题文字等内容使用腾讯云向量数据库,每月完成的检索计算量高达200亿次,可以满足版权保护、原创识别、相似性检索等场景需求。
从应用结果来看,向量数据库可以直接提高运行效率。官方资料显示,使用腾讯云向量数据库后,QQ音乐人均收听时长增加了3.2%、腾讯视频有效曝光人均时长增加1.74%、QQ浏览器成本降低37.9%。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




