等不及Sora的老铁,奔向快手可灵

2024-08-02

率先卷出 AI 为什么视频厂商是快手?


文 | 陈梅希


编 | 园长


Open AI 在大型飓风席卷全球的最初时期,Aautorapper并不是一个闪亮的角色。当时百度拿出一句文心话,阿里拿出通义千问,腾讯拿出混合元大模型,互相追逐,R&D和开放速度都很快。


快手并没有在最初的竞争名单上,即使是现在,也很少有人能叫出快手大语言模型的名字:酣畅。


对局在今年 6 月 6 每天都在变化,快手视频生成大模型可灵开启首测申请,那天也是快手。 13 周年纪念日。媒体常将可灵和 Open AI 的 Sora 对比,但从 2 月亮爆炸之后,Sora 迟迟没有向公众开放。于是,好奇的中国顾客开始涌向可灵。


10 天后,可灵“已收到数以万计的申请”,这一数据来自当天参加智源大会的万鹏飞,演讲时,他的称号是快手视觉生成与互动中心的负责人,也是可灵的实际负责人。到达 7 月 19 每天,申请人数超过100万。从一万个数量级到一百万个数量级的申请增长只用了一个多月,这是上半年各大厂商大模型进展中最引人注目的表现。


可灵产生的照片,提示:蜜蜂在花丛中


翻身仗的故事总是受到大众的欢迎和欢迎。但仔细盘点背后的Aautorapper大模型业务,就能发现,这不是一部低调蛰伏后诞生的酷剧,也不是超级天才带领小团队的英雄叙事。


基于可灵生成的图片进一步生成的视频,提示:蜜蜂飞来飞去


率先卷出 AI 为什么视频厂商是快手?是项目需求带来了强大的动力和优先级,是产品形式下的数据和技术积累带来了迭代速度,是需求场景的匹配带来了真正的客户。


可灵的出现,并非偶发事件。在国内,快手在 AI 在视频领域,最大的对手,很有可能来自字节跳动。


只有有需要,才能有动力


在快手内容生态中,创作者是最重要的环节之一。据快手官方公布的数据显示,2023 2008年,第一次在快手发布短视频的创作者就有了 1.38 亿,全年发布的视频在平台上获得超过平台 1 一万亿次赞美。


拥有大量内容创作者意味着Aautorapper需要满足他们对内容工具的需求,否则追求新生产力的创作者很快就会奔向其他工具甚至其他平台的怀抱。这也是Aautorapper和剪影对字节的价值。


所以快手之前在语言模型上的投入并不激进,但是在多模态大模型的竞争中却要争取上游。


在可灵之前,快手自主研发的文生图大模型能力已经接入快手。内部测试的结果是,客户每月在评论区生成 5 亿 AI 照片。


可灵产生的照片,提示:外星人站在长江边


虽然需求带来的强大动力是诞生的必要条件,但并不是只有Aautorapper有这些要求。如果灵魂的出现有什么重要的影响因素,那可能就是决心。


第一个决心来自快手高层。


在此之前,Aautorapper在模型上的动作总是比较慢。说到国产大语言模型,大家都会率先想到文心和通义;说到大语言模型的应用,市场上风头正劲的是 Kimi 还有豆包。在文生图领域,中国市场率先出圈的是商汤日新月异。 5.0 ——发布第二天上午,商汤科技股价上涨超过 临时停牌30%。


在之前的一系列故事中,Aautorapper处于一个看似边缘的位置。视频模型及其应用是其在风口纠纷中最不容错过的节点,也是整体大模型布局中最重要的部分。


在科技媒体硅星人的报道中,可灵团队的技术人员表示:“盖坤经常说公司的卡都是给大家用的,公司大力支持。”盖坤是于越,是Aautorapper的高级副总裁,是主站线的业务负责人,也是社会科学线的负责人。之前 CTO 陈定佳卸任后,盖坤成为快手技术线最高负责人之一。


也许万鹏飞和他的团队有更大的决心。其中一个细节是,万鹏飞在决定接手可灵项目后,将原来承担多项需求的工作交给了张迪团队的其他同级负责人。相应的,可灵团队的其他人也把原来的业务交给了自己,全力投入到可灵的研发中,周末加班赶进度是正常的工作状态。


基于可灵生成的图片进一步生成的视频,提示:外星人在水中行走,两个外星人击掌


“其实一个多月前正式发布的时候,可灵的测试效果并不是很好。”一位大型行业从业者告诉刺猬公社,“老万是最后一站。后面真的是‘大力创造奇迹’,很多人都没想到会有这样的效果。”


所以决心成为最后一个变量。


只有积累,才能有速度


快手,或任何一个头部短视频平台,正在研发中 AI 视频积累体现在内容和技术两个方面。


视频由用户生产,通过平台标注理解,选择可分发的内容,这是Aautorapper领域模型中固有的路线。处理后的内容成为一种数据。从内容本身的描述到分发后的人气,Aautorapper掌握了大量的内容数据。通俗地说,他们既有内容,又知道什么是用户喜欢看的“好内容”。


对于生成式视频大模型训练来说,这个过程就像是提前准备好菜肴。


即使是“厨师”也是现成的。


可灵项目组的核心R&D成员大多是万鹏飞。 Y-tech 老部下阶段。年初,团队成员接连接触到相关信息和资料,正式进入可灵研发工作。


此前,万鹏飞团队主要负责承担快手创作生态的责任。 UGC 智能化创作需求,与主站生产、快影、一甜相机等业务方紧密合作,产品形式包括人像美化、视听效果、直播虚拟形象等。


2021 2000年,万鹏飞在全球人工智能技术会议上发表了“ Y-tech 部门 AI “身份公开演讲”技术平台负责人,在当时共享的案例中,有“活照特效”——图生视频在前大模型时代的玩法。一开始,快手和快影的模板库已经推出了“移动老照片”的特效。客户上传照片后,照片中的角色可以微笑、眨眼、点头等操作,形成视频效果。据报道,这种动态特效超过了快速电影的用量 344 万。


快手网友 @森屿和鹿 2021 每年都会发布会动的老照片视频


2021 年万鹏飞对生成技术的发展非常有信心,并提出“生成模型会越来越强大,产生的内容会更真实,产生的过程会更稳定可控。”


三年后,可灵再次以“复活老照片”作品走红。一些申请使用权限的用户通过“图片视频”功能将死去亲人的照片变成了视频。与三年前的“活照片特效”相比,客户可以通过开放的指令让照片中的角色完成更复杂的动作,这是新大模型技术带来的变化。


Sora 发布于今年 2 月,快手可灵团队开始在接近的时间点建立,但多模式驱动的视频生成技术的研发和应用一直在万鹏飞及其团队的工作范围内。


上述从业人员向刺猬公社表达了类似的观点:“实际上 Sora 它的出现相当于让我们在那个节点确定技术路线或方案,但他们一直在做很多应用视觉技术的事情,包括多模式。"


灵魂所需的技术积累来自这里。当厨师遇到准备好的食物时,在世界各地看到一个新的食谱后,Aautorapper成为最快的成品团队之一。


但与此同时,上述从业者也对灵能在技术和产品上是否常年处于领先地位持观望态度。“每个人现在使用的算法都差不多。每个家庭可能都有一些微调,但差别还不错。”在他看来,有卡、有数据、有算法差不多,每个家庭做出效果相近的产品只是时间问题。


所以速度只是快手暂时的优势,他们需要在领先的窗口期,真正把优势转化为稳定的用户。


只有有了情景,才能有顾客


2020 年 12 月 29 日本,快手作为企业价值观的“快手派”首次在内部全员信中正式发布,并称“痴迷客户”是快手价值观的核心。


以前,无论是快手内部还是其它大型互联网公司,更常被提及的概念是“客户”。所以,快手特意解释了这个词变化的原因。"企业业务复杂性上升, ‘客户’ 拓展到 “顾客”,顾客包括生产者和顾客,B 端客户和 C 终端用户,外部客户和内部客户。对于生产者,我们需要加强,B 客户的理解和认知,我们还需要强调内部客户的服务意识。"


站在 2024 年复一年,这的确是快手业务结构变化的重要分界点。2020 2008年,快手全年收入中,直播收入占前一年的比例。 80.4% 下降至 网上推广服务收入占56.5%。 19% 上升至 37.2%,包括电子商务在内的其它服务收入占比,则很快从前一年开始。 1% 攀升至 6.3%。


正如快手本人所解释的那样,生产者和客户,B 端客户和 C 终端用户,外部客户,内部客户,都是快手的重要客户,也将成为快手大模型的目标客户。


生产者与客户,共同构建快手最基本的业务链,生产内容,消费者消费内容。大型产品的价值在于降低生产门槛,提高内容质量。


前者很容易理解,就像可灵目前可以实现的那样,输入文字或者图片就可以得到一个视频。对于没有拍摄条件和制作能力的人来说,生产门槛大大降低。


第一次听后者有点反常识- AI 视频产品的真实性和输出长度如何在质量上优于真实拍摄和专业制作?然而,在Aautorapper和Tiktok这样的头部平台上,每天生产的数千万个短视频中,大多数来自普通用户和专业内容制作人眼中的“不够精致” AI 技术,已经可以让普通用户的随拍增加材料和丰富度。


B 终端商家也将成为快手模型能力的用户。根据快手今年在世界人工智能大会上发布的数据, AI 广告业收入已经突破 2000 万 / 天。AI 生成的广告资料,可以降低到单个成本。 0.47 块的同时,将 CTR 保持在基准线上。


可灵生成图片,提示:苹果汁广告资料,白色桌面上有一杯苹果汁,旁边有两种红苹果汁。


对于许多大型产品来说,寻找落地场景是贯穿生命周期的难题,但是快手显然不缺情景。正如快手副总裁、大模型负责人张迪所说,可灵的爆红源于“挖掘真实价值,满足真实场景中用户的真实需求”。


他们要面对的问题是,在现有场景中,如何让用户成为Aautorapper大模型的高频用户,并愿意不断付费,首先在自己的生态中实现大模型的商业化。


7 月 25 日本,可灵全面开放注册,同一天,可灵上线会员制,进入收费阶段。


根据可灵网站的信息,非会员客户每天登录时可以获得礼品 66 根据目前的“定价”,一个灵感值大概可以免费生成。 6 个视频或 330 张图片。


付费模式有两种。一种是会员模式。用户可以在月、季、半年、一年的周期内购买不同等级的会员。等级越高,可以生成的作品越多;第二,充值方式,用户可以直接付费充值。转换后,客户每个视频的形成成本是 1 人民币,每张照片的形成成本是 2 分钱。


可灵产生的照片,提示:日出,天空中有美丽的云朵和日出,太阳藏在云中


对可灵的定价体系来说,有两点值得关注。


首先,Aautorapper没有提供会员选项,可以无限次生成内容,这意味着客户实际上是在“花钱买频率”,无论是选择充值方式还是会员模式。不同之处在于每次产生的价格,以及去水印、视频增加、大师运镜等不同功能。


AI 视频的形成成本很高,不提供可以无限次生成的会员。Aautorapper显然希望防止可能的成本失控,并在一定程度上遏制灰色产品。


第二,作为“支付货币”的灵感值,与快手生态中奖励主播所用的快币,在定价上是相当的。1 人民币元,可购买人民币 10 一枚快币,也可以购买 10 一个灵感值。这种定价方式,或许是为了在快手生态中后续打通支付系统保留概率。


与此同时,拥有需求、场景、客户、设备、数据、技术、人才储备的,远不止快手一家。


上述业内人士预测,在不久的将来,字节可以制作出同级别的生成视频产品。在此之前,Aautorapper需要在窗口期内沉淀用户和内容,这样 AI 内容在快手生态中有效运行,最好还能跑通商业化路径,在领跑者的位置上坐得更久一点。


常规的增长和运营方式已经提上日程。灵官网迅速推出会员全线五折活动,客户每天登录即可获得。 66 一个灵感值,以减少付费模式对用户增长和保留的影响,让所有用户至少可以先无门槛地使用尝鲜。


另外,在Aautorapper站的运营中,可灵并没有过多强调生成视频、扩散模型方案、分布式训练集群等概念。,而是用“老照片变成视频”“穿梭时空抱紧你”“复活 40 多年前的照片“等玩法,首先吸引用户使用,以降低用户的理解成本。


对于普通用户来说,新的玩法与过去快影特效的难度一致。他们把它理解为一个更强大的特效。不管他们有没有听说过“大模型”这个词,都不妨碍他们成为大模型产品的具体客户。


那是快手和字节做的 AI 如果顾客是自己的,视频的终极先手; AI 如果顾客被新的断层商品所吸引,时代面临的终极困境。


与其说他们要争夺战争 AI 视频时代的入口,不如说都是守口如瓶。新的生产力将创造新的内容形式,最终创造新的平台。程一笑和张一鸣都很熟悉这个故事。


她们必须成为第一梯队。


(可灵生成封面图。)


媒体联系微信号 |ciweimeijiejun


业务合作联系微信号 |yunlugong


如果需要和我们沟通,可以在后台回复“加入群”


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com