AI再次降低了音乐的门槛。
Suno,被称为音乐界的ChatGPT,最近宣布完成B轮1.25。 10亿美元的融资。据推测,这一轮融资使得马萨诸塞州这家企业成立两年,总部设在马萨诸塞州的估值达到5亿美元。截至2024年初,该公司只有12名员工。
公司还顺手发布了V3.5的新模型。新版本使AI能够生成4分钟的音乐,并显著改善音乐结构和声音模型。显然,音乐的合唱部分更加突出。另外一位官员只是简单地描述了一句“Coming soon“这个功能,似乎是由声音产生的,把现实世界中的声音转化为音乐。如果这个功能在V4版本中实现,的确为AI音乐的生成提供了无限的可能性。
根据国内AI商品列表(aicpb.com)数据显示,Suno已经完成了每月1000万次的浏览增长率。在AI音乐生成领域,Suno的月浏览量是第二名的八倍,可以说是一骑绝尘。
Suno Mikey联合创始人兼首席执行官 Shulman直言不讳地说: Suno 这是为了创造一个每个人都能制作音乐的未来,帮助我们重新发现小时候玩耍和探索的快乐。他的最终愿景是,世界上有10亿人每月支付10美元用Suno创作歌曲。
不仅仅是AI工具,还有音乐社区
“在人生的某个阶段,我们失去了一些制作音乐的快乐。我们中的一些人长大后成为了真正的音乐家,接受了必要的练习或天生的技能,而我们中的一些人开始明白,我们的位置是静静地坐在观众面前欣赏表演。”在公开信中宣布融资消息,Suno Mikey联合创始人兼首席执行官 Shulman写道。
八个月前,Suno发布了第一个产品,声称任何人只要有一个简单的想法就能创作出一首歌。现在有一万个。 万人使用 Suno 创作音乐。这些音乐家中有格莱美获奖,但大多数还是第一次尝试创作音乐的普通用户。
Suno的主页非常简单,在左边的菜单栏中选择Create就可以开始创作歌曲。Custom 在Mode中打开定制模式,可以粘贴自己创作的歌词,让AI根据主题生成歌词,然后简单选择音乐风格,确定一个歌名,就可以自动生成音乐。
自从V3版本以来,Suno在AI音乐创作工具中一直很受欢迎。最多十秒钟就能产生2分钟的音乐,包括声音、复杂的音乐结构、不逊色于专业的音乐创作。此外,还有丰富的音乐风格和音响效果可供选择。商品一出来,就让整个世界大吃一惊。
AI产生的音乐在刚刚推出的V3.5中也有了很大的改进。不但时间更长,而且明显感觉作曲中的逻辑性更强。换言之,AI可以理解歌词,区分主歌,设定内容结构,使作品更加精美。普通人可以通过这些工具创作出高质量的音乐作品,即使没有专业的音乐知识或乐器演奏基础。作品也有自动生成的封面,用户可以下载音频,共享作品。
Suno成功的另一个因素是,它不仅是一个AI音乐生成工具,也是一个音乐平台和音乐社区。在主页上,你可以看到新的AI作品案例,以及最受欢迎的作品列表,以及不同类别的列表供选择。你也可以通过名字、风格或歌词来搜索你的作品。你可以看到其他用户发布的作品,播放的内容和喜欢的数量,分享你的作品。
如果你不知道你想做什么样的音乐,在Explore功能中,有数百种细分的音乐风格供你试听和选择。也可以选择自己喜欢的音乐风格,一键跳到Create页面。
以前大部分AIGC产品,大家都只是新鲜了一段时间,热闹过去的人都凉了。然而,Suno神奇地保留了用户的粘性,仍然在自己的社区推广和创作了大量的神曲。这些神曲打破圈子后,吸引了大量路人打卡,尝试创作AI。
最神奇的是,每天登录网站的人中,听音乐的人比真正制作音乐的人还多。Suno社区正在培养第一批AI音乐观众。
创始人是AI专家,也是音乐家。
在一段时间内,像Midjourney这样的AI生成图像、文本甚至视频工具都取得了重大突破,但音频生成,尤其是音乐生成,却落后了,很少有应用破圈。Suno 对AI音乐密码破解行业的期待寄托在身上。
Suno 成立不到两年。四位创始人都是机器学习专家。他们曾经在另一家剑桥公司工作。 Kensho Technologies 共事至 2022 2008年,该公司专注于寻找复杂的商业问题 AI 解决办法。在这些人中,37岁。 Mikey Shulman拥有哈佛大学物理博士学位,他和另一位创始人也是音乐家,曾经一起表演过。
在前一家公司,四人致力于开发记录上市公司财务报告电话会议的转录技术。由于会议通话音频质量差,行话太多,口音不同,这是一项棘手的任务。在这个过程中,Mikey Shulman和他的同事开始研究AI音频的可能性。在AI研究中,他还发现音频总体上远远落后于图像和文本。
他们在头脑风暴中预设了包括助听器在内的各种商品的开发。因此,第一个产品是一个名为Bark的文本转换语音程序。当他们调查早期的Bark时 顾客们说,真正想要的是一个音乐生成器。
Suno 使用与 ChatGPT 等待各种主要语言模型相同的通用方法,将人类语言分解并标记成片段,然后根据需要重建。但是音频,尤其是音乐,几乎是复杂而惊人的。与单词不同,音频可以简单地分解,这是一个持续的信号。优质音频的采样率一般为 44khz或48khz,这意味着每秒 48000 一个标记,这是一个很大的工程量。AI专家也认为,2023年Suno 这种服务可能需要几年的时间才能完成。
另一个无法回避的问题是版权。现在,当你使用Suno时,系统可以识别你输入的歌词是否受到版权保护。如果客户计划使用受版权保护的歌词,他们必须获得许可。
但是这个Suno的主要争议在于它是否使用版权保护材料进行训练。OpenAI 因 ChatGPT 将书籍、新闻文章等受版权保护的材料应用到其庞大的训练数据中,面临着许多诉讼。有媒体要求 Suno 澄清这一点,但是没有得到答复。Suno 创始人拒绝透露他们将哪些数据放入自己的模型中,只透露了一点:它之所以能产生令人信服的人类声音,部分原因是它不仅从音乐中学习,还从语音录音中学习。

Suno 他们表示,他们与各大音乐公司保持沟通,并声称尊重艺术家和知识产权——他们的工具不能要求任何特定艺术家在提醒中的风格,也不能使用真正艺术家的声音。
从创始人到员工,很多人都是音乐家。钢琴和吉他也摆放在企业的办公室里,古典作曲家的照片挂在墙上。Suno没有表现出对音乐行业的公开敌意,就像当初的Napster一样。但是他们正在做的事情确实颠覆了音乐行业的想法。
超越Spotify的目标触及10亿用户?
Suno创始人毫不掩饰自己的欲望,他们想象着一个高度民主的音乐世界。Mikey Shulman认为,目前音乐观众的数量远远超过音乐创作者的数量是“如此不平衡”,Suno 这种明显的不稳定有望得到解决。他的愿景是,世界上有10亿人每月用Suno创作歌曲,每月支付10美元。
Suno 最早的投资者之一是风险投资公司 Matrix Antonionio的合伙人 Rodriguez。他认为 Suno 它是一种功能齐全、易于使用的乐器,我相信它能给每个人带来音乐创作,就像照相手机一样。 Instagram 让拍摄大受欢迎。他甚至认为创始人 Suno 能够吸引比 Spotify 更大的用户群。
在获得新融资之后,Mikey Shulman还宣布,这笔钱将用于“创造一个每个人都可以创作音乐的未来”。对此,投资者大力支持。“所有伟大的公司都有优秀人才的结合,做一些看似愚蠢的事情,直到变得明显而不愚蠢。”
到目前为止,Suno 顾客似乎只热衷于和几个朋友分享他们的歌曲,但是他们也可以上传到Spotify或者 Apple Music 等待渠道。不排除未来流媒体上充斥着AI产生的音乐的可能性。
AI是否会颠覆当前音乐产业的商业模式,一直是歌星、制作人和歌词作者热议的话题。但 Suno 创始人声称没什么好担心的。“如果人们更热衷于音乐,更专注于创作,培养更独特的品味,我们试图让10亿人比现在更多地参与音乐。这显然是艺术家的好事。对于未来的音乐,我们的愿景是,它对艺术家很友好。我不想取代艺术家。”
但是AI确实取代了唱片行业的一些基本工作。ChatGPT可以帮助写单词,Suno可以直接生成音乐,ACE可以帮助混响,甚至使用Mid。 journey、Runway、Sora可以帮助生成宣传图和MV。工业时代的音乐制作需要多种工种的配合,也许以后只需要一个专业人士的整体检查。
虽然 Suno 只专注于吸引想要创作歌曲和娱乐的粉丝,但在音乐行业的人眼里,还是可能造成严重的破坏。就像平时利润丰厚的广告配乐一样,AI以后会接手吗?
但是对于Suno来说,还有很多工作需要完成。新的融资到账后,企业需要继续扩大规模,推出新产品。在Mikey 在Shulman看来,恢复已故歌手的声音并不是人工智能未来的方向。他们关注的是如何把大家的想法变成现实,创作出不存在的作品。
也许等到新技术继续落地之后,现在的许多问题才会得到答案。
本文来自微信微信官方账号“新音乐产业观察”(ID:takoff),作者:益佰,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




