AI再次降低了音乐的门槛。

2024-06-03

Suno，被称为音乐界的ChatGPT，最近宣布完成B轮1.25。 10亿美元的融资。据推测，这一轮融资使得马萨诸塞州这家企业成立两年，总部设在马萨诸塞州的估值达到5亿美元。截至2024年初，该公司只有12名员工。

公司还顺手发布了V3.5的新模型。新版本使AI能够生成4分钟的音乐，并显著改善音乐结构和声音模型。显然，音乐的合唱部分更加突出。另外一位官员只是简单地描述了一句“Coming soon“这个功能，似乎是由声音产生的，把现实世界中的声音转化为音乐。如果这个功能在V4版本中实现，的确为AI音乐的生成提供了无限的可能性。

根据国内AI商品列表（aicpb.com）数据显示，Suno已经完成了每月1000万次的浏览增长率。在AI音乐生成领域，Suno的月浏览量是第二名的八倍，可以说是一骑绝尘。

Suno Mikey联合创始人兼首席执行官 Shulman直言不讳地说： Suno 这是为了创造一个每个人都能制作音乐的未来，帮助我们重新发现小时候玩耍和探索的快乐。他的最终愿景是，世界上有10亿人每月支付10美元用Suno创作歌曲。

不仅仅是AI工具，还有音乐社区

“在人生的某个阶段，我们失去了一些制作音乐的快乐。我们中的一些人长大后成为了真正的音乐家，接受了必要的练习或天生的技能，而我们中的一些人开始明白，我们的位置是静静地坐在观众面前欣赏表演。”在公开信中宣布融资消息，Suno Mikey联合创始人兼首席执行官 Shulman写道。

八个月前，Suno发布了第一个产品，声称任何人只要有一个简单的想法就能创作出一首歌。现在有一万个。万人使用 Suno 创作音乐。这些音乐家中有格莱美获奖，但大多数还是第一次尝试创作音乐的普通用户。

Suno的主页非常简单，在左边的菜单栏中选择Create就可以开始创作歌曲。Custom 在Mode中打开定制模式，可以粘贴自己创作的歌词，让AI根据主题生成歌词，然后简单选择音乐风格，确定一个歌名，就可以自动生成音乐。

自从V3版本以来，Suno在AI音乐创作工具中一直很受欢迎。最多十秒钟就能产生2分钟的音乐，包括声音、复杂的音乐结构、不逊色于专业的音乐创作。此外，还有丰富的音乐风格和音响效果可供选择。商品一出来，就让整个世界大吃一惊。

AI产生的音乐在刚刚推出的V3.5中也有了很大的改进。不但时间更长，而且明显感觉作曲中的逻辑性更强。换言之，AI可以理解歌词，区分主歌，设定内容结构，使作品更加精美。普通人可以通过这些工具创作出高质量的音乐作品，即使没有专业的音乐知识或乐器演奏基础。作品也有自动生成的封面，用户可以下载音频，共享作品。

Suno成功的另一个因素是，它不仅是一个AI音乐生成工具，也是一个音乐平台和音乐社区。在主页上，你可以看到新的AI作品案例，以及最受欢迎的作品列表，以及不同类别的列表供选择。你也可以通过名字、风格或歌词来搜索你的作品。你可以看到其他用户发布的作品，播放的内容和喜欢的数量，分享你的作品。

如果你不知道你想做什么样的音乐，在Explore功能中，有数百种细分的音乐风格供你试听和选择。也可以选择自己喜欢的音乐风格，一键跳到Create页面。

以前大部分AIGC产品，大家都只是新鲜了一段时间，热闹过去的人都凉了。然而，Suno神奇地保留了用户的粘性，仍然在自己的社区推广和创作了大量的神曲。这些神曲打破圈子后，吸引了大量路人打卡，尝试创作AI。

最神奇的是，每天登录网站的人中，听音乐的人比真正制作音乐的人还多。Suno社区正在培养第一批AI音乐观众。

创始人是AI专家，也是音乐家。

在一段时间内，像Midjourney这样的AI生成图像、文本甚至视频工具都取得了重大突破，但音频生成，尤其是音乐生成，却落后了，很少有应用破圈。Suno 对AI音乐密码破解行业的期待寄托在身上。

Suno 成立不到两年。四位创始人都是机器学习专家。他们曾经在另一家剑桥公司工作。 Kensho Technologies 共事至 2022 2008年，该公司专注于寻找复杂的商业问题 AI 解决办法。在这些人中，37岁。 Mikey Shulman拥有哈佛大学物理博士学位，他和另一位创始人也是音乐家，曾经一起表演过。

在前一家公司，四人致力于开发记录上市公司财务报告电话会议的转录技术。由于会议通话音频质量差，行话太多，口音不同，这是一项棘手的任务。在这个过程中，Mikey Shulman和他的同事开始研究AI音频的可能性。在AI研究中，他还发现音频总体上远远落后于图像和文本。

他们在头脑风暴中预设了包括助听器在内的各种商品的开发。因此，第一个产品是一个名为Bark的文本转换语音程序。当他们调查早期的Bark时顾客们说，真正想要的是一个音乐生成器。

Suno 使用与 ChatGPT 等待各种主要语言模型相同的通用方法，将人类语言分解并标记成片段，然后根据需要重建。但是音频，尤其是音乐，几乎是复杂而惊人的。与单词不同，音频可以简单地分解，这是一个持续的信号。优质音频的采样率一般为 44khz或48khz，这意味着每秒 48000 一个标记，这是一个很大的工程量。AI专家也认为，2023年Suno 这种服务可能需要几年的时间才能完成。

另一个无法回避的问题是版权。现在，当你使用Suno时，系统可以识别你输入的歌词是否受到版权保护。如果客户计划使用受版权保护的歌词，他们必须获得许可。

但是这个Suno的主要争议在于它是否使用版权保护材料进行训练。OpenAI 因 ChatGPT 将书籍、新闻文章等受版权保护的材料应用到其庞大的训练数据中，面临着许多诉讼。有媒体要求 Suno 澄清这一点，但是没有得到答复。Suno 创始人拒绝透露他们将哪些数据放入自己的模型中，只透露了一点:它之所以能产生令人信服的人类声音，部分原因是它不仅从音乐中学习，还从语音录音中学习。

Suno 他们表示，他们与各大音乐公司保持沟通，并声称尊重艺术家和知识产权——他们的工具不能要求任何特定艺术家在提醒中的风格，也不能使用真正艺术家的声音。

从创始人到员工，很多人都是音乐家。钢琴和吉他也摆放在企业的办公室里，古典作曲家的照片挂在墙上。Suno没有表现出对音乐行业的公开敌意，就像当初的Napster一样。但是他们正在做的事情确实颠覆了音乐行业的想法。

超越Spotify的目标触及10亿用户？

Suno创始人毫不掩饰自己的欲望，他们想象着一个高度民主的音乐世界。Mikey Shulman认为，目前音乐观众的数量远远超过音乐创作者的数量是“如此不平衡”，Suno 这种明显的不稳定有望得到解决。他的愿景是，世界上有10亿人每月用Suno创作歌曲，每月支付10美元。

Suno 最早的投资者之一是风险投资公司 Matrix Antonionio的合伙人 Rodriguez。他认为 Suno 它是一种功能齐全、易于使用的乐器，我相信它能给每个人带来音乐创作，就像照相手机一样。 Instagram 让拍摄大受欢迎。他甚至认为创始人 Suno 能够吸引比 Spotify 更大的用户群。

在获得新融资之后，Mikey Shulman还宣布，这笔钱将用于“创造一个每个人都可以创作音乐的未来”。对此，投资者大力支持。“所有伟大的公司都有优秀人才的结合，做一些看似愚蠢的事情，直到变得明显而不愚蠢。”

到目前为止，Suno 顾客似乎只热衷于和几个朋友分享他们的歌曲，但是他们也可以上传到Spotify或者 Apple Music 等待渠道。不排除未来流媒体上充斥着AI产生的音乐的可能性。

AI是否会颠覆当前音乐产业的商业模式，一直是歌星、制作人和歌词作者热议的话题。但 Suno 创始人声称没什么好担心的。“如果人们更热衷于音乐，更专注于创作，培养更独特的品味，我们试图让10亿人比现在更多地参与音乐。这显然是艺术家的好事。对于未来的音乐，我们的愿景是，它对艺术家很友好。我不想取代艺术家。”

但是AI确实取代了唱片行业的一些基本工作。ChatGPT可以帮助写单词，Suno可以直接生成音乐，ACE可以帮助混响，甚至使用Mid。 journey、Runway、Sora可以帮助生成宣传图和MV。工业时代的音乐制作需要多种工种的配合，也许以后只需要一个专业人士的整体检查。

虽然 Suno 只专注于吸引想要创作歌曲和娱乐的粉丝，但在音乐行业的人眼里，还是可能造成严重的破坏。就像平时利润丰厚的广告配乐一样，AI以后会接手吗？

但是对于Suno来说，还有很多工作需要完成。新的融资到账后，企业需要继续扩大规模，推出新产品。在Mikey 在Shulman看来，恢复已故歌手的声音并不是人工智能未来的方向。他们关注的是如何把大家的想法变成现实，创作出不存在的作品。

也许等到新技术继续落地之后，现在的许多问题才会得到答案。

本文来自微信微信官方账号“新音乐产业观察”（ID：takoff），作者：益佰，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

冰淇淋不行地瓜凑，摔倒的钟薛高已经被谁取代了？

2D头像生成3D虚拟人开视频会，谷歌新作让人难以忍受。

给大人一些儿童教育

为什么凯莱英跌跌撞撞？ | 牛熊榜