打破算法迷思,拥抱理性认知。

01-10 09:38

"从什么时候开始,视频中的字幕不能很好地打汉字?""死"、"抢"、“病”要用字母代替,“最“写成””,“酒”变成了” 8 1 ","钱"也改名为"米",网络上层出不穷的“黑话”,看上去就像是复活了过去相声行业的“春节”。


看了一些所谓的“营销大师”教程,我意识到只要这些词直接打到视频字幕上,就会受到平台方算法的限制,降低传播价值。


但是,事情却完全不是这样。互联网独特的从众兴趣不仅仅是传递虚假信息的背后,更是对算法的恶意曲解。


最近,抖音集团副总裁李亮对“钱”、“死”等字眼相关视频限流问题的回复再次引起了大众对平台算法的认识和思考。


在数字时代,算法就像一张无形却紧密交织的大网,包裹着人们生活的方方面面。算法背后是什么,是数据优化还是平台权力的延伸,对于这个被很多网络专家和影视剧渲染的“网”?


长期以来,算法在公众心目中似乎是一个神秘的存在。一方面,有人抱怨算法在网上异化了中文。另一方面,信息茧房的概念赢得了人们的心。大家都担心算法会把自己困在单一的信息框架下,导致视野狭窄,观点偏执。


公众希望算法透明,抖音等网络平台积极响应,宣布推动算法和平台治理透明。这一举措为我们重新认识算法和审视算法提供了机会。


要对算法进行监督、审视,首先要弄清楚,什么是算法?


前世算法:从解决问题到推荐内容


本质上,算法是“用数学或计算机代码表达的意见”,它的历史可以追溯到很久以前。


在古代,人们用简单的数学公式来解决实际问题,比如计算对象的总数和分配资源,这包括算法的雏形。随着时代的发展,算法逐渐演变成现代数字时代的核心技术之一。


简单来说,算法就是解决问题的一系列步骤和规则。你可以把它想象成一个非常详细的食谱,你可以根据食谱的步骤做出美味的菜肴。


例如,如果你想计算从家到学校的最短路线,算法会根据路况、交通流量等信息为你规划最佳路径,就像导航一样。


例如,当你在网上购物时,平台的算法会找到你可能喜欢的产品,并根据你之前的购买记录和浏览历史向你推荐,就像一个热心肠的购物助手一样。


这是我们现在最常接触的推荐系统。之所以如此重要,是因为物质和数字内容前所未有的丰富,导致检索困难。


在检索成本已大于生产成本的情况下,推荐系统的重要性显而易见。


你看,每天都有大量的新闻、文章、视频、照片等信息出现在网上。据统计,2023年 我国每年的数据生产总量已经达到 32.85ZB(泽字节),这是一个巨大的数字,相当于 1000 中国国家图书馆数万个数字资源总量。


有了这么多信息,我们需要找到我们真正感兴趣和有价值的东西,就像在海里捞针一样困难。这就是所谓的“信息过载”。与此同时,我们的生活节奏越来越快,每个人都在争分夺秒地工作。


这就造成像 2024 年 6 根据月《中国青年报》的调查,94.8% 受访者感到自己的生活开启了“倍速键”。


在这样忙碌的生活中,我们没有太多时间逐渐筛选信息。例如,你可能只有十分钟的休息时间。你想找一些有趣或有用的东西,但你不能从海量数据开始。


这样的话,推荐系统就应运而生了。


这就像是我们在信息海洋中的导航器,它是专门为解决信息过载问题而设计的,帮助我们快速地找到我们可能感兴趣的内容。


如果没有推荐系统,我们可能会花很多时间去搜索和筛选信息,而且也未必能找到满意的信息。


比如你想找一部好看的小说,如果没有推荐系统,可能要在无数的图书网站上一本一本的查看介绍和评价。需要多长时间?


但是有了推荐系统,可以根据自己的阅读爱好,比如自己喜欢的小说题材和作者风格,快速推荐合适的小说,大大提高了我们获取信息的效率和效果。


那具体来说,什么是推荐系统呢?


推荐系统实际上是一种超智能的信息过滤技术。你可以把它想象成一个非常了解你的“私人助手”,但这个“助手”是由计算机程序和算法规则组成的。


它会密切关注你的一举一动,比如你在平台上表扬了什么视频,评论了什么文章,收集了什么照片,甚至你在平台上搜索了什么关键词,它都会一一写下来。


然后它会根据这些行为分析你的爱好。如果你经常喜欢美食视频,它也会判断你对美食感兴趣,然后从大量的信息中选择更多的美食相关内容推荐给你。它的目的是准确地向你推送合适的内容,这样你就可以更容易地找到你感兴趣的东西,提高信息分发的效率和准确性。


优秀的推荐系统成为我们在信息时代获得个性化内容的左膀右臂,使我们的网络世界更加丰富多彩。


2021 年,TikTok 推荐系统被麻省理工科技评论(MIT Technology Review)被评为“世界十大突破性技术(10) Break - through Technologies “2021)”,只要内容质量高,再普通的人或兴趣都可以通过推荐系统找到“知音”。


TikTok 算法在社交媒体领域的强大影响力已经显现出来,它能准确地捕捉到用户的兴趣,实现内容的高效分发,让全球用户体验到个性化的内容感受,同时也进一步证明了算法在当今数字社会中的重要地位和价值。


为什么一个搜索引擎总是受到批评,难道不是因为它的搜索结果不够准确,充满了广告吗?


就像每一项改变世界的新技术一样,你有多少积极的赞美就有多少消极的意见。如今,推荐系统的负面声音正在逐渐增加音量。


毫无疑问,最大的声音是指责Tiktok推荐系统是一个“黑盒子”,在完全隐蔽的运行状态下完成了尼葛洛庞帝“我的日报”的著名语言,将世界分裂成一个相互隔绝的“茧房”。


但事实真的是这样吗?


推荐系统没有原罪,技术不应该被污名化。


事实上,“信息茧房”这一概念虽然广为人知,但却是一种假设,并非科学观点,至今没有任何科学研究支持。


清华大学新闻与传播学院常务副院长陈昌凤教授曾指出,信息茧房是一个似是而非、缺乏科学证据的概念。


西方学术界没有强有力的研究来证明它的存在。一方面,实验室条件化的“信息茧房”纯信息环境难以存在,人们总是处于多样化、复杂化的信息环境中;另一方面,如果把它作为一个长期的传播价值来讨论,就更难证明它的存在。


很多时候,人们只是担心“信息茧房”,而不是有明确的论据。


相反,绝大多数研究发现,算法对信息茧房的影响程度,以及因特网信息茧房本身的严重性,都被过分高估了。


例如,一些德国学者的研究表明,不同背景和互联网使用经验的用户在同一时间搜索同一搜索引擎的结果中有很多重叠支出,独立的结果只占搜索结果。 2.5%。


2016 2008年,赛斯佛莱克曼等研究人员选择 5 成千上万的参与者要求他们报告他们最近阅读、观看或听到的新闻媒体,并通过电子方式直接监控和记录他们的实际新闻消费行为。通过对比两个数据,研究最终发现,每个人的实际媒体消费比自己想象的要多样化。换句话说,每个人实际上都没有陷入“信息茧房”。


对于平台来说,刻意制造“信息茧房”并不符合自身利益。因为推荐内容的多样性越好,客户长期保留的概率越大,算法的动力就是扩展多样性。


所以,抖音等渠道普遍采用多种手段来提高算法推荐结果的多样性,包括多样性分散(例如 10 必须有一个推荐 3 不同类型的内容)、基于算法的兴趣探索(平行推荐图像类似用户的兴趣领域)、引入随机因素(在推荐中随机添加与用户历史行为不完整的相关内容)等。


清华大学社会科学院发布的《破茧还是筑茧》指出,70%的用户使用、算法推荐和信息茧房研究报告 用户对智能推荐算法持肯定态度,超越了智能推荐算法。 90% 的短视频 APP 使用者选择打开智能推荐算法。它充分说明了大多数用户在实际体验中感受到算法带来的便利和价值。


中国人民大学高淳人工智能学院的研究也表明,阅读内容的种类数量与使用时间成正相关,互联网应用具有追求算法多样性的内在动力。推荐技术不是简单的“顺水推舟”,而是在满足用户已知兴趣的基础上,深度激发和满足用户的隐性需求,从而更好地满足人们对信息的多维需求。


那为什么那么多人担心推荐算法会导致“信息茧房”呢?


阿克塞尔,昆士兰科技大学的研究人员 · 布伦斯认为,这种说法的流行,只是技术再次成为社会问题的替罪羊。


如同 70 后来父母怪小说,80 后来父母怪漫画,90 之后父母怪游戏,00 后父母指责短视频,公众普遍将当前社会观点撕裂、共识解体的现状归因于视频平台、新闻门户、社交媒体推荐系统。


文森特特是加拿大传播学家。 · 莫斯曾经说过:没有必要压抑这些争论。 , 在新技术完全融入人们的生活之后, , 这类争论自然会放缓,人们最终可以用冷静和理性来理解技术。


事实上,这是真的。从技术角度来看,推荐系统并没有那么神秘。与其说它是一个难以破解的黑盒子,不如说它是一个巨大的乐高组合。虽然不能完全掌握内部组合的细节,但也可以猜测使用了哪些零件。通过观察推荐给大家的结果,大家也能理解影响推荐系统的一些因素。


此外,推荐系统不能完全独立决定推送结果。在这个过程中,总是有人工操作作为算法导航,目的很多,并不是所有的流量都是第一位的。


推荐系统的价值:远远超过获得流量


与目前市场上普遍存在的“算法原罪论”相反,抖音等平台对算法优化做出了全面的努力。


在Tiktok中,推荐系统在内容生态的构建中起着至关重要的作用。它就像一双看不见却有力的手,巧妙地放大了高质量的内容,准确地减少了劣质的内容,从而为用户创造了一个积极、健康、有用的信息环境。


具体是如何实现的?


Tiktok的推荐算法将密切关注客户对内容的各种互动行为。这些行为被认为是对内容质量和诱惑力的积极反馈信号,当客户喜欢、评论、分享和收集视频时。


例如,一个知识科普视频受到大量用户的好评和分享,这表明这个视频具有很高的价值,算法会认为这是一个高质量的内容,并给予它更高的推荐权重。


除了互动行为,算法评价内容质量的重要因素是客户观看视频的时间和完成率。如果用户能够全面观看一个长视频,或者某个视频的观看时间明显高于平均水平,算法会解释为用户对这个内容非常感兴趣,并认为它有吸引力。


在内容进入推荐流程之前,Tiktok采用了机器审核和人工审核相结合的多重审核机制。凭借其高效的特点,机器审批可以快速识别包括明显违规词汇、色情、暴力、仇恨言论在内的视频,并阻止其。


机器审批可能很难准确判断一些使用双关语、隐喻或文化特定表达的晦涩难懂的内容,然后会交给人工审核团队进行详细审核。通过这种协同审批方式,可以有效遏制源头上的不良内容,不进入推荐系统,从而维护平台内容的整体质量。


如果把内容比作汽球,Tiktok的推荐系统可以准确地“振作起来”高质量的内容,让更多的人看到。“破坏”劣质汽球,减少交流。这不仅为用户提供了更高质量、更丰富的内容体验,也为创作者提供了公平的交易和鼓励创新的创作环境,促进了平台的稳定发展和繁荣。


算法的价值远不止于此。与大众制造“信息茧房”的观点相反,它有助于打破信息束缚,帮助用户看到更大的世界。事实上,算法在许多方面为社会发掘创造了巨大的价值。


比如在帮助城市文化旅游方面,如果没有算法推荐,传统眼光下没有足够亮点的地方,比如淄博、天水,其实很难进入大众视野。——有多少人在火遍抖音之前,为了一顿街头烧烤,会专程开上千公里?


然而,从其独特的角度来看,算法发现了这些城市从未知晓的“爆点”,并通过“从点到面”将这个小镇推向了整个网络和世界。


网络名人城市的变迁历史是算法对城市的再发现历史和颤音的帮助,使得网络名人城市从单点爆发变成了不断涌现的热点,使得广大不显眼的地方成为流量的“显眼包”。


算法在传统文化传承方面同样起着重要作用。


成都三花民间川剧团濒临破产,一段短视频让它重生。短短三个月,过去两年通过网络平台卖出的票几乎总和,现在演出场地爆满;借助算法推荐机制,苏州评弹突破了地域和方言的限制,在网上聚集了大量客户,线上直播表演也回馈了线下表演。


此外,甲骨文、考古学、弦理论、星际化学等少数硬核知识在Tiktok中不断流行,让更多的人爱上少数学科;农村教师通过Tiktok学习物理实验,教孩子发射水火箭,引发农村教师热潮;科普生活常识、农业技术知识等内容也在Tiktok中不断发展,短视频成为农村振兴的“新农具”,打通了农业技术推广的“最后一公里”。


在书籍推广领域,推荐系统打通了“人找书”和“书找人”的双向链接,完成了书籍与读者的精准匹配和高效连接。


由于读者对《我与地坛》的一篇评论,“子弹文学”爆红,网友们用了一段。 1.5 一亿个短视频播放“阅读”史铁生的文采;老书《画魂》因为推荐视频被打印了好几次;许多经典书籍和不受欢迎的杰作在短视频平台上再次走红,走进人们的视野,获得了良好的销量,产生了新的活力。


当然,算法也需要透明和监督。这一次,Tiktok回应了“钱”、“死”等词的限流问题,这是算法透明度的良好开端。它让公众知道,算法并不像一些无良商家推广的那样神秘,而是有证据可循的。发布更多的算法细节可以引导创作者更好地专注于创作自己。


另外,这也不是字节跳动首次提出算法透明度的建议,字节跳动早在提出。 2018 2008年,算法透明科普通过今日头条开启了行业先例。


现在抖音进一步推动算法和平台治理的透明度,更显示出它对公众关注的态度。


总而言之,算法并非洪水猛兽,它是时代发展的产物,具有巨大的潜力和价值。建立安全和信任中心,促进算法和平台治理的透明化,是对社会关注的积极回应,也是对算法价值的深入挖掘和正确引导。


我们有理由相信,在平台上与公众的良性互动中,算法将为社会创造更大的价值,使我们的生活更加丰富多彩,使信息传播更加高效、准确、有意义。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com