阅读“5V”开启人工智能新时期
早在 2010 2008年,我向许多大企业介绍了大数据。 5V的五个 V :数量、速度、多样性、真实性和价值。当时,随着企业努力应对数字信息的爆炸式增长,这一概念越来越受到重视。接近 15 今年之后,这五个 V 仍然与人工智能高度相关。
科学技术已取得巨大进步, 5 个 V 背后的核心理念比以往任何时候都更重要,也是应对数据驱动世界人工智能挑战的坚实基础。让我们深入研究为什么每一个。 V 今天仍然很重要。
数量:增加人工智能引擎的动力
2010 2000年,数据专家开始意识到大数据的巨大规模。如今,人工智能正以这种数据爆炸式增长而蓬勃发展,尤其是在训练机器学习模型方面。大量数据集的可用性决定了人工智能模型的泛化能力和有效执行能力。
但是数据量大,责任大。每天都会产生大量的数据,这是组织处理其最重要资产之一的考验。为了保证最高的道德标准,公司在使用数据时必须负责任地存储、处理和保护数据 AI 这个计划既可持续又有影响力。
速度:需要速度
数据速度一直是一个挑战,但它改变了人工智能领域。即时应用,如欺诈检测、智能推荐和自主系统,需要即时洞察。2010 2008年,关键是数据流的快速移动;今日,我们还讨论了人工智能决策中的延迟。
人工智能需要像它所使用的数据一样快速灵活。为了保证即时预测的准确性,需要坚实的基础设施设置来跟上不断变化的数据。
多样性:超越结构化数据
多样性曾经是处理结构化和非结构化数据的象征。如今,人工智能通过整合各种数据类型(文本、图像、音频、视频等)来扩大这一挑战。).想想一个可以理解文本的聊天机器人,一个可以解释声音的语音助手,或者结合视觉和语言的多种人工智能。
多样性丰富了人工智能的能力,使其更像人类,适应性更强。但是它也带来了数据集成和协调的复杂性,需要精心准备和管理。
真实:信任的基础
2010 2000年,真实性意味着确保数据干净可靠。如今,在人工智能时代,真实性是处理数据偏见、错误和道德问题的核心。不良或偏见的数据可能会损害结果,导致客户对人工智能系统失去信任。
价值:人工智能成功的真实评价指标
这是我第一次讨论 5 个 V 当时,价值就是把数据转换成有用的观点。现在,这已经成为一件大事。人工智能必须通过促进实际业务成果来证明其价值,例如提高效率、降低成本和指导来做出更明智的决策。
价值不仅关系到商业,也关系到对社会的贡献。人工智能有能力应对医疗卫生和教育行业的重大全球问题。然而,为了真正释放这一潜力,组织需要确保其人工智能项目符合其目标,并真正为有意义的事情做出贡献。
为什么“5V”比以往任何时候都更重要?
回顾我在 2010 在2008年的演讲中,我很惊讶这五个原则仍然具有现实意义和重要性,尤其是在人工智能带来的所有挑战下。随着越来越多的组织选择人工智能,这五个 V 提供一份简单而永恒的指南,可以帮助您规范人工智能的使用:
数量——确保我们有促进人工智能所需的数据。
速率——驱动即时使用和响应能力。
多样性——使人工智能能够处理现代数据的复杂性。
真实性——为降低风险和道德实施建立必要的信任。
价值——使我们专注于重要的结果。
这不仅仅是技术细节,更是哲学。选择这五个原则。 V 帮助我们建立不仅功能齐全,而且负责任,可扩展,目的是造福所有人。 AI 系统。
展望未来
在进入人工智能驱动的未来时,我们所学到的经验教训将继续照亮我们前进的道路。五个 V 警告我们,人工智能不仅仅是一种工具,更是一种创新的心跳。不管是什么。 2010 年、2025 2008年或更远的未来,这些原则不断向我们展示如何谨慎、创造性地对待人工智能,并专注于做伟大的事情。

在当今世界,数据已经成为公司能够拥有的最有力的资产之一。它不仅具有促进创新的潜力,还能提高管理能力,创造竞争优势。然而,能力越强,责任越大。如果组织对数据的处理不当,背景或道德考虑不当,可能会对个人、社区甚至社会造成严重伤害。如果处理不当,数据可能会从强大的资产变成危险的武器。
数据处理粗心现象的兴起
很多组织,尤其是那些刚刚接触到数据管理的组织,通常被视为抽象或纯粹的技术资源。这是 IT 为了提高洞察力,部门管理或分析物品。但是,这一观点忽略了一个关键事实:数据与人有关。不管是客户数据,员工数据,还是敏感的商业信息,日常生活和生计都与这些行和行密切相关。对于负责任的数据管理来说,了解这个人为因素尤为重要。
但是,企业往往无法认识到这种人为因素。有时候,数据处理不当,是因为无知或疏忽。在没有适当指导的情况下,产品所有者或业务团队接收新数据时,他们就为隐性乱用打开了大门。这种情况发生在组织将数据视为资产,但不作为资产保护的情况下。它们随意对待数据,让错误的假设、松散的控制和偏见的解释盛行起来。如果以这种方式错误地处理数据,将会产生非常严重的后果。
根据《哈佛商业评论》的报道,每年都会给美国经济带来不良数据。 3.1 造成万亿美元损失的主要原因是生产力损失和运营成本增加。根据 Experian 《全球数据管理报告》,组织费用 30-50% 修复数据错误和管理修复的时间。这一数字表明,不慎使用数据对日常业务运作的影响是多么普遍,强调了负责任数据管理的必要性。
数据滥用及其对个人的影响
不小心处理数据可能会导致隐私和保密的侵犯。例如,由于数据泄露,个人的个人数据可能会暴露。2021 年,身份盗窃资源中心 (ITRC) 报告显示,美国数据泄露事件得到加强 68%,2.94 亿万人面临身份盗窃和金融诈骗的危险。但是这并不只是泄露。不恰当的数据可能会导致有害的决定——拒绝根据错误的信用信息向某人提供贷款,或者在健康保单中对其进行错误的分类。当历史不平等被列入算法时,数据可能会加强系统性成见。若数据被滥用,则会加强歧视,使已被边缘化的人更加脆弱。
此外,当组织采用个人数据而不同意或不清楚其影响时,信任感就会减弱。普华永道的一项调查显示,如果消费者担心公司的数据安全实践,85% 有些消费者不能和他们做生意。如果信息操作不当,每个人都会感到被侵犯,对本该保护他们的机构失去信心。
对医疗卫生等领域的影响更为长远。 IBM 2023年数据泄露成本报告 年度医疗卫生数据泄露的平均费用 1093 一万美元比其他任何行业都高。医疗卫生泄露除了财务影响外,还可能泄露敏感患者的信息,使个人面临情绪、社会和经济伤害的风险。
随意使用数据带来的商业和社会成本
当组织将数据视为免费资源时,他们往往忽略了这种方法带来的隐性成本。粗心的数据实践有时会导致所谓的“隐藏数据工厂”,手动维修和低效的流程会降低生产力。更糟糕的是,当出现问题时,这些做法可能会损害罚款、法律纠纷和声誉。
比如,2023 年,Meta(Facebook)因为违反了《通用数据保护条例》(GDPR)面临 13 一亿美元的罚款,这是该条例至今最严重的罚款。这个明确提示组织不能放松数据管理。
在社会层面,数据的乱用会加剧刻板印象,排除服务之外的边缘群体,甚至操纵公众舆论。AI Now Institute 一项研究发现,58%的算法被用于招聘或贷款等高风险决策, 对少数群体表现出偏见。这样就会造成实际的伤害,比如拒绝贷款或者不公平地工作。使用偏见算法(例如,在刑事司法系统中) COMPAS(代替制裁的惩罚罪犯管理分析))已经被证明会错误地预测黑人被告的再犯率高于白人被告,这表明当数据被意外使用时,算法偏见会产生毁灭性的影响。
从数据疏忽到数据问责
组织必须改变处理数据的思维方式。首先要明白,数据治理不仅仅是一种 IT 这是一种商业责任。资料不只是一种可以探索的资源;它也是一种重要的资产,可以反映和影响人类的生活。
从高层领导到产品团队,适当的数据治理实践必须融入组织的各个层面。这意味着建立明确的数据所有权结构,实施强大的安全协议,以确保数据采集、使用和存储方式的透明度。
另外,企业需要有责任感。下列关键问题必须提出:
我们有没有考虑过我们的数据实践对个人的影响?
我们是否允许偏见渗透到我们的算法中?
收集和使用数据的方法是否透明,是否符合道德?
这一问题没有得到解决的后果是严重的。思科 2023 年度数据隐私标准研究显示,90% 由于客户数据的隐私问题,该组织经历了销售周期的延迟。数据处理不慎会损害大家的利益,缓解业务运营,影响收入增长。
赋予每个人权力,通过符合道德的数据实践。
数据应该给人力量,而不是伤害他们。如果我们仔细负责地处理数据,它可能会改变现状,创造公平,促进进步。但是,如果处理不当,可能会加剧不平等,削弱信任。
符合道德的数据实践不仅是控制的前提,也是道德义务。根据埃森哲的数字信任调查,重视数据道德的公司客户信任度提高了 11%促进了忠诚度和增长。组织不仅可以避免数据处理不当带来的负面影响,还可以通过尊重数据、保证数据完整性、负责任地使用数据来为更公平公正的社会做出贡献。
在这个数据决定我们做决定的时代,让我们记住,人是每个数据点的核心。每个人都应该受到尊严的对待,而不是被视为可以随意操纵的统计数据。
行动呼吁
随着我们进入大数据和人工智能时代,如何强调负责任的数据管理的必要性并不过分。是时候让组织认真审视他们的数据实践,以确保AI为客户谋取利益,而不是反对他们了。
数据不仅仅是数字——它是一个故事,一个生命,一个人。
本文来自微信微信官方账号“数据驱动智能”(ID:Data作者:晓晓,36氪经授权发布,_0101)。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




