谈谈数据产品的分类
现在,数据产品已经引起了许多讨论,但是对于这个术语的具体含义却没有明确的共识。所以,它经常被用来描述完全不同的物品。
软件应用程序是数据产品。
对我来说,数据产品本质上是一个软件应用程序。它是由界面、代码、数据和基础设施组成的管理单元,就像任何软件一样。即使数据本身有明确的所有权,并在市场上发布以供使用,它也不是数据产品。
然而,并不是所有的软件应用都是数据产品。要将应用程序视为数据产品,它需要具备两个关键特征:它必须是商品,并提供直接由其管理的数据驱动的功能。让我们仔细看看这些特征意味着什么。

假如软件应用程序是根据商品管理原则开发的,那么它就是产品。。不同于基于项目的应用程序,商品不仅满足了一组事先定义的时间和预算要求(导出)。相反,它致力于解决问题,为用户提供真正的价值(结果)。此外,商品拥有一个业主,通常是一个专门的团队,他们在生命周期的每个阶段(从构思到退休)管理产品,并随着时间的推移而发展。
假如数据不仅是软件功能的副产物,也是软件功能塑造的重要因素,软体应用程序是由数据驱动的。。交易应用程序优先考虑功能,它们产生的数据起着次要的作用。相比之下,数据产品在其管理数据之上构建了功能。在这里,数据是第一位的,它驱动功能,成为产品的核心部分。
总而言之,这就是我定义数据产品:
数据产品是一种软件应用程序由数据驱动,并遵循商品管理原则。
仪表板是数据产品吗?
按照这一定义,仪表板和 ML 模型是数据产品,对吗?假如它们是按照商品管理原则开发的,对于这个问题,我的回答肯定是肯定的。。但是,仪表板和 ML 模型等分析应用程序不是唯一可能的数据产品类型。除了便于管理、浏览和使用所需的功能外,还有一些数据产品只以纯粹的方式公开数据,而不是在其上构建特定的功能。这些纯数据产品的开发不是为了支持特定的用例,而是为了使数据资产容易随着时间的推移和与其他数据资产的组合。

在《以数据为产品管理》一书中,我们致力于探索如何设计一个技术架构来支持这种特定类型的纯数据产品的发展和可持续演变。以下是纯数据产品的概念:
纯数据产品在数据架构中模块化模块,按照团队负责人的要求根据商品管理原则,量身定做思维能力。为了使一个或多个数据资产进行设计准确、相关、可组合、可随时使用。未来的价值创造。
为什么要关注纯数据产品?
数据是一种资产,只有在使用时才有价值。纯数据产品可以通过其他分析和非分析应用程序访问数据,而不是直接使用数据来促进其使用。这就提出了一个问题:致力于这种类型的数据产品有什么意义?开发一个能满足组织和终端用户高价值用例的分析应用程序还不够吗?
对于这个问题,我的回答是肯定的“不”。如果没有纯数据产品,为了将原始数据转换为开发其功能的正确格式,每个分析应用程序都必须重新实现所有必要的集成。因此,每个应用程序都变成了一个数据孤岛,必须重新复制集成工作(可能已经由其他应用程序完成),这显然会导致维护成本和移位风险。
终端用户只关心结果。它们不在乎分析应用程序是从零开始重新实现整合逻辑,还是依赖于未来可以重复使用的纯数据产品。许多情况下,他们可能更喜欢允许更快地实施分析应用的选项。当没有当前的纯数据产品组合时,最快的选择始终是从应用程序中直接实现临时集成,而不是先开发纯数据产品,然后在此基础上构建分析应用程序。然而,从中期来看,这种实施新用例的方法变得不可持续。由于维护成本高,每个分析应用程序使用不同的逻辑来整合相同数据的多个副本会导致数据质量问题。

纯数据产品是一种在组织中合理化与关键数据资产相关的集成工作方法,可以用来提供多种用例。纯数据产品是一个模块,可以随着时间的推移实现数据的可持续管理,控制维护成本,保证质量。
纯粹的数据产品和分析应用一样重要,两者缺一不可。正如我们所讨论的,如果我们不支持纯数据产品(根据订单设计),开发和分析应用程序是不现实的,因为从长远来看,整体数据结构是不可持续的。另一方面,如果开发纯数据产品而不支持任何分析应用程序(根据订单库存),那么开发和分析应用程序是没有意义的,因为未使用的数据只是非生产性成本。正确的方法是按照用例驱动的方法(按订单编写)同时开发纯数据产品和分析应用程序。

纯粹的数据产品真的是商品吗?
假如应用程序没有被业务用户直接使用,那么称之为商品真的有意义吗?这个问题我的答案是肯定的。。为了被视为商品,应用程序需要用户认可其价值,并且愿意付费使用。DBMS 这是一种商品,就像 BI 工具一样,即便后者直接由企业使用,而前者则不是。同样,纯数据产品也这是一种商品,就像分析应用程序一样。客户可能有所不同,但定义产品的所有元素都存在(所有权、生命周期、客户等)。
此外,一个完善的纯数据产品应该使其管理的数据资产尽可能容易理解、查询和使用,即使是技术水平较低的用户也可以轻松使用。一个好的纯数据产品应该可以被业务客户甚至外部客户使用。
DWH 或 DATA LAKE 是纯数据产品吗?
纯数据产品充当数据制造商和数据客户之间的桥梁,创建解耦层,允许重量和共享集成工作。本质上,他们就是 DWH 以及数据湖多年来一直在做的事情。所以,真的有必要引入这个新的范式吗?DWH 而且数据湖不能简单地被视为纯数据产品吗?
答案是“不”。DWH而且数据湖确实是一个软件应用程序,以纯数据的形式提供数据,但是规模也很重要。正如上面的定义一样,“纯数据产品在数据架构中模块化模块,按照团队负责人的要求量身定做的思维能力。
DWH 与数据湖一样,它是一个单一的应用程序,其复杂性很快超过了团队开发和维护的思维能力。在系统无法承受复杂性压力之前,这通常会导致开发速度变慢,技术债务加速增长。许多组织不得不多次重建其数据平台,并遵循“推倒重来”的策略,这并非巧合。但是,对于复制相同单体架构的旧系统实现平台重建,并未解决与可持续管理相关的复杂性相关的核心问题。
建立一个模块化的平台,可以将这种复杂性分解成更小、更容易管理的部分,由开发团队或几个团队处理。这就是为什么纯数据产品不能超过开发团队的思维能力。

数据湖和 DWH 类似于单片交易应用程序;他们在管理复杂性方面也面临着类似的问题。相反,纯数据产品通过使用模块化力量解决了问题。 DWH 就像微服务解决了单片事务应用程序的问题一样,数据湖的问题。
总结
因为我把数据产品分为两类。 - 一种是基于数据的公开功能,另一种是只提供使代管数据易于重用的功能。 - 为了清楚地识别它们,我需要引入两个术语。有必要吗?也许没有必要,但是如果没有它,每当我需要区分这两种数据产品时,我必须重复定义。我用纯数据产品和分析商品这两个术语来简单方便。诚然,有更好的名字,但重要的是概念,而非名字。名字只是一种代表概念的方式。如果您找到了更好的术语,请随意使用,只要我们在意义上保持一致。
本文来自微信微信官方账号“数据驱动智能”(ID:Data作者:晓晓,36氪经授权发布,_0101)。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




