数据分析是对数据、统计数据或其他形式的信息进行计算分析,以提取知识、行为模式或其他形式的可操作见解。
通过数据分析,可以获得许多见解。一些示例包括但不限于:
数据分析是为了做出更好的决策。这个复杂的过程主要由数据分析师和数据科学家执行,但在某些情况下,使用正确的工具,也可以由非技术人员完成。该过程通常从原始数据开始,这些数据是挖掘的数据,寻求有价值的洞察力——事实上,竞争优势是业务数据分析的目标。
随着数字化转型的采用,数据分析的实践飞速发展。无论您在哪个行业工作,数据分析都可能在制定您的战略方面发挥关键作用。现在,许多公司都有数据分析师对原始数据使用数据挖掘技术——寻求从此过程中获得的许多可操作的见解。
作为回应,数据分析软件市场迅速攀升。根据 IDC 的数据,到 2021 年,全球在大数据和业务分析解决方案上的支出将增长 10.1%,达到 2157 亿美元。公司正在稳步招聘数据科学家和数据分析师。现在的口头禅是“数据驱动的决策”。
值得注意的是,即使在全球冠状病毒大流行最黑暗的日子里,对数据分析的投资也没有下降。IDC 研究经理 Jennifer Hamel 表示:“与 IT 服务市场的许多其他领域不同,大数据和分析服务在 2020 年继续增长,因为组织依靠数据洞察和智能自动化解决方案在 COVID-19 大流行中生存下来。“数字弹性的下一阶段将刺激对服务的投资增加,以应对与企业智能计划相关的挥之不去的挑战和新的挑战。”
数据分析的这些日益增长的重要性涵盖了现代企业中常见的广泛活动。例如,数据分析可以包括以下许多内容:
此外,从财务到会计,从产品管理到制造,广泛的学科都利用数据分析和各种大数据趋势。一系列相关的行动和技术也发挥了作用,包括数据可视化和关系数据库,通常使用大型数据集。
数据分析是研发、工程和战略规划不可或缺的一部分。当然,这是物流和供应链管理的核心。每年,分析在信息技术和网络安全中都发挥着越来越大的作用。总而言之,几乎没有一个行业不是由数据分析驱动的。
如今,许多组织都有一位首席数据官,其工作是监督组织内数据管理的各个方面,包括数据分析和数据科学。
并非所有的数据分析都是一样的。大多数专家将数据分析分为四种关键类型,包括描述性、诊断性、预测性和规定性。
描述性分析描述了过去发生的事情或当前正在发生的事情。这种类型的分析可以回答诸如谁、什么、在哪里、何时以及如何等问题。例如,显示过去四个季度的月度销售额的销售报告就是描述性分析的一个示例。这是最容易执行的分析类型,但它对组织的价值有限。但是,您不能将其排除在外,因为描述性分析是更高级分析类型的必要基础。
诊断分析会告诉您发生某些事情的原因。例如,如果您的描述性分析告诉您上个季度的销售额有所下降,那么诊断分析将帮助您找出出了什么问题。这种类型的分析通常涉及合并多个数据集,以更全面、更准确地评估您的情况。也许您的销售额下降是由于供应链问题或恶劣天气造成的,或者是因为您在雇用新销售人员后丢失了关键客户。诊断分析可以帮助您弄清楚这一点。
预测分析可帮助您了解接下来可能发生的情况。它着眼于历史趋势,寻找能够为未来提供洞察力的模式。通常,预测分析工具依赖于先进的数据模型和机器学习技术,这些技术可以提炼出影响过去表现的重要因素,并将其应用于当前情况。这是一种更高级和投机性的分析形式,具有很高的潜在价值。它正在成为一种非常常见的工具,特别是对于大型企业而言。
规范性分析试图告诉你应该如何应对未来可能发生的情况。例如,如果您的预测分析预测下个季度的销售额会下降,那么规范性分析可以帮助您了解如果您降低价格或改变营销策略或从不同供应商处采购产品,这种情况可能会如何变化。显然,规范性分析的潜在好处非常高,但要做好规范性分析也非常困难。目前,很少有组织拥有大规模进行规范性分析的资源和能力。
大多数组织都是从描述性分析开始他们的数据分析之旅的。随着时间的推移,它们扩展到诊断分析,然后是预测分析。许多人渴望最终拥有一个成功的规范性分析程序,以更好地为他们的业务决策提供信息。
大多数专家都认为,数据分析对于现代组织来说非常重要,因为它可以帮助他们提高竞争力。组织进行数据分析 – 使用数据分析师 – 出于多种原因。您可以使用数据分析执行的一些最常见的操作包括:
大多数组织都可以访问有关其客户的各种数据,包括人口统计、订单历史记录、客户服务互动、社交媒体、浏览历史记录、调查回复等。雇用数据分析师来分析这些数据可以帮助公司更全面地了解每个客户以及整个客户的总体情况。此外,它可能会突出更好地满足客户需求或接触新买家群体的机会。
组织内的许多流程,从接受订单到履行,到供应链管理,到客户服务,再到 IT 运营等等,都是可衡量的。任何你能衡量的东西,你都可以改进。数据分析可以帮助您跟踪关键绩效指标 (KPI) 的进度,并帮助您确定当前可能减慢组织速度的瓶颈。
数据分析的一个更有趣的领域是空白分析学科。这种做法可以帮助组织识别他们今天没有做但他们可以做的业务。它可以帮助您找到新客户、新产品和新的合作伙伴关系,从而增加收入和利润率。
即使是最基本的数据可视化,也很容易看到 KPI 的移动方向和速度。通过识别这些趋势(通常是筛选原始数据),您可以做更多运作良好的事情,并尝试纠正错误方向的事情。
市场营销是被数据分析改变最大的商业学科之一。由于如此多的营销都是以数字方式进行的,因此营销团队拥有丰富的可用数据,可以帮助他们确定哪些目标最有可能成为客户,哪些客户可能会再次购买,哪些客户有流向竞争对手的危险等等。他们经常使用数据可视化来帮助数据挖掘以获得业务洞察力。
如果仅将价格提高 1% 就可以将组织的整体利润率提高多达 10%,那会怎样?分析可以帮助您分析变量。数据分析可以帮助定价团队确定他们应该在哪些方面提高价格(以及应该降低价格),以最大限度地提高盈利能力。
人类总是出于情感原因而做出决定,通常基于先入为主的观念,这些观念可能是真的,也可能是假的。数据分析对这种直觉进行了强有力的检查,以便企业领导者可以看到他们的直觉反应是否可能导致成功。从广义上讲,数据分析可以帮助企业改善整个组织的决策。
像每一种技术解决方案一样,数据分析对任何选择接受它的人来说都面临着挑战。这些问题包括缺乏训练有素的员工,以及数据可视化方面的困难。
分析、大数据和人工智能都是新兴技术,在过去几年中才开始真正站稳脚跟。这意味着他们背后的培训和教育也进一步缺乏。许多大学正在整合本科和研究生课程,CompTIA 和 Coursera 等技术教育机构也努力让人们接受培训。但是,由于各种原因,例如教育成本,仍然存在人才短缺。这种短缺不会在短期内得到缓解。
组织内的业务部门可能都在同一条船上,但往往不会这样想。根据Forbes Insights和思科的研究,70%的领导者表示,成功的分析策略取决于IT和业务部门之间的密切合作,但总体而言,只有15%的全球高管认为这两个群体之间的分析互动“非常好”,而39%的人认为业务与IT之间的合作是“公平的”。
这种分裂的后果是,对分析的投资不会为人们提供他们需要的信息,而超过三分之一的受访者认为这种短缺阻碍了利用技术创新。因此,让 IT 和业务部门达成共识并达成共识非常重要。
今天接收/收集数据的方式与以前大不相同。通过手动输入数据库,所有内容都进入了整齐的行和列。现在,非结构化数据的出现、来自边缘的大量数据以及社交媒体等新来源的出现。
结果往往是数据是孤立的,不容易获得。必须对收集的数据进行处理,这可能需要相当长的时间。将来自不同来源的数据放在一起意味着多重挑战,从将其从污垢数据存储中取出到将它们全部组合成一种格式。数据科学家必须做很多工作才能使数据变得可用,而这就是分析数据所花费的时间。
如果你试图从数据库中收集信息,你的眼睛会很快盯着一行又一列的数字和文本信息。要真正获得知识,您必须参与数据的可视化,并以揭示信息的形式显示数据,例如趋势、异常和异常。
虽然数据可视化工具非常有用,但它们并不容易使用。但是,有很多选择,从初学者工具 Microsoft Excel 到 Tableau 等更高级的工具。但它们都有陡峭的学习曲线,需要时间和培训。
数据分析和人工智能有着协同关系。在某种程度上,他们需要彼此。人工智能需要大量的数据进行训练和机器学习,但并非每一点数据都是有用或有帮助的。您需要某种方法来筛选数据,以找到相关的、有用的数据,并删除您不需要的数据。
通过部署 AI 进行更好的数据分析,您可以更好地利用剩余的数据,并更轻松地将其用于高级分析功能,例如预测分析。两者的结合可以通过多种方式改善您的业务:
许多最大的企业 IT 公司都专门从事数据分析。以下是主要供应商的列表,但绝不是该领域公司的完整列表。
尽管它们相似且密切相关,并且经常混淆,但数据科学和数据分析并不是一回事。
简而言之,数据分析是一门商业学科,而数据科学是一门技术学科。数据分析的目标是回答特定的业务问题,而数据科学的目标是准备、转换和组织数据,使其有用。数据分析需要对特定业务领域(如金融或营销)有深入的了解,而数据科学需要对数学和技术学科有深入的了解,如统计建模和编程。
《哈佛商业评论》解释说:“数据分析是指分析数据以回答问题、提取见解和识别趋势的过程和实践……数据科学以构建、清理和组织数据集为中心。
在实践中,数据科学家和数据分析师经常非常紧密地合作,甚至可能是组织内同一团队的一部分。
在接下来的几年里,数据分析的使用几乎肯定会继续急剧增长。然而,并非所有组织都能通过他们的分析工作取得成功。
简而言之,分析现在是必不可少的。Gartner 警告说:“到 2025 年,80% 寻求扩展数字业务的组织将失败,因为他们没有采用现代方法来进行数据和分析治理。
除了数据治理之外,其他值得关注的关键趋势包括:
云计算: 如今,大多数数据分析都在云中进行,而且这种趋势可能会增加。由于组织将大部分数据存储在云提供商处,因此分析数据的存储位置以最大限度地降低成本并利用云服务的可扩展性和可靠性是有意义的。
人工智能和机器学习:许多最复杂的数据分析形式,包括预测分析和规范性分析,都依赖于人工智能和机器学习能力。随着这些技术的进步,分析将变得更加强大。
合成数据:隐私法规通常会限制组织可以直接对客户数据执行的分析量。解决这个问题的方法之一是使用合成数据,这些数据是匿名的,通常由数据模型和算法生成。
多个分析解决方案和中心:大多数大型企业发现,没有一个单一的分析解决方案可以满足他们在整个组织中的所有需求。专家表示,最成功的公司可能是那些找到创新方法来结合各种分析解决方案和数据存储库的公司。
从长远来看,紧跟这些趋势的组织,以及通过数据分析工作确定的其他组织,可能是最成功的组织。