卓越方达logo200*800

拖放、分析:无代码数据科学的兴起

拖放、分析:无代码数据科学的兴起

近年来,数据科学中的无代码或低代码功能获得了巨大的吸引力。这些解决方案经过充分验证和成熟,它们使更广泛的人更容易访问数据科学。

数据从业者面临的挑战之一是必须为每个新用例从头开始编写所有内容。这可能是一个耗时且效率低下的过程。无代码或低代码解决方案可帮助数据科学家创建可应用于各种用例的可重用解决方案。这可以节省时间和精力,并提高数据科学项目的质量。

在数据科学中,您几乎可以完成所有工作,而无需编写任何代码。“无代码或低代码解决方案是数据科学的未来,”Altair 产品开发高级副总裁兼数据科学平台 RapidMiner 创始人 Ingo Mierswa 评论道。作为无代码数据科学领域的知名发明者,他的专业知识和贡献影响了这些功能在行业中的采用和实施。“这些功能,”Mierswa在我们的采访电话中评论道,“使没有大量编程经验的人能够构建和部署数据科学模型。这有助于使数据科学民主化,并使每个人都更容易获得数据科学。

“当我发现自己是一名计算机科学家时,没有无代码或低代码平台,我为每个新用例重新创建了非常相似的解决方案。这是一个低效的过程,感觉就像是在浪费时间,“Mierswa 分享道。他幽默地阐述了基础知识,“如果你第二次解决了一个问题,但你还在编码,这意味着你第一次没有正确解决它。您应该已经创建了一个解决方案,可以重复使用该解决方案来一遍又一遍地解决相同或类似的问题。“他断言,人们”往往没有意识到他们的问题有多么相似,结果,他们最终会重复编写同样的东西。他们应该问的问题是,“为什么我还在编码?也许他们不应该为了节省时间和精力而这样做。

多样化的加速

无代码或低代码数据科学解决方案可能非常有益。“第一个也是最重要的好处是,它们可以带来更好的合作形式,”Mierswa强调说。“如果解释可视化工作流程或模型,每个人都可以理解它们,但是,不是每个人都是计算机科学家或程序员,也不是每个人都能理解代码。因此,为了有效地协作,您需要了解团队正在共同生产哪些资产。“归根结底,数据科学是一项团队运动。你需要了解业务问题的人,无论他们是否会编码,因为编码可能不是他们的日常工作。

然后你有其他人可以访问数据,他们沉浸在计算思维中,他们会想,“好吧,好吧,看,如果我想构建一些机器学习模型,我需要以特定的方式转换我的数据。这是一项很棒的技能,他们也需要合作,但同样,对于这样的技能,我们知道 ETL 产品已经存在了很长时间。“是的,在极少数情况下,在特殊的、非常自定义的情况下,你仍然需要编码。即使在这些情况下,这也是百分之一的例外,“米尔斯瓦指出。“这不应该是常态,但当你将所有不同的技能、数据、人员和专业知识结合在一起时,真正的魔力就会发生。”

“你永远不会看到纯粹基于代码的方法。你永远不会得到利益相关者的支持。这通常会导致我所说的死项目。我们应该将数据科学视为解决问题的方法。我们不应该把它当作一种科学的方法,我们是否真的创造了一个解决方案并不重要。米尔斯瓦推理道。“这很重要。我们在这里解决了数百万美元的业务问题。我们实际上应该努力找到可行的解决方案,获得支持,部署它,并真正改善我们在这里的处境。不要说,’是的,我知道如果它失败了怎么办,我不在乎。因此,合作是一个巨大的好处,“他肯定地说。

加速是另一个问题,Mierswa解释道。当您通过编码执行重复性任务时,您不会以最快的方式工作。例如,如果我创建一个由 5 个或 10 个操作员组成的 RapidMiner 工作流程,这通常相当于数千行代码。复制和粘贴代码可能会减慢速度,但低代码平台可以帮助您更快地创建自定义解决方案。

问责制往往很容易被忽视,但却是最重要的好处。创建基于代码的解决方案时,可能很难跟踪谁进行了更改以及更改的原因。“当其他人需要接管项目或代码中存在错误时,这可能会导致问题。另一方面,低代码平台是自我记录的。这意味着您创建的可视化工作流还附带了说明工作流功能的文档。“这使得理解和维护代码变得更加容易,也有助于确保问责制,”Mierswa说。“人们明白这一点。他们接受这一点,但他们也可以拥有这些结果的所有权。作为一个团队,集体。

开放的生态系统

人工智能进步的洪流正在改变数据科学的格局,想要保持领先地位的公司是开放的,使用开源和开放标准,并且不隐瞒任何在数据科学市场中非常重要的东西。

一直保持开放的公司之所以处于胜利地位,是因为市场瞬息万变,需要不断迭代。“在过去的10到20年里,整个数据科学市场都是如此,”Mierswa反映道,“市场的快节奏性质需要不断迭代,因此关闭生态系统是极其不明智的。这就是为什么一些传统上被关闭的公司已经开放,甚至采用供应商中立的方法来支持更多的编程语言和集成。

虽然代码可选方法允许研究人员在不编写任何代码的情况下执行复杂的数据分析任务,但在某些情况下可能需要编码。在这种情况下,大多数低代码平台都与编程语言、机器学习库和深度学习环境集成。Mierswa指出,它们还为用户提供了探索第三方解决方案市场的能力。“RapidMiner 甚至提供了一个操作员框架,允许用户创建自己的可视化工作流程。该操作框架使扩展和重用工作流程变得容易,为数据分析提供了一种灵活且可定制的方法。