机器学习替换数据科学家吗?

数据科学

人们已经开始在人工智能用来自动化任何事情和一切的可能性上跳跃。现在,AI已经证明它具有推出蓝领工作(通过机器人)和白领专业的倾向(通过自然语言处理),围绕这项技术的文化易感性正在上升。经过几十年的探索象征性AI方法,该领域已经转移到统计方法,最近开始以大量的方式工作,主要是由于数据和计算能力的波浪。这意外地导致机器学习的兴起。

在今天的数字世界中,机器学习和大数据分析已成为业务的主食,越来越多地被组织纳入商业策略。 “数据驱动的企业”使所有这一切的决策都根据他们从收集的数据获得的洞察力。然而,作为A.I和机器学习在企业中继续发展更大的作用,就有很多谈论数据科学家变得过上的作用。 Microsoft Titans的机器学习在Microsoft和Google等大多数由数据科学家处理的工作中的进展将在不久的将来自动化。 Gartner还近期报告称,40%的数据科学任务将自动化2020年。

机器学习与数据科学之间的差异

数据科学主要是用于解决大数据的概念,包括数据准备,清洁和分析。大数据的兴起引发了数据科学的兴起,支持企业的需求,从而从巨大的非结构化数据集中获得见解。虽然典型的数据科学家被设想为在Hadoop,SQL,Python,R和统计数据中经历的程序员,但这只是数据科学冰山一角。基本上,数据科学家通过分析它们和开发数据驱动的答案来解决真正的公司问题,它们是如何无关的。 “数据学杂志”将其描述为“几乎所有与数据有关的一切......然而最重要的部分是其应用程序 - 各种应用程序”。其中一个应用程序是机器学习。

大数据的兴起还使得可以用数据驱动方法训练机器,而不是知识驱动方法。与经常性神经网络有关的理论研究变得可行;从学术概念转换到有形,有用的机器学习的深度学习,每天都会影响出来的机器学习。机器学习和A.I现在已经主导了媒体,掩盖了数据科学的每一个方面。因此,现在数据科学家的普遍认为是专注于机器学习和A.I的研究员。实际上有意义数据科学超越机器学习。

机器学习基本上是一组算法,这些算法在一组数据上训练以微调其参数。获取培训数据依赖于多个数据科学技术,如监督群集和回归。另一方面,数据科学中的“数据”可以或可能不会从机械过程或机器演变。两者之间的主要区别在于数据科学涵盖了整个数据处理的频谱,而不仅仅是统计或算法方面。

人类直觉不能自动化

由于其目标尤其是人类专注的事实,数据科学与机器学习可区分 - 以获得洞察力和理解。总是必须是循环中的人。数据科学家利用工程,统计和人类专业知识的组合来了解商业角度的数据,并提供准确的见解和预测。虽然ML算法有助于识别组织趋势,但它们在数据驱动过程中的作用仅限于对未来结果的预测。它们尚未完全能够理解企业及其关系的特定数据意味着什么,甚至是不同不连接的操作之间的关系。

数据科学家的判断和批判性思考在监测参数并确保满足业务的定制需求方面是不可或缺的。一旦提出所有问题,都会收集数据,并通过必要的算法运行。一个挑剔的数据科学家必须弄清楚较大的业务影响并提供外卖。最终,驾驶这些举措的互动人际关系谈话是通过抽象的,创造性的思维推动,这些思维不能被任何现代机器所取代。

AI的进展是推动人才需求

随着转型AI波从企业跨越终端市场切断消费者平台,从机器人到网络安全,数据科学家的需求只是可能成长。数据科学家的作用可能是典型计算机科学时尚的新的重要性和发展程度。随着机器准确分析数据的能力增加,借助于专家统计建模和由数据科学家创建的固体算法。数据科学家将提升“抽象刻度”并开始处理更高的级别和更复杂的任务。目前的需求明确地分析了供应。麦肯锡全球研究所估计,美国可以在2024年度拥有大约250,000个开放的数据科学职位。这种数据科学技能差距可能会使公司争夺雇用能够满足其分析需求的候选人。

在结束时

机器学习替换数据科学家吗?简短的答案是否定的,或者至少还没有。低级数据科学的某些方面可以,应该是自动化的。然而,机器学习正在为数据科学家创造真正需要。由于AI进步分析和建立成因以及相关性,软件将用于收集和分析数据;但ML工具尚未拥有人类的好奇心或创造和验证实验的愿望。数据科学的那个方面可能永远不会随时自动化。人类智慧对数据科学领域至关重要,尽管机器学习可以提供帮助,但它不能完全接管。

 

作者– Gabriel Lando