实用机器学习提示和技巧实现成功更快

如果你厌倦了阅读和听到AI如何解决世界问题,请举手。如果你已经被认为相信AI将足够地取代大多数人,请给我们喊叫。我们也耗尽了,特别是考虑到AI本质上是一个60 +年的旧科技概念!

 

 

炒作过载的原因是什么?

“真正的无废话AI”空间中的专家表示,它是机器学习算法的有效性的指数进展,导致AI Buzz。然而,这是嗡嗡声将消耗的阶段(因为它已经达到顶峰),并且焦点将以尺度移动到AI的真实应用。如果您的组织的AI策略未被签出,或者如果您正在寻找课程更正,这里有一些实用的提示,使机器学习您现在和未来的超级巨星。

 

“好”不应该被追求“伟大”殴打

我们强烈建议您通过机器学习成功案例研究进行精神票据。其中许多人将清楚地展示机器学习成功的成功通常在很大程度上取决于数据质量,数据科学家了解商业用例的能力,以及一些运气。

通常足够,可以通过“足够好”的机器学习算法提供60-70%的所需功能。从“善”到“伟大”的旅程是长期,昂贵,暧昧和艰难的。因此,必须通过商业理由支持额外的努力(对于检测来自医疗扫描的群体的算法,性能的5%的提高是无价的,但对于一种预测侦听者可能喜欢的歌曲的算法而言并不是一半的一半。 。

 

首先,算法第二。或者其他方式?

考虑到负责电子邮件营销个性化算法的机器学习专家团队。考虑另一个负责算法的团队,使无人驾驶的面制车辆安全地在雨季条件下行动。现在,假设这两个团队都能够建立一个最低可行的算法,可提供核心预期的实用程序,在那里的增量努力应该去。

在第一种情况下,算法微调可能不会返回工程师通过优化与过程相关的数据和物流来实现的一半值。在第二种情况下,该算法首先是,因为失败成本是大量的。因此,ML专家需要能够在商业用例和物流的背景下了解他们的发展,以便在正确的方向上介绍他们的资源。

 

Mathematica.

这是数据,而不是算法

毫克算法的成功响亮了吗?用另一种算法评分令人难忘的失败?机会是,它是驾驶结果的数据,而不是算法。

一些有前景的ML发展从未看到过生产的一天,因为开发人员的自我使算法经历了几十个迭代,每次都使其变得更加复杂和扭曲。如果您预计组织机器学习团队中的这种情况,请控制,并通过质疑数据而开始,而不是算法。

 

如果普通的ML算法可以提供良好的效果,如果它的学习数据是强大的。但是,如果它的学习数据不好,则会提供垃圾量提供垃圾。

 

 

添加人体元素

面对现实吧;您可以难以羡慕拥有机器学习算法开发人员和数据科学家,具有域和商业体验。为了确保您的组织的机器学习项目最终不仅仅是实验室成功,您需要人们的商业流程大师,了解数据流水线,并欣赏机器学习的基础知识。这是您如何构建一个团队,知道是否有必要创建新的数据捕获进程,消除商业人员不会使用的昂贵和费力的功能,以及如何在用例的上下文中评估开发的进度。

 

特征工程专家是任何ML团队的关键要素。虽然特征选择过程可以在很大程度上自动化,但它是有助于人类监督的可用性,帮助ML团队创建突破性算法。对于与数据选择和处理有关的所有决定,这同样如此。事实上,ML专家认为,团队证明或反驳一个想法的有效性的能力是机器学习成功的关键差异化因素。你需要一个有洞察力的人类存在。

 

用工具贴身

平均机器学习项目将需要开发人员在5到8个工具之间使用任何内容,总是如此。这是自然的,考虑到机器学习界可用的广泛的利基工具。

对于初学者来说,基于订阅的ML工具,如亚马逊机器学习和Microsoft Azure Machine Studio Studio将帮助您快速扩展。 Bigml是另一个平台慢慢获得牵引力。然后,有Apache软件基金会(ASF)项目,如Singa和Mahout。当然,机器学习的开源框架,例如H2O,Tensorflow和Shogun,在市场上已经突出。

重点是–机器学习市场的创新速度将需要ML队伍来醒来,令人醒来,舒适的毫克工具。利基ML工具迅速掌握了艺术,这意味着开发人员需要表现出敏捷性,以便从工具转向工具,以实现企业用例。

 

衡量小成功

这是真理。很快,Pomp和Show围绕ML供电的应用程序将消失,利益相关者将串联业务价值证明。为这些时代做好准备的伟大方法是始终衡量ML项目的成功,旨在快速交付几个小改进,并使小型改进工作在串联中提供重大的业务优势。

 

结束言论

机器学习已经解决了业务问题,使人们能够更好地完成工作,并呈指数级化的业务流程。将数据和算法转化为有价值的见解的实用方法是确保您组织的机器学习项目的成功。

 

 

作者 : Rahul Sharma