什么是机器学习?
机器学习是一种数据分析方法,它可以自动分析模型的建立。使用迭代学习数据的算法,机器学习可以使电脑在没有被明确编程看哪里时,发现隐藏的领域。
迭代在机器学习中是非常重要的,因为有了它的存在,模型在遇到新的数据时,便能够独立地适应数据。它们可以从先前产生的可靠计算,重复的决定和结果中进行学习。机器学习并不是一个全新的学科-而是获得新动力的学科。
由于新型计算技术的产生,如今的机器学习与以往大不相同。尽管很多机器学习算法已经存在了很长时间,但自动将复杂的数学计算应用到大数据的能力(一个又一个,越来越快)是最新的进展。下面这些广泛宣传的机器学习应用程序的例子,你可能非常熟悉:
·大量的炒作,自动驾驶谷歌车?机器学习的本质。
·像Amazon和Netflix的在线推荐服务?机器学习在日常生活中的应用
·知道客户在Twutter上说了什么关于你的事吗?机器学习与语言规则创造结合。
·欺诈检测?在我们现今生活中,一个更明显的,重要的用途。
为什么越来越多人对机器学习感兴趣?
人们在机器学习方面兴趣的复兴,也是由于相同的因素,即数据挖掘和贝叶斯分析比以往更受欢迎。在类似数量增长和可用数据这一类方面,计算处理更实惠,更强大,且负担得起数据存储。
所有的这些事都暗示着:机器学习可以更快且自动的产生模型,以分析更大,更复杂的数据,而且传输更加迅速,结果更加精准——甚至是在非常大的规模中。结果是?在现实中无人类干涉时,高价值( High-value)的预测可以产生更好的决定,和更明智的行为。
自动模型的建立是在现实中生成明智行动的一大关键。分析思想领袖Thomas H. Davenport在华尔街日报上写道,日新月异,不断增长的数据,"…你需要快速移动的建模流( fast-moving modeling streams)来保持。"而你可以通过机器学习做到这些。他还说道"人类通常一周可以创建一个或两个好的模型;而机器学习一周就可以创造出成千上万的模型."