机器学习&人工智能:看13名行业专家为您盘点2017,预测2018

2017-12-21 17:22:03 米洛 安在




2017年,大数据、机器学习、数据科学以及人工智能领域最重要的发展是什么?


2018年,它们又会有怎样的关键趋势?


近期,数据科学网站KDnuggets就发布了这样一份年度报告,征询了来自全球机器学习和AI领域的13位顶级专家的意见


如果你想要了解这些领域的年度重要发展动态,并提前把握其在未来一年的发展趋势,请认真阅读以下文章:


01

Xavier Amatriain——Curai的联合创始人兼CTO之前是Quora的工程副总裁和Netflix的研究/工程总监


如果一定要选一个今年的主要亮点的话,那不得不提AlphaGo Zero。


这种新方法不仅在一些最有前途的方向上有所改进(例如深度强化学习),而且它也代表了一种“范式转变”,即这种模式可以在没有数据的情况下学习。


最近我们也了解到,AlphaGo Zero还能推广到象棋等类似的游戏中,这一切都是非常亮眼的成就。


至于人工智能的工程方面,2017年Pytorch开始升温,并且已经发展成为Tensorflow的一个对手,特别是在研究领域。


大公司之间的“AI战争”还包括许多其他的战役,其中最激烈的是围绕着“云”。


所有的主要供应商都加快了自己的投资步伐,增加了各自在云中的AI支持。其中,亚马逊在他们的AWS中提出了大量的创新,比如他们最近发布Sagemaker用于构建和部署ML模型。


另外值得一提的是,小型玩家也在不断涌入。


Nvidia最近就推出了他们的GPU云,这将成为训练深度学习模型的另一个有趣的选择。尽管有这么多竞争,但这个行业必要时可以团结起来,这是件值得欣慰的好事。


新的ONNX神经网络表明标准是实现互操作性的重要和必要的一步。


2017年,人工智能的社会问题也得到了延续(升级)。


伊隆·马斯克(Elon Musk)认为我们越来越接近杀手级AI的观点继续发酵,令许多人感到沮丧。关于AI在未来几年将如何影响工作,也有很多讨论。最后,我们看到更多的焦点放在AI算法的透明度和偏见上。


02

Georgina Cosma——诺丁汉特伦特大学科学与技术学院高级讲师


机器学习模型,特别是深度学习模型正在对医疗保健、法律制度、工程和金融业等关键领域产生重大影响。


但是,大多数机器学习模型不容易解释。在分析和诊断模型中,了解模型是如何实现预测的尤为重要,因为人类必须要有足够的信心去相信模型提出的预测。


重要的是,一些机器学习模型的决定必须与法律法规一致。现在是创建足够透明的深度学习模型以解释它们的预测的时候了,特别是当这些模型的结果被用来影响或告知人类决策时。


03

Pedro Domingos——华盛顿大学计算机科学与工程系教授,《终极算法》作者


Domingos 的观点主要总结为以下四点:


Libratus(冷扑大师)在德州扑克上的胜利,将AI的优势扩展到不完善的信息博弈;


自动驾驶汽车和虚拟助理的竞争日益激烈,Alexa在后者的竞争中占有一席之地;


谷歌、亚马逊、微软和IBM之间云AI的竞争持续升温;


AlphaGo Zero很伟大,但算不上是一个突破。self-play(自我游戏)是ML(机器学习)的最古老的想法之一,而人类远远不需要下够500万盘棋才能掌握围棋;



04

Ajit Jaokar——牛津大学物联网数据科学课程的首席数据科学家兼创建者


2017年是AI的一年。2018年将是AI成熟的一年。我们已经从更多的“系统工程/云原生”与AI技术相结合的角度看到这一趋势。


AI正在变得越来越复杂——像h2o.ai这类公司则简化了部署AI的复杂性。


AI正越来越多地用于竞争优势,特别是在工业物联网、零售和医疗保健领域,这将导致更大的颠覆。此外,AI也正在迅速地部署到企业的各个层面(再次带来许多新的机会,但也将导致更多职业消失)。


我认为AI正在通过嵌入式AI(即跨越企业和物联网的数据科学模型)融合传统的企业和更广泛的供应链。


最后,了解AI/深度学习技术的数据科学家在银行业等传统行业将继续出现短缺的现象,尤其是工业物联网领域。


05

Nikita Johnson——RE.WORK创始人


2017年,ML和AI取得了巨大的进步,特别是最近DeepMind发表的通用强化学习算法,在自我对弈4个小时之后,成功击败了世界上最好的象棋程序。


2018年,我期望看到智能自动化渗透到各行各业的企业之中——从传统制造业到零售业再到公共事业领域。


随着数据收集和分析的不断增加,对企业级自动化系统策略的需求将变得至关重要。这将使企业能够投资于一个更长期的AI计划,并确保它是未来增长和效率提升的优先事项。


此外,我们还将看到自动化机器学习帮助非AI研究人员更容易使用机器学习技术,并使更多公司能够将机器学习方法应用到他们的工作场景之中。


06

Hugo Larochelle——谷歌研究科学家,加拿大高级研究所Learning in Machines and Brains项目副主任


在机器学习的趋势中,我最感兴趣也最关注的是元学习(meta-learning)。元学习是一个特别宽泛的概括性术语。


但是今年对我来说最令人兴奋的是在少量学习(few-shot learning)的问题上取得了进展,它解决了发现学习算法的问题,这些算法从很少的样本中得到很好的泛化。


今年有更多关于 few-shot learning 和 meta-learning 研究,包括使用深度时序卷积网络,图形神经网络等等。


此外,meta-learning 方法也被用于主动学习,冷启动项目推荐,few-shot分布估计,强化学习,分层RL,模仿学习等等。


这是一个令人兴奋的领域,2018年我会继续密切关注。


07

Charles Martin——数据科学家和机器学习AI顾问


2017年,我们看到了一个巨大的深度学习AI平台和应用程序。今年,Facebook发布了他们的Tensorflow竞争对手PyTorch。Gluon、Alex、AlphaGo等等成果不断。


机器学习从特征工程和逻辑回归发展到阅读论文,实现神经网络,优化训练效果。在我的咨询实践中,客户已经在寻求自定义对象检测,高级NLP和强化学习。


当市场和比特币飙升的时候,人工智能一直是一场沉默的革命,零售业的启示激起人们认为人工智能将颠覆行业。公司都想要进行自我变革。我们非常有兴趣对其进行AI指导,包括技术层面和战略层面。


2018年必将成为全球“AI first”经济的突破之年。我们有来自欧洲、亚洲、印度、甚至沙特阿拉伯的需求。


全球需求将继续增长,来自中国和加拿大的人工智能进步很大,印度等国家也正从IT重新调整为人工智能。美国和海外的企业培训需求都很大。


人工智能将实现大规模的效率,传统行业(如制造业,医疗保健和金融)将从中受益。


人工智能创业公司将把新产品推向市场并全面提高投资回报率。而从机器人到自动驾驶汽车的新技术将会带来惊人的进步。


如果你也正在投资参与人工智能和机器学习领域,毫无疑问,未来将是具有伟大创新意义的一年。


08

Sebastian Raschka——密歇根州立大学应用机器学习和深度学习研究员和计算生物学家,《Python机器学习》一书作者


在过去的几年中,开源社区已经就所有新出现的深度学习框架进行了大量的讨论。


现在,这些工具已经有所成熟了,我希望并期待看到,以工具为中心的方法会有所减少,而是将更多的精力用于开发和实现利用深度学习的新颖想法和应用。


我尤其期望看到的是,使用生成对抗神经网络和Hinton的capsule来解决更多问题,这也已经成为今年讨论的热门话题。


09

Brandon Rohrer——Facebook的数据科学家


2017年还有更多机器击败人类的成就。去年,AlphaGo击败了世界上最好的人类棋手,通过了智慧之路上的一个长期里程碑。


今年,AlphaGo Zero通过从零开始的自我对弈学习,超越了它的上一版本。


它不仅击败了一个人类,还击败了全体人类的围棋智慧。更有趣的现实是,一台机器现在可以从交换机基准来转录电话交谈。


即便如此,不得不说的是,人工智能的成就仍然狭窄而脆弱。改变图像中的单个像素就可以轻松地击败最先进的分类器。


我预计,2018年将带来更多通用和强大的AI解决方案。几乎每个主要的科技公司都已经有了至少一个人工智能的项目。


这些团体及其早期成果将成为头条新闻。至少,“AGI”(通用人工智能)将会取代“AI”成为未来的流行词。


10

Elena Sharova——投资银行的数据科学家


谈到2017年机器学习/人工智能主要的发展是什么,我看到越来越多的公司和个人开始将他们的数据和分析转移到基于云的解决方案之中,对数据安全的重要性的意识也急剧上升。


最大和最成功的技术公司已经竞相成为你的数据存储和分析平台。对于数据科学家来说,这意味着他们开发的工具箱和解决方案正被这种平台所能提供的功能和能力所塑造。


2017年,全球发生了几起大规模的数据安全漏洞事件。这是一个不容忽视的发展趋势。随着越来越多的数据转移到第三方存储平台,对于适应新威胁的更强大安全性的需求将继续增长。


至于2018年会发生哪些关键趋势?一个是确保遵守《全球数据保护条例》(GDPR),另一个则是应对机器学习系统“隐藏”技术欠下的债,这笔债正在越变越多,不容忽视。


GDPR作为一项欧盟法规,具有全球影响力,所有数据科学家都应该充分意识到它对自己工作的影响。


根据Google的NIPS’16论文,数据依赖性代价高昂,而且随着企业创建复杂的数据驱动模型,他们将不得不仔细考虑如何解决这一成本问题。


11

Tamara Sipes——Optum/UnitedHealth Group商业数据科学总监


Sipes 对于2017年的主要发展和2018年的主要趋势总结如下:


深度学习和集成建模方法在2017年继续证明了它们相比其他机器学习工具的价值和优势。特别是深度学习在各个领域和行业得到了更广泛的应用。


至于2018年的发展趋势,深度学习可能会被用来从原始输入中产生新的特征和新的概念,并取代手动创建或设计新变量的需求。


深度网络在检测数据的特征和结构方面是非常强大的,数据科学家正在认识到无监督深度学习可以为此发挥的价值。


有效的异常检测(Effective anomaly detection)可能也是近期的重点。在许多行业中,数据科学工作的重点是处理异常事件和其他类型的罕见事件:


入侵检测、财务欺诈检测、诈骗、医疗保健中的滥用和错误以及设备故障等等。检测所有这些罕见的事件将会使企业在领域中产生竞争优势。跟上这些罕见事件检测的演变节奏,将是一个有趣的问题和困难的挑战。


12

Rachel Thomas——fast.ai创始人,旧金山大学助理教授


虽然不像AlphaGo或者波士顿动力开发的“后空翻”机器人那样华丽,但让我感到最兴奋的2017年AI趋势是深度学习框架变得更加用户友好且易于访问。


PyTorch(今年发布的)对任何了解Python的人都很友好(主要是由于动态计算和OOP设计)。


不过,即使TensorFlow也正朝着这个方向发展,将Keras纳入其核心代码库并宣布动态图运算。


但是编码人员使用深度学习的门槛正变得越来越低。我期待看到2018年开发人员可用性增长的这一趋势将持续下去。


第二个趋势是媒体报道专制政府监督人工智能的能力。这种隐私威胁的问题在2017并不罕见,但直到最近这才开始受到广泛的关注。


利用深度学习来识别戴着围巾和帽子的示威者,或者通过图片来识别某人的性取向,使得今年有更多的媒体开始关注AI的隐私风险。


希望在2018年,我们可以继续扩大讨论马斯克说的邪恶超级AI的话题,并解决通过编码涉嫌监视、隐私和对性别歧视和种族主义偏见的问题。


13

Daniel Tunkelang——Twiggle的首席搜索传播者,也是许多知名组织的顾问


无论是自动驾驶汽车,还是会话数字助理在即将过去的2017年都得到了喷井式的发展。这两个都是深度学习将科幻小说变为事实的应用领域。


但是,今年机器学习和人工智能最重要的发展依然是对道德、问责和可解释性的持续关注。


伊隆·马斯克(Elon Musk)及其关于人工智能触发世界大战的启示性警告点燃了媒体舆论,Oren Etzioni和Rodney Brooks等人则对这场“莫须有”的世界大战予以了认真的反驳。


尽管如此,机器学习模型偏差的风险仍然存在,比如word2vec中的性别主义,算法在刑事判决中的种族主义,以及对社交媒体信息流的评分模型的故意操纵。


这些问题都不是新出现的,但是机器学习的加速应用——特别是深度学习的广泛运用,已经将这些问题推到了普通公众面前。


2017年,我们终于看到“可解释的AI”作为一门学科出现,汇集了学者、业界从业者和政策制定者的参加。


2018年,照亮深度学习模型黑箱的压力和动力都将进一步加大。


- 推荐阅读 -



☞ Gartner十大IT预测:人工智能将创造更多工作岗位