自动化机器学习(AutoML)大概在四五年前非常火,现在基本熄火进入平稳期与实用期了,是时候回顾下了。
首先,自动化机器学习同样是用来做机器学习的,机器学习适合做的领域自动化机器学习都可以做。这里自动化主要是把调参、变量选择、模型选择、模型集成等传统需要机器学习专家来做的事流程化自动化执行,可以算是程序员自掘职业坟墓的又一成果。
现在很多学科都在谈机器学习,有些是当辅助用,有些是当魔法用,还有些单纯用来要饭忽悠人的。但你去看看高校培养计划会发现虽然很多学科前沿展望里都在鼓吹,培养上基本放羊,全靠学生自学。这样的后果就是同样都是自称做机器学习的,有的是调包流,跑个泰坦尼克幸存者就说懂机器学习,满嘴随机森林支持向量机,走个MNIST敢自称会深度学习。另外一些是y=f(x)流,精于把自己学科问题抽象成一个可训练的模型,然后直接找机器学习专家合作,根本不管模型细节;另一些则是解释流,只对线性模型跟决策树感兴趣,别的都不关心。
毫无意外,自动化机器学习最适合的是第二类人,当然他们最好对基础模型本身原理有感知。但真到预测性问题上就无所谓了,表现最好的一般是多个不同模型集成的。从原理上 …