一、机器学习领域主要术语的英文表达
https://www.cnblogs.com/ArrozZhu/p/8397160.html
二、LR,gbdt,libfm这三种模型分别适合处理什么类型的特征?
1、gbdt模型是非线性模型,可以输入统计类特征,特征维度一般几十到几百维。统计类特捕捉的是影响最终效果的总体或者说全局性的因素。曾看到过腾讯技术博客里给gbdt模型输入海量特征,但个人感觉gbdt不适合海量特征,因为一方面可能只有较少特征有作为划分特征的机会,另一方面每次选择划分属性时所有特征都考虑的话性能会很差。
2、LR模型属于线性模型。模型简单,可以引入海量离散特征。这样的好处就是模型可以考虑更加细节或者说针对具体个体的因素。如果想要引入非线性因素需要做特征交叉,这样很容易产生百亿特征,在很早之前ctr就主要靠堆人力搞特征工程工作来持续优化效果。
3、FM模型也属于线性模型,不过可以在模型里用隐向量乘积模拟特征交叉,比LR模型手动撸交叉特征工程明显要elegant一些。由于复杂度的原因,较为常见的只有二阶交叉。
作者:杨镒铭
链接:https://www.zhihu.com/question/35821566/answer/357786181
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。