6.3.2 利用ALS来求解矩阵分解_构建企业级推荐系统：算法、工程实现与案例分析-QQ阅读男生科幻网

书名：构建企业级推荐系统：算法、工程实现与案例分析
作者名：刘强
本章字数：641字
更新时间：2021-08-06 14:59:59

6.3.2　利用ALS来求解矩阵分解

ALS是一个高效的求解矩阵分解的算法，目前Spark MLlib中的协同过滤算法就是基于ALS求解的矩阵分解算法，它可以很好地拓展到分布式计算场景，轻松应对大规模训练数据的情况（本章参考文献[6]中有ALS分布式实现的详细说明）。下面对ALS算法原理及特点做一个简单介绍。

ALS算法的原理基本就是它的名字表达的意思，通过交替优化求得极小值。一般过程是先固定p_u，那么式（6-2）就变成了一个关于q_v的二次函数，可以作为最小二乘问题来解决，求出最优的后，固定，再解关于p_u的最小二乘问题，交替进行直到收敛。对工程实现有兴趣的读者可以参考Spark ALS算法的源码。相比SGD算法，ALS算法有如下两个优势。

1.可以并行处理

从上面p_u、q_v的更新公式中可以看到，在固定p_u后，迭代更新q_v时每个q_v只依赖自己，不依赖于其他标的物的特征向量，所以可以将不同q_v的更新放到不同的服务器上执行。同理，q_v在固定后，迭代更新p_u时每个p_u只依赖自己，不依赖于其他用户的特征向量，一样可以将不同用户的更新公式放到不同的服务器上执行。Spark ALS算法就是采用这样的方式做到并行的。

2.对于隐式特征问题比较合适

用户真正的评分是很稀少的，所以利用隐式行为是更好的选择（其实也是不得已的选择）。利用了隐式行为后，用户行为矩阵就不会那么稀疏了，即有非常多的(u,v)对是非空的，计算量会更大，这时采用ALS算法是更合适的，因为固定p_u或者q_v让整个计算问题更加简单，容易求目标函数的极值。读者可以阅读本章参考文献[5]，进一步了解隐式反馈利用ALS算法实现的原因及细节（Spark MLlib中的ALS算法即是参考该论文来实现的）。

本周热推：

ANSYS Workbench有限元分析实例详解（静力学）小学生C++编程课堂（新手篇）Java多线程编程核心技术 Python程序设计教程 VB语言程序设计教程（第2版）