软硬结合:快手推荐系统国内率先基于持久内存应用异构存储

时间:2019-09-04 来源:www.saisaisai.com

作为一个每天2亿短片,每日平均1000万短视频上传和强调社区包容性的短视频应用,快速推荐系统要解决的技术挑战是世界级的。最近,Fast Hand重新设计了基于异构存储结构的推荐系统,率先在中国应用持久存储器。这是第一个采用英特尔? AoTeng?数据中心级持久性内存。在快速推荐系统具有高吞吐量和大容量请求的情况下,使用持久性内存可以降低存储成本,减少故障恢复时间并提高系统可靠性。故障恢复时间从小时水平降低到分钟水平,这也为提高大型深度机器学习系统的处理能力以改善数千亿的数据量开辟了新的方向。

业界超大规模实时在线短视频推荐系统

如何通过数十亿级别的短视频库中的数十亿参数级别的深度模型向用户呈现内容,同时在高峰期间每秒承载数十万个并发呼叫?快速推荐团队设计了基于异构设备的高级推荐系统,遇到的问题的复杂性极具挑战性。

目前,快速推荐系统采用分离计算和存储的架构模式(如下图所示)。推荐系统中的存储服务主要用于实时存储和更新数亿个用户肖像,数十亿短视频特征和数十亿个排序模型参数。计算服务主要执行视频回忆检索,推荐模型估计和推荐策略计算。

[基于持久记忆指数系统的压力测试结果]

基于异构存储的索引系统几乎达到了与纯DRAM索引系统相同的性能指标,但总体拥有成本降低了30%。同时,异构存储索引系统可以提供微小级别的故障恢复速度,比前一个小时级恢复快一百倍。根据英特尔专家的说法,Fast是第一家在推荐系统领域推出和使用基于持久内存的异构内存的互联网公司。这种创新实践的技术能力使我们看到了它。

快手推荐打造业界顶级、战斗力强悍的技术团队

通过工程,算法组合和数据驱动手段,快速推荐系统可以更高效,准确,更稳定地为数亿用户提供服务,记录每个人的生活,并使每个人的记录产生共鸣。推荐建筑团队的成员来自中国的知名大学,甚至是国际知名大学,如CMU,清华大学,北京大学和中国科技大学。团队的每个成员都追求最终的技术,并有能力开发一流的分布式高并发服务。例如,在线分布式索引每天支持数千亿的视频请求,机器学习平台支持数千亿推荐的在线学习和在线抢占模型。估计的在线服务为数亿用户提供99.99%的可用性。

我们正在寻找分布式架构,机器学习平台,大数据处理和新技术硬件研发工程师的高级工程师。我们欢迎所有追求技术和简历的技术人员。