在机器学习、深度学习中使用的优化算法除了常见的梯度下降,还有 Adadelta,Adagrad,RMSProp 等几种优化器,都是什么呢,又该怎么选择呢?
在 Sebastian Ruder 的这篇论文中给出了常用优化器的比较,今天来学习一下:
1609.04747.pdf (643.58 KB, 下载次数: 40)
举报
您需要登录后才可以评论 登录 立即注册
全部回复 0
暂无评论,快来抢沙发吧