 

布兰姥爷

文章：47 阅读：176958 评论：120 赞：1453

 好友  私信个人主页

文章 47
原创 42
阅读 176958
评论 120
赞 1453

原创【零基础】神经网络优化之mini-batch

 2019-10-27 23:15  2553 34 2 分类: 机器人/ AI 文集: AI

一、前言

　　回顾一下前面讲过的两种解决过拟合的方法：

　　1）L0、L1、L2：在向前传播、反向传播后面加个小尾巴

　　2）dropout：训练时随机“删除”一部分神经元

　　本篇要介绍的优化方法叫mini-batch，它主要解决的问题是：实际应用时的训练数据往往都太大了，一次加载到电脑里可能内存不够，其次运行速度也很慢。那自然就想到说，不如把训练数据分割成好几份，一次学习一份不就行了吗？前辈们试了试发现不仅解决了内存不足的问题，而且网络“收敛”的速度更快了。由于mini-batch这么棒棒，自然是神经网络中非常重要的一个技术，但实际实现时你会发现“真的太简单了”。

二、batch、mini-batch、随机梯度下降

　　这里先解释几个名词，可以帮助大家更好的理解mini-batch。

　　1）之前我们都是一次将所有图片输入到网络中学习，这种做法就叫batch梯度下降

　　2）与batch对应的另一种极端方法是每次就只输入一张图片进行学习，我们叫随机梯度下降

　　3）介于batch梯度下降和随机梯度下降之间的就是我们现在要整的，叫mini-batch梯度下降

三、mini-batch大小、洗牌

　　前面说，mini-batch是将待训练数据分割成若干份，一次学习一份。那每一份具体包含多少个图片合适呢？实际上是没有什么特定标准的，但这个数值又切实影响着神经网络的训练效果，一般来说就是建议“设置为2的若干次方，如64、128、256、1024等等”。你可以先随便设置一个数看看效果，效果一般再调调。

　　“洗牌”是mini-batch的一个附加选项，因为我们是将训练数据分割成若干份的，分割前将图片的顺序打乱就是所谓的“洗牌”了，这样每一次mini-batch学习的图片都不一样为网络中增加了一些随机的因素。具体原理上不知道有啥特别的，但实践中确实优化了网络。

四、mini-batch实现与对比

　　完整的实现代码是基于之前“深层神经网络解析”的，下载方式见文末。这里我做了个简单的实验，下图中分别是无mini-batch、不带洗牌的mini-batch、带洗牌的mini-batch运行效果。

无mini-batch：

不带洗牌的mini-batch：

带洗牌的mini-batch：

　　可以看到，使用mini-batch后网络可以迅速收敛。使用了mini-batch的网络仅用了400次就达到了普通网络2000次的训练效果。由于求解的问题不算很难，所以使用了洗牌的mini-batch与普通的mini-batch似乎没啥差别，不过还是能看出来效果还是好了一点的（不过会使用更长的时间来训练）。

完整实现代码可以关注公众号“零基础爱学习”回复“AI11”获取。

神经网络深度学习 mini-batch

作者：布兰姥爷，来源：面包板社区

链接： https://mbb.eet-china.com/blog/uid-me-3887969.html

写原创有奖励！2025面包板原创奖励正在进行中

上一篇：【零基础】神经网络优化之dropout和梯度校验
下一篇：【零基础】神经网络优化之动量梯度下降

PARTNER CONTENT

换一换> 更多>

文章评论（1条评论）

登录后参与讨论

curton 2019-10-31 19:09

学习了

回复

查看更多评论

相关推荐阅读

布兰姥爷 2023-04-21 23:07: 跟姥爷深度学习4 从数学计算看神经网络; 一、前言我们前面简单的做了一个气温预测，经过反复调试，效果还不错。实际上在这个方向上我们还可以更进一步优化，但因为我们是学习嘛，主要还是看广度而不是深度。考虑到后面要开始学习卷积网络，我们必须把更基础...

布兰姥爷 2023-04-21 23:04: 跟姥爷深度学习3 神经网络的调试实操; 一、前言前面我们做了一次天气预测的模型，训练的结果都还好，网络好歹是“拟合”了，但预测数据不合预期让我一直耿耿于怀。所以我又花了很长时间来研究为什么，我的理论依据明明没有问题（今日平均温度与近一周平均...

布兰姥爷 2023-04-21 23:02: 跟姥爷深度学习2 TensorFlow的基本用法; 一、前言前面我们浅用TensorFlow做了个天气预测，虽然效果不咋样，但算是将整个流程跑通了。这一篇我们在之前基础上对TensorFlow的一些参数进行简单介绍，在接口文件的基础上了解各参数的简单含...

布兰姥爷 2023-04-11 22:22: 跟姥爷深度学习1，浅用tensorflow做个天气预测; 一、前言最近人工智能、深度学习又火了，我感觉还是有必要研究一下。三年前浅学了一下原理没深入研究框架，三年后感觉各种框架都成熟了，现成的教程也丰富了，所以我继续边学边写。原教程链接：https://ww...

布兰姥爷 2023-03-29 12:41: AI为啥要用显卡; 一、前言GPT的发布让AI再次热了起来，与上次阿尔法狗不同的是，现在人人都可以跟聊上几句，给它出出难题，还能调戏下。同期英伟达发布了针对AI领域的全新GPU H100，有的童鞋会疑惑，这个英伟达不是做...

布兰姥爷 2019-11-04 21:09: 【零基础】使用Tensorflow实现神经网络; 一、序言　　前面已经逐步从单神经元慢慢“爬”到了神经网络并把常见的优化都逐个解析了，再往前走就是一些实际应用问题，所以在开始实际应用之前还得把“框架”翻出来，因为后面要做的工作需要我们将精力集中在业务...

我要评论

 1

 34

关闭站长推荐

原创 【零基础】神经网络优化之mini-batch

文章评论（1条评论）

curton 2019-10-31 19:09

原创【零基础】神经网络优化之mini-batch