tag 标签: dropout

相关博文
  • 热度 3
    2019-10-24 15:45
    2455 次阅读|
    1 个评论
    【零基础】神经网络优化之dropout和梯度校验
    一、序言   dropout和L1、L2一样是一种解决过拟合的方法,梯度检验则是一种检验“反向传播”计算是否准确的方法,这里合并简单讲述,并在文末提供完整示例代码,代码中还包含了之前L2的示例,全都是在“深层神经网络解析”这篇基础之上修改的。 二、dropout   简单来说dropout就是在每次训练时“随机”失效网络中部分神经元,大概就是下图这么个意思。   让神经元随机消失办法很简单,我们将每一层的输出Y中部分位,置为0即可。回顾一下神经元的输出值Y:   A = np.dot(w, IN) + b   Y = relu(A)   对于输入层,IN就是img,对于其他层IN就是上一层的输出Y,A是权重w与输入IN的矩阵乘积,Y是A在0-1间的映射,表示概率。对于w与IN的乘积运算,我们若在IN中插入若干个0值,其计算结果(相乘后是累加)对下一层是没有影响的,所以将IN(Y)中某些位置为0就相当于将上一层某些神经元删除了。   具体到实现上,先按Y的形状生成0-1的随机数   D = np.random.rand(Y.shape , Y.shape )   接着将小于keep_prob的数全部置为0其他的置为1,keep_prob就是删除的神经元比例,如0.5就删除50%。   D = D < keep_prob   然后用Y乘以D,按keep_prob的比例删除输出值(也即是下一层的输入)。   Y = Y * D   最后还需要用Y除以keep_prob,目的是将训练和测试时的“期望”保持一致。   Y = Y / keep_prob   简单理解“期望“就是在训练时我们删除了一定比例的神经元,但是实际使用时这些神经元可都是在的,所以Y除以keep_prob就是让二者的”期望“保持一致。   这里我们简单讲了下过程,具体的实现在文末可以下载完整代码。 三、梯度校验   梯度校验基于这么一个事实:神经网络是一个“混沌”系统,增加一些参数、减少一些参数、写错一些参数,又比如前面dropout方法中删除一些神经元对整体网络的运行似乎没有影响,你不会得到一个明确的报错,有时训练得到的结果表现的可能还不错(有时甚至更好了)。我们需要一些手段来做一些“基本”的检测吧?   梯度校验就是这么一个“基本检测”,他的原理是“用另一种路径”来重新计算Δw,如果你计算的Δw与反向传播计算的Δw“差不多”,那说明大方向上你的网络是OK的,至少“优化”的方向是正确的。   我们知道Δw的计算是在损失函数的基础上对w进行求导,求导的结果即是w优化的方向(使cost趋向于0)。   在“反向传播”的解析中,我们的损失函数公式是标签值减去预测结果:   cost = ( Label - Y )^2   而后用cost对w求导可以得到Δw使cost值趋向于0:   Δw = ( Label - Y )*X   上式是利用对cost求导得到的,验证上式计算结果是否正确的另一种路径则是回归“求导”的本质:当自变量的增量趋于零时,因变量的增量与自变量的增量之商的极限。用数学公式表达出来就是:   cost = J(w) =( Label - Y )^2   Y = wX + b      上式中a是一个趋向于0的极小值,我们可以随便取一个,比如10的-7次方(0.0000001)。上式中J(w+a)和J(w-a)可以通过向前传播和损失计算得到,这种方式可以称为极值法,而后与反向传播求得的Δw作比较,下式是一个比较科学的比较方法(二范数):      其中grad是反向传播求得的Δw,gradapprox是极值法求得的Δw,difference称为误差。 四、多维神经网络的梯度检验   上一节简述了梯度检验的原理,然鹅放到实际应用时有点抓虾,因为前面的公式范例只能契合单神经元的情况,将公式应用到多层神经网络还需要做一些修改。最主要的修改在于,我们要将w、b、dw、db转为一维向量.   一个简单的w示例如下:   w = {'1': ,'2': ,'3': }   对于多层的神经网络来说,w+a、w-a不是将w中所有元素都加减a,而是每个元素依次操作,错误示例如下:   w + a ={'1': ,'2': ,'3': }  #这个是错误的示范!!!   正确的示例如下:   w + a ={'1': ,'2': ,'3': }   w + a ={'1': ,'2': ,'3': }   以此类推。   这个很好理解,如果使用错误示例中的方法,最后我们通过极值法计算出来的gradapprox只有一个元素,然鹅dw是有10个元素的。使用正确示例这个方法其实是对w中每一个位都按极值法求得了导数的近似值,正好对应了dw中每一个位的导数。   为了便于计算,我们可以将w和dw都转为一维向量:   w =   一维向量的好处是增减a时比较方便,实际计算损失时还得再转回多维的形状。具体代码实现在文末有下载方式,为了便于理解我只实现了dw的检验,实际上你可以把w、b拼成一个向量,dw、db拼成一个向量,使用极值法计算出梯度后可以做一个整体的比较(自己试试看)。   因为梯度校验速度真的非常非常慢,为了加快测试的速度,我们可以将网络做的更简单、将训练数据减少,实际使用时可以是所有训练数据都一起上,慢就慢点吧。   需要注意的是,如果你要做梯度校验,那dropout必须得先关掉(将keep_prob设为1),原因很好理解,dropout使神经网络在训练时随机“删除”了部分神经元,使用极值法计算Δw时需要做两次向前传播,两次随机删除的神经元肯定不一样,反向传播删除的神经元也不一样,自然最后计算的difference就不准确了。 五、总结   本文简单讲了下神经网络的优化方法dropout和反向传播的检验方法“梯度校验”,其中dropout需要与之前的L2优化结合起来看。   完整实现代码可以关注公众号“零基础爱学习”回复“AI10”获取。
相关资源
  • 所需E币: 5
    时间: 2023-2-11 22:36
    大小: 1.79MB
    上传者: ZHUANG
    基于Dropout法优化的BP神经网络地铁列车塞拉门故障检测
  • 所需E币: 0
    时间: 2020-9-19 21:12
    大小: 418.44KB
    上传者: bwj312
    SIPEX_SPX11117800mALowDropoutVoltageRegulator
  • 所需E币: 5
    时间: 2019-12-27 20:45
    大小: 284.37KB
    上传者: 16245458_qq.com
    TechnicalReviewofLowDropoutVoltageRegulatorOperationandPerformance(TI).PDFTechnicalReviewofLowDropoutVoltageRegulatorOperationandPerformanceApplicationReportAugust1999MixedSignalProductsSLVA072IMPORTANTNOTICETexasInstrumentsanditssubsidiaries(TI)reservetherighttomakechangestotheirproductsortodiscontinueanyproductorservicewithoutnotice,andadvisecustomerstoobtainthelatestversionofrelevantinformationtoverify,beforeplacingorders,thatinformationbeingreliedoniscurrentandcomplete.Allproductsaresoldsubjecttothetermsandconditionsofsalesuppliedatthetimeoforderacknowledgement,includingthosepertainingtowarranty,patentinfringement,andlimitationofli……
  • 所需E币: 4
    时间: 2019-12-28 19:21
    大小: 858.28KB
    上传者: wsu_w_hotmail.com
    本文档介绍了使用便携式电器开关电源来控制外设功能的概念。AN11159DistributedpowerinportabledevicesRev.1―16March2012ApplicationnoteDocumentinformationInfoContentKeywordsdistributedpower,LowDropOut(LDO)regulators,DC-to-DCconverter,loadswitch,quiescentcurrent,loadcurrentAbstractThisdocumentdescribesconceptsforportableappliancesusingswitchablepowersuppliestocontrolperipheralfunctions.Afocusissetonvoltageconversionandpowerdistributionintheapplication.ManydifferentvoltagesarerequiredforthevariousICsinmodernmobilesystems.Thecentralbatterysuppliespowertoma……
  • 所需E币: 4
    时间: 2019-12-24 22:00
    大小: 44.72KB
    上传者: givh79_163.com
    P-channelMOSFETs(pFETs),thoughmoreexpensivethanpnptransistors,arefreeofthedissipationlossassociatedwithbasedriveinapnpcircuit.pFETsalsohavealowersaturationvoltageatlightloads(Figure1).Infact,thelowRDS(ON),logic-level,p-channelpowerMOSFETscurrentlyavailablecanregulate5Vfroma5.1Vbattery!Maxim>AppNotes>AmplifierandComparatorCircuitsVoltageReferencesKeywords:P-FET,linearregulator,lowdropout,p-channel,MOSFETs,amplifiers,comparatorJul09,1998APPLICATIONNOTE103pFETLinearRegulatorHasLowDropoutVoltageP-channelMOSFETs(pFETs),thoughmoreexpensivethanpnptransistors,arefreeofthedissipationlossassociatedwithbasedriveinapnpcircuit.pFETsalsohavealowersaturationvoltageatlightloads(Figure1).Infact,thelowRDS(ON),logic-level,p-channelpowerMOSFETscurrentlyavailablecanregulate5Vfroma5.1Vbattery!Figure1.Ap-channelMOSFET(Q1)allowsthislinearregulatortooperatewithVINtoVOUTdifferentialslowerthan100mV.ThiscapabilityletstheFigure2circuitderive5V±10%……
  • 所需E币: 3
    时间: 2019-12-24 19:47
    大小: 316.9KB
    上传者: 238112554_qq
    摘要:本应用笔记帮助系统设计师使用MAX16948双远程天线的LDO/开关选择正确的外部元件,从而确保汽车调节幻象天线电源和输出电流监测电路满足性能目标。提供电子计算器,帮助指定为MAX16948的关键外部元件,从而减少了设计时间。计算器也决定了设备的模拟输出电压,输出电流限制阈值,输出电流检测精度。计算器,包括新的自动步步功能元件的选择,协助设计师。使用新的自动功能,点击Step按钮所需的部分相对的步骤。Maxim>DesignSupport>TechnicalDocuments>ApplicationNotes>Automotive>APP5271Maxim>DesignSupport>TechnicalDocuments>ApplicationNotes>Power-SupplyCircuits>APP5271Keywords:automotive,automotiveantennaprotector,phantompower,activeantenna,activeantennapowerprotector,phantompowerantennaprotector,automotiveantenna,LDO,LNA,lowdropoutlinearregulator,current-sense,remoteantennadiagnosticJan03,2012APPLICATIONNOTE5271SelectingExternalComponentsforanAutomotiveDualRemoteAntennaCurrent-SenseLDO/SwitchBy:AndreaLongobardiJan03,2012Abstract:Thisapplicationnotehelpssystemdesignerschoosethecorrectext……
  • 所需E币: 5
    时间: 2019-12-24 19:16
    大小: 261.37KB
    上传者: 2iot
    摘要:本应用笔记介绍了用于便携式应用的电源管理方案四和电池系统。升降压转换器,线性稳压器,电压转换器,电荷泵和电感器稳压器的优化设计和用途。几个Maxim的电源管理设备特色。Maxim>Designsupport>Appnotes>BatteryManagement>APP671Maxim>Designsupport>Appnotes>Power-SupplyCircuits>APP671Keywords:powerforportableapplications,powerregulator,SEPIC,step-upDC-DCcontroller,step-upregulator,step-downswitchingregulator,low-voltagelogic,low-dropoutDC-DCcontroller,linearregulator,charge-pumpconverter,dropoutvoltage,voltageconverter,GaAsFET,RFpoweramplifier,GSM,TDMFApr07,2011APPLICATIONNOTE671EnergyManagementforSmallPortableSystemsAbstract:Thisapplicationnotedescribespower-managementschemesforportableapplicationswithfour-andthree-cellbatterysystems.Optimaldesignsan……
  • 所需E币: 3
    时间: 2019-12-24 18:39
    大小: 27.83KB
    上传者: 238112554_qq
    摘要:便携式系统通常需要从电池或从墙式转接器的操作。MAX8865低压差(LDO)稳压器线性稳压器用于提供切换功能,同时提供稳压2.84V可以提供百毫安的。Maxim>AppNotes>BATTERYMANAGEMENTMICROPROCESSORSUPERVISORCIRCUITSKeywords:batteryswitchover,lowdropout,ldo,linearregulator,batterymanagementJul09,1998APPLICATIONNOTE1000Battery-SwitchoverCircuitAccommodates3VSystemsAbstract:Portablesystemsoftenrequireoperationfrombatteriesorfromawalladapter.TheMAX8865low-dropout(LDO)linearregulatorisusedtoprovidetheswitchoverfunctionwhilesupplyingaregulator2.84Vthatcandeliver100mA.Portablesystemsoftenoffertheflexibilitytooperateeitherfromaninternalbatteryorfromanac-to-dcwalladapter.Manysuchsystemsincludecircuitrythatswitchesautomaticallybetweentheinternalbatteryandanexternalsourceastheuserconnectsanddisconnectsthewallad……
  • 所需E币: 5
    时间: 2020-1-13 13:47
    大小: 177.04KB
    上传者: 16245458_qq.com
    浅谈低压差线性稳压器(LDO)的压差(Dropout)和功耗(PowerDissipation)浅谈低压差线性稳压器(LDO)的压差(Dropout)和功耗(PowerDissipation)(圣邦微电子)任明岩摘要:本文论述了低压差线性稳压器(LDO)的基本原理和压差(Dropout)功耗(PowerDissipation)Abstract:ThispaperdiscussesLowDropoutLineRegulator(LDO)fundamentalprincipleandDropout,PowerDissipation关键词:低压差线性稳压器,压差,功耗KeyWords:LDO,Dropout,PowerDissipation便携产品电源设计需要系统级思维,在开发由电池供电的设备时,诸如手机、MP3、PDA、PMP、DSC等低功耗产品,如果电源系统设计不合理,则会影响到整个系统的架构、产品的特性组合、元件的选择、软件的设计和功率分配架构等。同样,在系统设计中,也要从节省电池能量的角度出发多加考虑。例如现在便携产品的处理器,一般都设有几个不同的工作状态,通过一系列不同的节能模式(空闲、睡眠、深度睡眠等)可减少对电池容量的消耗。即当用户的系统不需要最大处理能力时,处理器就会进入电源消耗较少的低功耗模式。[1]带有使能控制的低压差线性稳压器(LDO)是不错的选择。低压差线性稳压器(LDO)的结构主要包括启动电路、恒流源偏置单元、使能电路、调整元件、基准源、误差放大器、反馈电阻网络,保护电路等,基本工作原理是这样的:系统加电,如果使能脚处于高电平时,电路开始启动,恒流源电路给整个电路提供偏置,基准源电压快速建立,输出随着输入不断上升,当输出即将达到规定值时,由反馈网络得到的输出反馈电压也接近于基准电压值,此时误差放大器将输出反馈电压和基准电压之间的误差小信号进行放大,再经调整管放大到输出,从而……
  • 所需E币: 4
    时间: 2020-1-14 18:59
    大小: 224.33KB
    上传者: rdg1993
    LDO入门的好文章,Studyanddesignoflowdropoutregulators……
  • 所需E币: 5
    时间: 2020-1-15 12:02
    大小: 52.06KB
    上传者: 978461154_qq
    UnderstandingLDODropoutApplicationReportSLVA207……