- 在线时间
- 20 小时
- 最后登录
- 2016-2-23
- 注册时间
- 2015-12-7
- 听众数
- 13
- 收听数
- 3
- 能力
- 0 分
- 体力
- 467 点
- 威望
- 0 点
- 阅读权限
- 30
- 积分
- 190
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 126
- 主题
- 5
- 精华
- 0
- 分享
- 0
- 好友
- 17
升级 45% TA的每日心情 | 奋斗 2016-2-23 14:54 |
---|
签到天数: 39 天 [LV.5]常住居民I
|
今天的学习目标是理解爬山算法的基本原理并学会运用此原理。
一、爬山算法
介绍模拟退火前,先介绍爬山算法。爬山算法是一种简单的贪心搜索算法,该算法每次从当前解的临近解空间中选择一个最优解作为当前解,直到达到一个局部最优解。
爬山算法实现很简单,其主要缺点是会陷入局部最优解,而不一定能搜索到全局最优解。如图1所示:假设C点为当前解,爬山算法搜索到A点这个局部最优解就会停止搜索,因为在A点无论向那个方向小幅度移动都不能得到更优的解。
二. 模拟退火思想。
爬山法是完完全全的贪心法,每次都鼠目寸光的选择一个当前最优解,因此只能搜索到局部的最优值。模拟退火其实也是一种贪心算法,但是它的搜索过程引入了随机因素。模拟退火算法以一定的概率来接受一个比当前解要差的解,因此有可能会跳出这个局部的最优解,达到全局的最优解。以图1为例,模拟退火算法在搜索到局部最优解A后,会以一定的概率接受到E的移动。也许经过几次这样的不是局部最优的移动后会到达D点,于是就跳出了局部最大值A。
三、 模拟退火算法描述:
若 (即移动后得到更优解),则总是接受该移动,若J( Y(i+1) )< J( Y(i) ) (即移动后的解比当前解要差),则以一定的概率接受移动,而且这个概率随着时间推移逐渐降低(逐渐降低才能趋向稳定),这里的“一定的概率”的计算参考了金属冶炼的退火过程,这也是模拟退火算法名称的由来。
- }5 R; h3 p* Y, B: z% ~ 根据热力学的原理,在温度为T时,出现能量差为dE的降温的概率为P(dE),表示为:/ R6 M0 F/ p; X: T h% r( G
/ w0 a: n. B' x3 Q$ v, M
P(dE) = exp( dE/(kT) )6 e) ^1 l. w9 |
! Q: }$ T; D- }( C# b 其中k是一个常数,exp表示自然指数,且dE<0。这条公式说白了就是:温度越高,出现一次能量差为dE的降温的概率就越大;温度越低,则出现降温的概率就越小。又由于dE总是小于0(否则就不叫退火了),因此dE/kT < 0 ,所以P(dE)的函数取值范围是(0,1) 。' j s1 Z4 m/ |; @8 ]& m/ L! `! L3 a
6 ~! A" }/ k4 l! y' f+ r7 G- m @ 随着温度T的降低,P(dE)会逐渐降低。
( K8 N* g6 M2 K2 d3 d8 k7 f9 a1 K( F3 I* C1 P
我们将一次向较差解的移动看做一次温度跳变过程,我们以概率P(dE)来接受这样的移动。( l1 H# }- D. E$ O6 j
1 s! L9 H& u0 {0 t 关于爬山算法与模拟退火,有一个有趣的比喻:3 O" [+ n5 L# C9 `+ M, T' H( b7 b9 Q0 v
( }, A9 T6 O) K' j5 {. W, X5 ^
爬山算法:兔子朝着比现在高的地方跳去。它找到了不远处的最高山峰。但是这座山不一定是珠穆朗玛峰。这就是爬山算法,它不能保证局部最优值就是全局最优值。3 Q" \' C# \$ G, F6 I+ ]
1 ~0 c( c- g' I& D, o$ `# h" _0 X 模拟退火:兔子喝醉了。它随机地跳了很长时间。这期间,它可能走向高处,也可能踏入平地。但是,它渐渐清醒了并朝最高方向跳去。这就是模拟退火。
|
|