原创 随机数的实现方法

2011-3-23 19:35 2373 4 4 分类: 工程师职场
我们讲的随机数其实暗指伪随机数。不少朋友可能想到C语言的rand(),可惜这个函数产生的随机数随机性非常差,而且速度很慢,相信几乎不能胜任一般的应用。

古老的LCG(linear congruential generator)代表了最好的伪随机数产生器算法。主要原因是容易理解,容易实现,而且速度快。这种算法数学上基于X(n+1) = (a * X(n) + c) % m这样的公式,其中:
模m, m > 0
系数a, 0 < a < m
增量c, 0 <= c < m
原始值(种子) 0 <= X(0) < m
其中参数c, m, a比较敏感,或者说直接影响了伪随机数产生的质量。
一般而言,高LCG的m是2的指数次幂(一般2^32或者2^64),因为这样取模操作截断最右的32或64位就可以了。多数编译器的库中使用了该理论实现其伪随机数发生器rand()。下面是部分编译器使用的各个参数值:
Source                 m            a            c          rand() / Random(L)的种子位
Numerical Recipes                  
                       2^32         1664525      1013904223    
Borland C/C++                      
                       2^32         22695477     1          位30..16 in rand(), 30..0 in lrand()
glibc (used by GCC)                
                       2^32         1103515245   12345      位30..0
ANSI C: Watcom, Digital Mars, CodeWarrior, IBM VisualAge C/C++
                       2^32         1103515245   12345      位30..16
Borland Delphi, Virtual Pascal
                       2^32         134775813    1          位63..32 of (seed * L)
Microsoft Visual/Quick C/C++
                       2^32         214013       2531011    位30..16
Apple CarbonLib
                       2^31-1       16807        0          见Park–Miller随机数发生器

LCG不能用于随机数要求高的场合,例如不能用于Monte Carlo模拟,不能用于加密应用。
LCG有一些严重的缺陷,例如如果LCG用做N维空间的点坐标,这些点最多位于m1/n超平面上(Marsaglia定理),这是由于产生的相继X(n)值的关联所致。
另外一个问题就是如果m设置为2的指数,产生的低位序列周期远远小于整体。
一般而言,输出序列的基数b中最低n位,bk = m (k是某个整数),最大周期bn.
有些场合LCG有很好的应用,例如内存很紧张的嵌入式中,电子游戏控制台用的小整数,使用高位可以胜任。
LCG的一种C++实现版本如下:
//************************************************************************
//  Copyright (C) 2008 - 2009  Chipset
//
//  This program is free software: you can redistribute it and/or modify
//  it under the terms of the GNU Affero General Public License as
//  published by the Free Software Foundation, either version 3 of the
//  License, or (at your option) any later version.
//
//  but WITHOUT ANY WARRANTY; without even the implied warranty of
//  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
//  GNU Affero General Public License for more details.
//
//  You should have received a copy of the GNU Affero General Public License
//  along with this program. If not, see <http://www.gnu.org/licenses/>.
//************************************************************************
#ifndef LCRANDOM_HPP_
#define LCRANDOM_HPP_
#include <ctime>

class lcrandom
{
public:
  explicit lcrandom(size_t s = 0) : seed(s)
  {
    if (0 == seed) seed = std::time(0);
    randomize();
  }

  void reset(size_t s)
  {
    seed = s;
    if (0 == seed) seed = std::time(0);
    randomize();
  }

  size_t rand()
  {
  //returns a random integer in the range [0, -1UL)
    randomize();
    return seed;
  }

  double real()
  {
  //returns a random real number in the range [0.0, 1.0)
    randomize();
    return (double)(seed) / -1UL;
  }

private:
  size_t seed;
  void randomize() { seed = 1103515245UL * seed + 12345UL; }
};

class lcrand_help
{
  static lcrandom r;
public:
  lcrand_help() {}
  void operator()(size_t s) { r.reset(s); }
  size_t operator()() const { return r.rand(); }
  double operator()(double) { return r.real(); }
};
lcrandom lcrand_help:: r;

extern void lcsrand(size_t s) { lcrand_help()(s); }
extern size_t lcirand() { return lcrand_help()(); }
extern double lcdrand() { return lcrand_help()(1.0); }

#endif  // LCRANDOM_HPP_

如果需要高质量的伪随机数,内存充足(约2kb),Mersenne twister算法是个不错的选择。Mersenne twister产生随机数的质量几乎超过任何LCG。不过一般Mersenne twister的实现使用LCG产生种子。
Mersenne twister 是Makoto Matsumoto (松本)和Takuji Nishimura (西村)于1997年开发的伪随机数产生器,基于有限二进制字段上的 矩阵线性再生。可以快速产生高质量的伪随机数,修正了古老随机数产生算法的很多缺陷。 Mersenne twister这个名字来自周期长度通常取 Mersenne质数这样一个事实。常见的有两个变种Mersenne Twister MT19937和 Mersenne Twister MT19937-64。
Mersenne Twister有很多长处,例如:周期2^19937 - 1对于一般的应用来说,足够大了,序列关联比较小,能通过很多随机性测试。
关于Mersenne Twister比较详细的论述请参阅http://www.cppblog.com/Chipset/archive/2009/01/19/72330.html
用Mersenne twister算法实现的伪随机数版本非常多。例如boost库中的高质量快速随机数产生器就是用Mersenne twister算法原理编写的
PARTNER CONTENT

文章评论0条评论)

登录后参与讨论
EE直播间
更多
我要评论
0
4
关闭 站长推荐上一条 /3 下一条