7.6 随机

7.6 随机

本节,我们来讨论随机,随机是计算机程序中一个非常常见的需求,比如:

  • 各种游戏中有大量的随机,比如扑克游戏中的洗牌。
  • 微信抢红包,抢的红包金额是随机的。
  • 北京购车摇号,谁能摇到是随机的。
  • 给用户生成随机密码。

我们首先来介绍Java对随机的支持,同时介绍其实现原理,然后针对一些实际场景,包括洗牌、抢红包、摇号、随机高强度密码、带权重的随机选择等,讨论如何应用随机。先来看如何使用最基本的随机。

7.6.1 Math.random

Java中,对随机最基本的支持是Math类中的静态方法random(),它生成一个0~1的随机数,类型为double,包括0但不包括1。比如,随机生成并输出3个数:

1
2
3
for(int i=0; i<3; i++){
System.out.println(Math.random());
}

笔者的计算机中的一次运行,输出为:

1
2
3
0.4784896133823269
0.03012515628333423
0.7921024363953197

每次运行,输出都不一样。Math.random()是如何实现的呢?我们来看相关代码(Java
7):

1
2
3
4
5
6
7
8
9
10
private static Random randomNumberGenerator;
private static synchronized Random initRNG() {
Random rnd = randomNumberGenerator;
return (rnd == null) ? (randomNumberGenerator = new Random()) : rnd;
}
public static double random() {
Random rnd = randomNumberGenerator;
if (rnd == null) rnd = initRNG();
return rnd.nextDouble();
}

内部它使用了一个Random类型的静态变量randomNumberGenerator,调用random()就是调用该变量的nextDouble()方法,这个Random变量只有在第一次使用的时候才创建。

下面我们来看这个Random类,它位于包java.util下。

7.6.2 Random

Random类提供了更为丰富的随机方法,它的方法不是静态方法,使用Random,先要创建一个Random实例,看个例子:

1
2
3
Random rnd = new Random();
System.out.println(rnd.nextInt());
System.out.println(rnd.nextInt(100));

笔者计算机中的一次运行,输出为:

1
2
-1516612608
23

nextInt()产生一个随机的int,可能为正数,也可能为负数,nextInt(100)产生一个随机int,范围是0~100,包括0不包括100。除了nextInt,还有一些别的方法:

1
2
3
4
5
public long nextLong() //随机生成一个long
public boolean nextBoolean() //随机生成一个boolean
public void nextBytes(byte[] bytes) //产生随机字节, 字节个数就是bytes的长度
public float nextFloat() //随机浮点数,从0到1,包括0不包括1
public double nextDouble() //随机浮点数,从0到1,包括0不包括1

除了默认构造方法,Random类还有一个构造方法,可以接受一个long类型的种子参数:

1
public Random(long seed)

种子决定了随机产生的序列,种子相同,产生的随机数序列就是相同的。看个例子:

Random rnd = new Random(20160824);

1
2
3
for(int i=0; i<5; i++){
System.out.print(rnd.nextInt(100)+" ");
}

种子为20160824,产生5个0~100的随机数,输出为:

1
69 13 13 94 50

这个程序无论执行多少遍,在哪执行,输出结果都是相同的。

除了在构造方法中指定种子,Random类还有一个setter实例方法:

1
synchronized public void setSeed(long seed)

其效果与在构造方法中指定种子是一样的。

为什么要指定种子呢?指定种子还是真正的随机吗?指定种子是为了实现可重复的随机。比如用于模拟测试程序中,模拟要求随机,但测试要求可重复。在北京购车摇号程序中,种子也是指定的,后面我们还会介绍。种子到底扮演了什么角色呢?随机到底是如何产生的呢?让我们看下随机的基本原理。

7.6.3 随机的基本原理

Random产生的随机数不是真正的随机数,相反,它产生的随机数一般称为伪随机数。真正的随机数比较难以产生,计算机程序中的随机数一般都是伪随机数。

伪随机数都是基于一个种子数的,然后每需要一个随机数,都是对当前种子进行一些数学运算,得到一个数,基于这个数得到需要的随机数和新的种子。

数学运算是固定的,所以种子确定后,产生的随机数序列就是确定的,确定的数字序列当然不是真正的随机数,但种子不同,序列就不同,每个序列中数字的分布也都是比较随机和均匀的,所以称之为伪随机数。

Random的默认构造方法中没有传递种子,它会自动生成一个种子,这个种子数是一个真正的随机数,如下所示(Java
7):

1
2
3
4
5
6
7
8
9
10
11
12
13
private static final AtomicLong seedUniquifier
= new AtomicLong(8682522807148012L);
public Random() {
this(seedUniquifier() ^ System.nanoTime());
}
private static long seedUniquifier() {
for(; ; ) {
long current = seedUniquifier.get();
long next = current * 181783497276652981L;
if(seedUniquifier.compareAndSet(current, next))
return next;
}
}

种子是seedUniquifier()与System.nanoTime()按位异或的结果,System.nanoTime()返回一个更高精度(纳秒)的当前时间,seedUniquifier()里面的代码涉及一些多线程相关的知识,我们后续章节再介绍,简单地说,就是返回当前seedUniquifier(current变量)与一个常数181783497276652981L相乘的结果(next变量),然后,设置seedUniquifier的值为next,使用循环和compareAndSet都是为了确保在多线程的环境下不会有两次调用返回相同的值,保证随机性。

有了种子数之后,其他数是怎么生成的呢?我们来看一些代码:

1
2
3
4
5
6
7
8
9
10
11
12
public int nextInt() {
return next(32);
}
public long nextLong() {
return ((long)(next(32)) << 32) + next(32);
}
public float nextFloat() {
return next(24) / ((float)(1 << 24));
}
public boolean nextBoolean() {
return next(1) ! = 0;
}

它们都调用了next(int bits),生成指定位数的随机数,我们来看下它的代码:

1
2
3
4
5
6
7
8
9
10
11
12
private static final long multiplier = 0x5DEECE66DL;
private static final long addend = 0xBL;
private static final long mask = (1L << 48) - 1;
protected int next(int bits) {
long oldseed, nextseed;
AtomicLong seed = this.seed;
do {
oldseed = seed.get();
nextseed = (oldseed * multiplier + addend) & mask;
} while (! seed.compareAndSet(oldseed, nextseed));
return (int)(nextseed >>> (48 - bits));
}

简单地说,就是使用了如下公式:

1
nextseed = (oldseed * multiplier + addend) & mask;

旧的种子(oldseed)乘以一个数(multiplier),加上一个数addend,然后取低48位作为结果(mask相与)。

为什么采用这个方法?这个方法为什么可以产生随机数?这个方法的名称叫线性同余随机数生成器(linear congruential pseudorandom number generator),描述在《计算机程序设计艺术》一书中。随机的理论是一个比较复杂的话题,超出了本书的范畴,我们就不讨论了。

我们需要知道的基本原理是:随机数基于一个种子,种子固定,随机数序列就固定,默认构造方法中,种子是一个真正的随机数。

理解了随机的基本概念和原理,我们来看一些应用场景,包括随机密码、洗牌、带权重的随机选择、微信抢红包算法,以及北京购车摇号算法。

7.6.4 随机密码

在给用户生成账号时,经常需要给用户生成一个默认随机密码,然后通过邮件或短信发给用户,作为初次登录使用。我们假定密码是6位数字,代码很简单,如代码清单7-4所示。

代码清单7-4 生成随机密码:6位数字
1
2
3
4
5
6
7
8
public static String randomPassword(){
char[] chars = new char[6];
Random rnd = new Random();
for(int i=0; i<6; i++){
chars[i] = (char)('0'+rnd.nextInt(10));
}
return new String(chars);
}

代码很简单,就不解释了。如果要求是8位密码,字符可能由大写字母、小写字母、数字和特殊符号组成,如代码清单7-5所示。

代码清单7-5 生成随机密码:简单8位
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
private static final String SPECIAL_CHARS = "! @#$%^&*_=+-/";
private static char nextChar(Random rnd){
switch(rnd.nextInt(4)){
case 0:
return (char)('a'+rnd.nextInt(26));
case 1:
return (char)('A'+rnd.nextInt(26));
case 2:
return (char)('0'+rnd.nextInt(10));
default:
return SPECIAL_CHARS.charAt(rnd.nextInt(SPECIAL_CHARS.length()));
}
}
public static String randomPassword(){
char[] chars = new char[8];
Random rnd = new Random();
for(int i=0; i<8; i++){
chars[i] = nextChar(rnd);
}
return new String(chars);
}

这段代码,对每个字符,先随机选类型,然后在给定类型中随机选字符。在笔者的计算机中,一次的随机运行结果是:

1
8Ctp2S4H

这个结果不含特殊字符。很多环境对密码复杂度有要求,比如,至少要含一个大写字母、一个小写字母、一个特殊符号、一个数字。以上的代码满足不了这个要求,怎么满足呢?一种可能的代码如代码清单7-6所示。

代码清单7-6 生成随机密码:复杂8位
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
private static int nextIndex(char[] chars, Random rnd){
int index = rnd.nextInt(chars.length);
while(chars[index]! =0){
index = rnd.nextInt(chars.length);
}
return index;
}
private static char nextSpecialChar(Random rnd){
return SPECIAL_CHARS.charAt(rnd.nextInt(SPECIAL_CHARS.length()));
}
private static char nextUpperlLetter(Random rnd){
return (char)('A'+rnd.nextInt(26));
}
private static char nextLowerLetter(Random rnd){
return (char)('a'+rnd.nextInt(26));
}
private static char nextNumLetter(Random rnd){
return (char)('0'+rnd.nextInt(10));
}
public static String randomPassword(){
char[] chars = new char[8];
Random rnd = new Random();
chars[nextIndex(chars, rnd)] = nextSpecialChar(rnd);
chars[nextIndex(chars, rnd)] = nextUpperlLetter(rnd);
chars[nextIndex(chars, rnd)] = nextLowerLetter(rnd);
chars[nextIndex(chars, rnd)] = nextNumLetter(rnd);
for(int i=0; i<8; i++){
if(chars[i]==0){
chars[i] = nextChar(rnd);
}
}
return new String(chars);
}

nextIndex随机生成一个未赋值的位置,程序先随机生成4个不同类型的字符,放到随机位置上,然后给未赋值的其他位置随机生成字符。

7.6.5 洗牌

一种常见的随机场景是洗牌,就是将一个数组或序列随机重新排列。我们以一个整数数组为例来介绍如何随机重排,如代码清单7-7所示。

代码清单7-7 随机重排
1
2
3
4
5
6
7
8
9
10
11
private static void swap(int[] arr, int i, int j){
int tmp = arr[i];
arr[i] = arr[j];
arr[j] = tmp;
}
public static void shuffle(int[] arr){
Random rnd = new Random();
for(int i=arr.length; i>1; i--) {
swap(arr, i-1, rnd.nextInt(i));
}
}

shuffle方法能将参数数组arr随机重排,来看使用它的代码:

1
2
3
4
5
6
int[] arr = new int[13];
for(int i=0; i<arr.length; i++){
arr[i] = i;
}
shuffle(arr);
System.out.println(Arrays.toString(arr));

调用shuffle方法前,arr是排好序的,调用后,一次调用的输出为:

1
[3, 8, 11, 10, 7, 9, 4, 1, 6, 12, 5, 0, 2]

已经随机重新排序了。shuffle的基本思路是什么呢?从后往前,逐个给每个数组位置重新赋值,值是从剩下的元素中随机挑选的。在如下关键语句中:

1
swap(arr, i-1, rnd.nextInt(i));

i-1表示当前要赋值的位置,rnd.nextInt(i)表示从剩下的元素中随机挑选。

7.6.6 带权重的随机选择

实际场景中,经常要从多个选项中随机选择一个,不过,不同选项经常有不同的权重。比如,给用户随机奖励,三种面额:1元、5元和10元,权重分别为70、20和10。这个怎么实现呢?实现的基本思路是,使用概率中的累计概率分布。

以上面的例子来说,计算每个选项的累计概率值,首先计算总的权重,这里正好是100,每个选项的概率是70%、20%和10%,累计概率则分别是70%、90%和100%。

有了累计概率,则随机选择的过程是:使用nextDouble()生成一个0~1的随机数,然后使用二分查找,看其落入哪个区间,如果小于等于70%则选择第一个选项,70%和90%之间选第二个,90%以上选第三个,如图7-2所示。

epub_923038_54

图7-2 选项的累计概率值

下面来看代码,我们使用一个类Pair表示选项和权重,如代码清单7-8所示。

代码清单7-8 表示选项和权重的类Pair
1
2
3
4
5
6
7
8
9
10
11
12
13
14
class Pair {
Object item;
int weight;
public Pair(Object item, int weight){
this.item = item;
this.weight = weight;
}
public Object getItem() {
return item;
}
public int getWeight() {
return weight;
}
}

我们使用一个类WeightRandom表示带权重的选择,如代码清单7-9所示。

代码清单7-9 带权重的选择WeightRandom
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
public class WeightRandom {
private Pair[] options;
private double[] cumulativeProbabilities;
private Random rnd;
public WeightRandom(Pair[] options){
this.options = options;
this.rnd = new Random();
prepare();
}
private void prepare(){
int weights = 0;
for(Pair pair : options){
weights += pair.getWeight();
}
cumulativeProbabilities = new double[options.length];
int sum = 0;
for(int i = 0; i<options.length; i++) {
sum += options[i].getWeight();
cumulativeProbabilities[i] = sum / (double)weights;
}
}
public Object nextItem(){
double randomValue = rnd.nextDouble();
int index = Arrays.binarySearch(cumulativeProbabilities, randomValue);
if(index < 0) {
index = -index-1;
}
return options[index].getItem();
}
}

其中,prepare()方法计算每个选项的累计概率,保存在数组cumulativeProbabilities中, nextItem()方法根据权重随机选择一个,具体就是,首先生成一个0~1的数,然后使用二分查找,如果没找到,返回结果是-(插入点)-1,所以-index-1就是插入点,插入点的位置就对应选项的索引。

回到上面的例子,随机选择10次,代码为:

1
2
3
4
5
6
7
Pair[] options = new Pair[]{
new Pair("1元",7), new Pair("2元", 2), new Pair("10元", 1)
};
WeightRandom rnd = new WeightRandom(options);
for(int i=0; i<10; i++){
System.out.print(rnd.nextItem()+" ");
}

在一次运行中,输出正好符合预期,具体为:

1
1元 1元 1元 2元 1元 10元 1元 2元 1元 1元

不过,需要说明的是,由于随机,每次执行结果比例不一定正好相等。

7.6.7 抢红包算法

我们都知道,微信可以抢红包,红包有一个总金额和总数量,领的时候随机分配金额。金额是怎么随机分配的呢?微信具体是怎么做的,我们并不能确切地知道,但如下思路可以达到该效果。

维护一个剩余总金额和总数量,分配时,如果数量等于1,直接返回总金额,如果大于1,则计算平均值,并设定随机最大值为平均值的两倍,然后取一个随机值,如果随机值小于0.01,则为0.01,这个随机值就是下一个的红包金额。

我们来看代码,如代码清单7-10所示,为计算方便,金额用整数表示,以分为单位。

代码清单7-10 抢红包算法
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
public class RandomRedPacket {
private int leftMoney;
private int leftNum;
private Random rnd;
public RandomRedPacket(int total, int num){
this.leftMoney = total;
this.leftNum = num;
this.rnd = new Random();
}
public synchronized int nextMoney(){
if(this.leftNum<=0){
throw new IllegalStateException("抢光了");
}
if(this.leftNum==1){
return this.leftMoney;
}
double max = this.leftMoney/this.leftNum*2d;
int money = (int)(rnd.nextDouble()*max);
money = Math.max(1, money);
this.leftMoney -= money;
this.leftNum --;
return money;
}
}

代码比较简单,就不解释了。关于synchronized修饰符,此处可以忽略,留待第15章介绍。看一个使用的例子,总金额为10元,10个红包,代码如下:

1
2
3
4
RandomRedPacket redPacket = new RandomRedPacket(1000, 10);
for(int i=0; i<10; i++){
System.out.print(redPacket.nextMoney()+" ");
}

一次输出为:

1
136 48 90 151 36 178 92 18 122 129

如果是这个算法,那先抢好,还是后抢好呢?先抢肯定抢不到特别大的,不过,后抢也不一定会,这要看前面抢的金额,剩下的多就有可能抢到大的,剩下的少就不可能有大的。

7.6.8 北京购车摇号算法

我们来看下影响很多人的北京购车摇号,它的算法是怎样的呢?思路大概是这样的:
1)每期摇号前,将每个符合摇号资格的人,分配一个从0到总数的编号,这个编号是公开的,比如总人数为2 304 567,则编号为0~2 304 566。
2)摇号第一步是生成一个随机种子数,这个随机种子数在摇号当天通过一定流程生成,整个过程由公证员公证,就是生成一个真正的随机数。
3)种子数生成后,然后就是循环调用类似Random.nextInt(int n)方法,生成中签的编号。

编号是事先确定的,种子数是当场公证随机生成的,是公开的,随机算法是公开透明的,任何人都可以根据公开的种子数和编号验证中签的编号。

7.6.9 小结

本节介绍了随机,介绍了Java中对随机的支持Math.random()以及Random类,介绍了其使用和实现原理,同时,介绍了随机的一些应用场景,包括随机密码、洗牌、带权重的随机选择、微信抢红包和北京购车摇号,完整的代码在github上,地址为https://github.com/swiftma/program-logic ,位于包shuo.laoma.commoncls.c34下。

需要说明的是,Random类是线程安全的,也就是说,多个线程可以同时使用一个Random实例对象,不过,如果并发性很高,会产生竞争,这时,可以考虑使用多线程库中的ThreadLocalRandom类。另外,Java类库中还有一个随机类SecureRandom,可以产生安全性更高、随机性更强的随机数,用于安全加密等领域。

至此,关于常用基础类就介绍完了。我们深入分析了各种包装类、String、String-Builder、Arrays、日期和时间、以及随机,这些都是日常程序中经常用到的功能。还有一些基础类,限于篇幅,就不介绍了,比如UUID、Math和Objects,UUID用于随机生成需要确保唯一性的标识符,Math用于进行数学运算,Objects包含一些操作对象、检查条件的方法,具体可参看API文档。

之前章节中,我们经常提到泛型这一概念,它到底是什么呢?让我们下一章详细探讨。