7.6 随机
7.6 随机
本节,我们来讨论随机,随机是计算机程序中一个非常常见的需求,比如:
- 各种游戏中有大量的随机,比如扑克游戏中的洗牌。
- 微信抢红包,抢的红包金额是随机的。
- 北京购车摇号,谁能摇到是随机的。
- 给用户生成随机密码。
我们首先来介绍Java对随机的支持,同时介绍其实现原理,然后针对一些实际场景,包括洗牌、抢红包、摇号、随机高强度密码、带权重的随机选择等,讨论如何应用随机。先来看如何使用最基本的随机。
7.6.1 Math.random
Java中,对随机最基本的支持是Math类中的静态方法random(),它生成一个0~1的随机数,类型为double,包括0但不包括1。比如,随机生成并输出3个数:
1 | for(int i=0; i<3; i++){ |
笔者的计算机中的一次运行,输出为:
1 | 0.4784896133823269 |
每次运行,输出都不一样。Math.random()是如何实现的呢?我们来看相关代码(Java
7):
1 | private static Random randomNumberGenerator; |
内部它使用了一个Random类型的静态变量randomNumberGenerator,调用random()就是调用该变量的nextDouble()方法,这个Random变量只有在第一次使用的时候才创建。
下面我们来看这个Random类,它位于包java.util下。
7.6.2 Random
Random类提供了更为丰富的随机方法,它的方法不是静态方法,使用Random,先要创建一个Random实例,看个例子:
1 | Random rnd = new Random(); |
笔者计算机中的一次运行,输出为:
1 | -1516612608 |
nextInt()产生一个随机的int,可能为正数,也可能为负数,nextInt(100)产生一个随机int,范围是0~100,包括0不包括100。除了nextInt,还有一些别的方法:
1 | public long nextLong() //随机生成一个long |
除了默认构造方法,Random类还有一个构造方法,可以接受一个long类型的种子参数:
1 | public Random(long seed) |
种子决定了随机产生的序列,种子相同,产生的随机数序列就是相同的。看个例子:
Random rnd = new Random(20160824);
1 | for(int i=0; i<5; i++){ |
种子为20160824,产生5个0~100的随机数,输出为:
1 | 69 13 13 94 50 |
这个程序无论执行多少遍,在哪执行,输出结果都是相同的。
除了在构造方法中指定种子,Random类还有一个setter实例方法:
1 | synchronized public void setSeed(long seed) |
其效果与在构造方法中指定种子是一样的。
为什么要指定种子呢?指定种子还是真正的随机吗?指定种子是为了实现可重复的随机。比如用于模拟测试程序中,模拟要求随机,但测试要求可重复。在北京购车摇号程序中,种子也是指定的,后面我们还会介绍。种子到底扮演了什么角色呢?随机到底是如何产生的呢?让我们看下随机的基本原理。
7.6.3 随机的基本原理
Random产生的随机数不是真正的随机数,相反,它产生的随机数一般称为伪随机数。真正的随机数比较难以产生,计算机程序中的随机数一般都是伪随机数。
伪随机数都是基于一个种子数的,然后每需要一个随机数,都是对当前种子进行一些数学运算,得到一个数,基于这个数得到需要的随机数和新的种子。
数学运算是固定的,所以种子确定后,产生的随机数序列就是确定的,确定的数字序列当然不是真正的随机数,但种子不同,序列就不同,每个序列中数字的分布也都是比较随机和均匀的,所以称之为伪随机数。
Random的默认构造方法中没有传递种子,它会自动生成一个种子,这个种子数是一个真正的随机数,如下所示(Java
7):
1 | private static final AtomicLong seedUniquifier |
种子是seedUniquifier()与System.nanoTime()按位异或的结果,System.nanoTime()返回一个更高精度(纳秒)的当前时间,seedUniquifier()里面的代码涉及一些多线程相关的知识,我们后续章节再介绍,简单地说,就是返回当前seedUniquifier(current变量)与一个常数181783497276652981L相乘的结果(next变量),然后,设置seedUniquifier的值为next,使用循环和compareAndSet都是为了确保在多线程的环境下不会有两次调用返回相同的值,保证随机性。
有了种子数之后,其他数是怎么生成的呢?我们来看一些代码:
1 | public int nextInt() { |
它们都调用了next(int bits),生成指定位数的随机数,我们来看下它的代码:
1 | private static final long multiplier = 0x5DEECE66DL; |
简单地说,就是使用了如下公式:
1 | nextseed = (oldseed * multiplier + addend) & mask; |
旧的种子(oldseed)乘以一个数(multiplier),加上一个数addend,然后取低48位作为结果(mask相与)。
为什么采用这个方法?这个方法为什么可以产生随机数?这个方法的名称叫线性同余随机数生成器(linear congruential pseudorandom number generator),描述在《计算机程序设计艺术》一书中。随机的理论是一个比较复杂的话题,超出了本书的范畴,我们就不讨论了。
我们需要知道的基本原理是:随机数基于一个种子,种子固定,随机数序列就固定,默认构造方法中,种子是一个真正的随机数。
理解了随机的基本概念和原理,我们来看一些应用场景,包括随机密码、洗牌、带权重的随机选择、微信抢红包算法,以及北京购车摇号算法。
7.6.4 随机密码
在给用户生成账号时,经常需要给用户生成一个默认随机密码,然后通过邮件或短信发给用户,作为初次登录使用。我们假定密码是6位数字,代码很简单,如代码清单7-4所示。
1 | public static String randomPassword(){ |
代码很简单,就不解释了。如果要求是8位密码,字符可能由大写字母、小写字母、数字和特殊符号组成,如代码清单7-5所示。
1 | private static final String SPECIAL_CHARS = "! @#$%^&*_=+-/"; |
这段代码,对每个字符,先随机选类型,然后在给定类型中随机选字符。在笔者的计算机中,一次的随机运行结果是:
1 | 8Ctp2S4H |
这个结果不含特殊字符。很多环境对密码复杂度有要求,比如,至少要含一个大写字母、一个小写字母、一个特殊符号、一个数字。以上的代码满足不了这个要求,怎么满足呢?一种可能的代码如代码清单7-6所示。
1 | private static int nextIndex(char[] chars, Random rnd){ |
nextIndex随机生成一个未赋值的位置,程序先随机生成4个不同类型的字符,放到随机位置上,然后给未赋值的其他位置随机生成字符。
7.6.5 洗牌
一种常见的随机场景是洗牌,就是将一个数组或序列随机重新排列。我们以一个整数数组为例来介绍如何随机重排,如代码清单7-7所示。
1 | private static void swap(int[] arr, int i, int j){ |
shuffle方法能将参数数组arr随机重排,来看使用它的代码:
1 | int[] arr = new int[13]; |
调用shuffle方法前,arr是排好序的,调用后,一次调用的输出为:
1 | [3, 8, 11, 10, 7, 9, 4, 1, 6, 12, 5, 0, 2] |
已经随机重新排序了。shuffle的基本思路是什么呢?从后往前,逐个给每个数组位置重新赋值,值是从剩下的元素中随机挑选的。在如下关键语句中:
1 | swap(arr, i-1, rnd.nextInt(i)); |
i-1表示当前要赋值的位置,rnd.nextInt(i)表示从剩下的元素中随机挑选。
7.6.6 带权重的随机选择
实际场景中,经常要从多个选项中随机选择一个,不过,不同选项经常有不同的权重。比如,给用户随机奖励,三种面额:1元、5元和10元,权重分别为70、20和10。这个怎么实现呢?实现的基本思路是,使用概率中的累计概率分布。
以上面的例子来说,计算每个选项的累计概率值,首先计算总的权重,这里正好是100,每个选项的概率是70%、20%和10%,累计概率则分别是70%、90%和100%。
有了累计概率,则随机选择的过程是:使用nextDouble()生成一个0~1的随机数,然后使用二分查找,看其落入哪个区间,如果小于等于70%则选择第一个选项,70%和90%之间选第二个,90%以上选第三个,如图7-2所示。
下面来看代码,我们使用一个类Pair表示选项和权重,如代码清单7-8所示。
1 | class Pair { |
我们使用一个类WeightRandom表示带权重的选择,如代码清单7-9所示。
1 | public class WeightRandom { |
其中,prepare()方法计算每个选项的累计概率,保存在数组cumulativeProbabilities中, nextItem()方法根据权重随机选择一个,具体就是,首先生成一个0~1的数,然后使用二分查找,如果没找到,返回结果是-(插入点)-1,所以-index-1就是插入点,插入点的位置就对应选项的索引。
回到上面的例子,随机选择10次,代码为:
1 | Pair[] options = new Pair[]{ |
在一次运行中,输出正好符合预期,具体为:
1 | 1元 1元 1元 2元 1元 10元 1元 2元 1元 1元 |
不过,需要说明的是,由于随机,每次执行结果比例不一定正好相等。
7.6.7 抢红包算法
我们都知道,微信可以抢红包,红包有一个总金额和总数量,领的时候随机分配金额。金额是怎么随机分配的呢?微信具体是怎么做的,我们并不能确切地知道,但如下思路可以达到该效果。
维护一个剩余总金额和总数量,分配时,如果数量等于1,直接返回总金额,如果大于1,则计算平均值,并设定随机最大值为平均值的两倍,然后取一个随机值,如果随机值小于0.01,则为0.01,这个随机值就是下一个的红包金额。
我们来看代码,如代码清单7-10所示,为计算方便,金额用整数表示,以分为单位。
1 | public class RandomRedPacket { |
代码比较简单,就不解释了。关于synchronized修饰符,此处可以忽略,留待第15章介绍。看一个使用的例子,总金额为10元,10个红包,代码如下:
1 | RandomRedPacket redPacket = new RandomRedPacket(1000, 10); |
一次输出为:
1 | 136 48 90 151 36 178 92 18 122 129 |
如果是这个算法,那先抢好,还是后抢好呢?先抢肯定抢不到特别大的,不过,后抢也不一定会,这要看前面抢的金额,剩下的多就有可能抢到大的,剩下的少就不可能有大的。
7.6.8 北京购车摇号算法
我们来看下影响很多人的北京购车摇号,它的算法是怎样的呢?思路大概是这样的:
1)每期摇号前,将每个符合摇号资格的人,分配一个从0到总数的编号,这个编号是公开的,比如总人数为2 304 567,则编号为0~2 304 566。
2)摇号第一步是生成一个随机种子数,这个随机种子数在摇号当天通过一定流程生成,整个过程由公证员公证,就是生成一个真正的随机数。
3)种子数生成后,然后就是循环调用类似Random.nextInt(int n)方法,生成中签的编号。
编号是事先确定的,种子数是当场公证随机生成的,是公开的,随机算法是公开透明的,任何人都可以根据公开的种子数和编号验证中签的编号。
7.6.9 小结
本节介绍了随机,介绍了Java中对随机的支持Math.random()以及Random类,介绍了其使用和实现原理,同时,介绍了随机的一些应用场景,包括随机密码、洗牌、带权重的随机选择、微信抢红包和北京购车摇号,完整的代码在github上,地址为https://github.com/swiftma/program-logic ,位于包shuo.laoma.commoncls.c34下。
需要说明的是,Random类是线程安全的,也就是说,多个线程可以同时使用一个Random实例对象,不过,如果并发性很高,会产生竞争,这时,可以考虑使用多线程库中的ThreadLocalRandom类。另外,Java类库中还有一个随机类SecureRandom,可以产生安全性更高、随机性更强的随机数,用于安全加密等领域。
至此,关于常用基础类就介绍完了。我们深入分析了各种包装类、String、String-Builder、Arrays、日期和时间、以及随机,这些都是日常程序中经常用到的功能。还有一些基础类,限于篇幅,就不介绍了,比如UUID、Math和Objects,UUID用于随机生成需要确保唯一性的标识符,Math用于进行数学运算,Objects包含一些操作对象、检查条件的方法,具体可参看API文档。
之前章节中,我们经常提到泛型这一概念,它到底是什么呢?让我们下一章详细探讨。