Генератори випадкових чисел
Генерация случайных чисел и моделирование Последовательности случайных чисел используются в программировании в самых разнообразных случаях, начиная с моделирования (это наиболее частое применение) и кончая играми и другим развлекательным программным обеспечением. Турбо Паскаль содержит встроенную функцию, называемую Random, которая генерирует случайные числа. Как вы увидите в данной главе, Random - это превосходный генератор случайных чисел, но для некоторых применений вам может потребоваться два или более различных генераторов для обеспечения различных наборов случайных чисел для различных задач. Кроме того, при моделировании требуется ассиметричный или дисбалансный генератор случайных чисел, который порождает последовательность, смещенную к одному из концов. Первая часть данной главы посвящена построению генераторов случайных чисел и оценке их качества. Во второй части данной главы показывается, как вы можете использовать случайные числа при моделировании реальных ситуаций на двух примерах. В примерах иллюстрируются фундаментальные основы прогр
Генераторы случайных чисел Технически термин "генератор случайных чисел" - это абсурд; числа само по себе не являются случайными. Например, 100 - это случайное число? А 25? Что в действительности означает этот термин, так это то, что создается последовательность чисел, появляющихся случайным образом. Это порождает более сложный вопрос: что такое последовательность случайных чисел? Единственно правильный ответ: последовательность случайных чисел _ это последовательность, в которой все элементы являются несвязанными. Это определение приводит к такому парадоксу, что любая последовательность может быть как случайной, так и неслучайной в зависимости от того, как эта последовательность получена. Например, следующая строка чисел 1 2 3 4 5 6 7 8 9 0 была получена печатанием верхней строки клавиатуры по порядку, таким образом последовательность конечно не может рассматриваться как сгенерированная случайным образом. Но как быть, если вы получите ту же самую последовательность, вынимая пронумерованный теннисные шары из боченка. В данном случае это уже случайным образом сгенерированная последовательность. Данный пример показывает, что случайность последовательности зависит от того, как она была получена, а не от нее самой. Помните, что последовательность чисел, сгенерированная компьютером, является детерминированной: каждое число, кроме первого, зависит от предшествующих чисел. Технически это означает, что компьютером может быть сгенерирована только квазислучайная последовательность чисел. Однако, этого достаточно для большинства задач и в данной книге такие последовательности для простоты будут называться случайными. В общем случае считается хорошо, когда числа в последовательности случайных чисел распределены равномерно (не путайте это с нормальным распределением или колоколообразной кривой). При равномерном распределении все события равновероятны так, что диаграмма равномерного распределения стремится к прямой горизонтальной линии, а не к кривой. До широкого распространения компьютеров всякий раз, когда необходимы были случайные числа, они получались либо бросанием игральных костей, либо выниманием пронумерованных шаров из ящика. В 1955 году фирма RAND опубликовала таблицу из 1 миллиона случайных чисел, полученных с помощью вычислительной машины. На ранней стадии развития вычислительной техники было разработано много методов генерации случайных чисел, но большинство из них не нашло применения. Один очень интересный метод был разработан Джоном фон Нейманом; его часто называют среднеквадратичным. В данном методе предыдущее случайное число возводится в квадрат, а затем из результата выделяются средние цифры. Например, если вы создаете числа из трех цифр, а предыдущее число было 121, то возведение в квадрат дает результат 14641. Выделение трех средних цифр дает следующее случайное число 464. Недостатком данного метода является то, что он имеет очень короткий период повторения, называемый циклом. По данной причине данный метод сегодня не используется. В настоящий момент наиболее часто применяется метод генерации случайных чисел, основывающийся на использовании уравнения
R = (aR +c)modm n+1 n
при выполнении следующих условий
R>0 a>0 c>0 m>R , a и c
Отметим, что R - это предыдущее число, а R - следующее. Данный метод иногда называют линейным сравнительным методом. Формула так проста, что вы можете подумать, что генерировать случайные числа просто. Однако, это ловушка: насколько хорошо работает данная формула, очень сильно зависит от значения а, с и m. Выбор значений иногда в большей степени искусство, нежели наука. Существуют сложные правила, которые могут помочь вам выбрать значения; однако, мы рассмотрим лишь несколько простых правил и примеров. Модуль (m) должен быть довольно большим, так как он определяет область случайных чисел. Операция взятия по модулю порождает остаток от деления числа на модуль. Следовательно, 10 по модулю 4 равно 2. Таким образом, если модуль равен 12, то формулой порождаются числа от 0 до 11, а если модуль равен 21425, то порождаются числа от 0 до 21424. Выбор множителя а и приращения с является очень сложной задачей. В общем случае множитель может быть довольно большим, а приращение - маленьким. Множество попыток и проверок необходимо, чтобы создать хороший генератор. В качестве первого примера здесь приведен один из наиболее часто используемых генераторов случайных чисел. Уравнение, показанное в Rаn1 используется как основа для генератора случайных чисел в ряде популярных языков.
var a1: integer; { установка до первого вызова Ran1 } function Ran1: real; var t: real; begin t := (a1*32749+3) mod 32749; a1 := Trunc(t); Ran1 := Abs(t/32749); end; {Rea1}
Данная функция имеет три главные особенности. Во-первых, случайные числа в действительности являются целыми, хотя функция возвращает действительные числа. Данный метод работает с целыми числами, но генераторы случайных чисел, как это принято, должны возвращать числа в пределах от 0 до 1, что означает, что это должны быть числа с плавающей запятой. Во-вторых, начальное значение задается через глобальную переменную а1. До первого вызова Ran1 переменная а1 должна быть установлена в 1. В-третьих, в Ran1 случайные числа делятся на модуль прежде, чем они будут возвращены функцией, для того, чтобы числа лежали в области от 0 до 1. Если вы поинтересуетесь значением глобальной переменной а1 до возврата строки, то оно должно лежать в области от 0 до 32748. Следовательно, когда а1 делится на 32749, полученное число будет больше или равно 0 и меньше 1. Многие генераторы случайных чисел не применимы, так как они порождают не равномерное распределение или имеют короткий цикл повторения. Даже когда эти недостатки не очень бросаются в глаза, они могут породить смешанный результат, если такой генератор используется снова и снова. Решение заключается в том, чтобы создать различные генераторы и применять их индивидуально или совместно для получения более качественных последовательностей случайных чисел. Применение нескольких генераторов может сгладить распределение последовательности за счет уменьшения малых смешений отдельных генераторов. Далее приведена функция генерирования случайных чисел, называемая Ran2, которая порождает хорошее распределение:
var a2:integer; { установить в значение 203 до первого вызова Ran2 } function Ran2: real; var t: real; begin t := (a2*10001+3) mod 17417; a2 := Trunc(t); Ran2 := Abc(t/17417); end; {Ran2}
Оба этих генератора случайных чисел порождают хорошие последовательности случайных чисел. Тем не менее остаются вопросы: достаточно ли "случайной" является последовательность? Хороши ли данные генераторы?
Определение качества генераторов Вы можете применить различные тексты для определения случайности последовательности чисел. Ни один из тестов не скажет, что последовательность является случайной, однако, он скажет, если она не является таковой. Тесты могут выявить не случайные последовательности, но, если тест не нашел недостатков, это не означает, что данная последовательность действительно случайная. Тесты, однако, повышают уверенность в генераторе случайных чисел, который породил последовательность. Теперь мы кратко рассмотрим несколько простых способов тестирования последовательностей. Для начала рассмотрим способ определения того, насколько близко распределение чисел в последовательности соответствует ожидаемому. Например, вы пытаетесь генерировать последовательность случайных чисел от 0 до 9. Вероятность появления каждой цифры равна 1/10. Пусть была сгенерирована следующая последовательность
9 1 8 2 4 6 3 7 5 2 9 0 4 2 4 7 8 6 2
Если вы подсчитаете число появлений каждой цифры, то получите результат
Цифры Число появлений 0 1 1 1 2 4 3 1 4 3 5 1 6 2 7 2 8 3 9 2
Далее вам следует ответить самому себе на вопрос, достаточно ли похоже данное распределение на ожидаемое вами. Помните: если генератор случайных чисел хороший, он генерирует последовательности случайно. В истинно случайном варианте все последовательности возможны. Действительно, как какая-то последовательность может быть не случайной, если любая последовательность возможна? Просто некоторые последовательности менее похожи на то, какой должна быть случайная последовательность, чем другие. Вы можете определить вероятность того, что данная последовательность является случайной, используя критерий хи-квадрат. В критерии хи-квадрат ожидаемое количество вычитается из наблюдаемого количества встреч числа в сгенерированной последовательности. Этот результат называется V. Вы можете использовать Vдля нахождения процента в таблице значений хи-квадрат. Этот процент определяет вероятность того, что была порождена случайная последовательность. Малая таблица хи-квадрат приведена на рис.7-1; вы можете найти полные таблицы в большинстве книг по статистике
p=99% p=95% p=75% p=50% p=25% p=5% n=5 0.5543 1.1455 2.675 4.351 6.626 11.07 n=10 2.558 3.940 6.737 9.342 12.55 18.31 n=15 5.229 7.261 11.04 14.34 18.25 25.00 n=20 8.260 10.85 15.45 19.34 23.83 31.41 n=30 14.95 18.49 24.48 29.34 34.80 43.77
Выбранные значения хи-квадрат. Для определения вероятности того, что последовательность не случайная, найдите строку в таблице, показанной на рис.7-1, с числом элементов последовательности; в данном случае это 20. Затем ищите число по строке, которое больше V. В данном случае это колонка 1. Это означает, что существует вероятность 99% того, что пример из 20 элементов будет иметь V больше 8,260. С другой стороны это означает, что существует вероятность только в 1% того, что проверяемая последовательность была сгенерирована случайным образом. Чтобы пройти через критерий хи-квадрат, вероятность V должна снизиться до уровня от 25% до 75%. Однако вы можете противопоставить этому выводу вопрос: Так как все последовательности возможны, как может данная последовательность иметь только однопроцентный шанс быть законной? Ответ такой: это всего лишь вероятность. Фактически, если вы применяете критерий хи-квадрат, вам следует получить несколько различных последовательностей и усредненный результат, чтобы избежать отвержения хорошего генератора случайных чисел. Любая единичная последовательность может быть отвергнута, но ряд различных последовательностей после усреднения должен давать хороший результат. С другой стороны, последовательность может пройти через критерий хи-квадрат и не быть случайной. Например, последовательность 1 3 5 7 9 1 3 5 7 9 пройдет критерий хи-квадрат, но она выглядит не очень случайной. В данном случае сгенерирован пробег по диапазону значений. Пробег - это просто возрастающая или убывающая последовательность чисел с произвольным интервалом. В данном случае каждая группа из пяти цифр представляет собой возрастающую последовательность и как таковая не может считаться случайной последовательностью. Можно создать тест для обнаружения такой ситуации, но это выходит за рамки данной книги. Другой характеристикой, подлежащей оценке, является длина периода: то есть, как много чисел может быть сгенерировано до начала повторения последовательности. Все машинные генераторы случайных чисел всегда генерировали повторяющуюся последовательность. Чем длиннее период, тем лучше генератор. Даже если частота чисел внутри периода распределена равномерно, числа не образуют случайную серию, так как действительно случайная серия не может достаточно повторяться. В общем случае период в несколько тысяч чисел удовлетворяет большинству применений. Тест для выяснения периода может быть разработан. Различные другие тесты могут быть применены для определения качества генератора случайных чисел. Наверное, можно написать больше программ для проверки генераторов случайных чисел, чем создать самих генераторов. Рассмотрим еще один тест, который позволит вам проверить генератор случайных чисел "визуально", используя диаграмму для демонстрации характеристик сгенерированной последовательности. В идеале диаграмма должна основываться на частоте каждого числа. Однако так как генератор может порождать тысячи различных чисел, это не выполнимо. Вместо этого будут создаваться диаграммы, сгруппированные до десяти цифрам. Например, так как порождаемые числа лежат в области от 0 до 1, число 0.9365783 будет включено в группу 9, а число 0.34523445 будет включено в группу 3. Это означает, что диаграмма вывода случайных чисел имеет 10 линий, каждая из которых представляет число попаданий в группу. Программа также выводит среднее значение последовательности, которое может быть использовано для обнаружения смешения. Как и все другие программы данной главы, следующая программа выполняется только на персональном компьютере IBM PC, который имеет адаптер цветного графического дисплея. Разработанные ранее функции Ran1 и Ran2, а также встроенная функция Турбо Паскаля Random, продемонстрированы рядом для сравнения.
{ программа, которая сравнивает три генератора случайных чисел } program RanGenerator;
uses Graph;
const COUNT = 1000;
var freg1, freg2, freg3: array[0..9] of integer; a2, a1: integer;
f, f2, f3: real; r, r2, r3: real; y, x: integer; GraphDriver, GraphMode: integer;
{отображение графического вывода} procedure Display; var t : integer; begin for t := 0 to 9 do begin Line(t*10, 180, t*10, 180-freg1[t]); Line(t*10+110, 180, t*10+110, 180-freg2[t]); Line(t*10+220, 180, t*10+220, 180-freg3[t]); end; end; {Display}
function Ran1: real; var t: real; begin t := (a1*32749+3) mod 32749; a1 := Trunc(t); Ran1 := Abs(t/32749); end; {Ran1}
function Ran2: real; var t: real; begin t := (a2*10001+3) mod 17417; a2 := Trunc(t); Ran2 := Abs(t/17417); end; {Ran2}
begin { переключение на графический режим, используя режим 4 CGA/EGA } GraphDriver := CGA; GraphMode := CGAC1; InitGraph(GraphDriver, GraphMode, ); SetColor(2); SetLineStyle(SolidLn, 0, NormWidth);
OutTextXy(80, 10, 'Comparison of Random'); OutTextXy(96, 20, 'Number Generators');
{ прорисовать базовые линии } Line(0, 180, 90, 180); Line(110, 180, 200, 180);
Line(220, 180, 310, 180); OutTextXy(30, 190, 'Random Ran1 Ran2');
{инициализация переменных генераторов случайных чисел } a1:=1; a2:=203; f := 0; f2 := 0; f3 := 0;
for x := 0 to 9 do begin { инициализация матриц частот } freg1[x] := 0; freg2[x] := 0; freg3[x] := 0; end; for x := 1 to COUNT do begin r:=Random; { взять случайное число } f:=f+r; { прибавить для вычисления среднего } y:=Trunc(r*10);{ преобразовать в целое число от 0 до 9 } freg1[y]:=freg1[y]+1;{ увеличить счетчик частоты }
r2 := Ran1; { взять случайное число } f2:=f2+r2; { прибавить для вычисления среднег } y:=Trunc(r2*10);{ преобразовать в целое число от 0 до 9} freg2[y]:=freg2[y]+1;{ увеличить счетчик частоты }
r3 := Ran2; { взять случайное число } f3:=f3+r3; { прибавить для вычисления среднего } y:=Trunc(r3*10);{ преобразовать в целое число от 0 до 9} freg3[y]:=freg3[y]+1;{увеличить счетчик частоты }
Display; { отобразить счетчики частот } end; ReadLn; RestoreCrtMode;
WriteLn('mean of Random is: ', f/COUNT); WriteLn('mean of Ran1 is: ', f2/COUNT); WriteLn('mean of Ran2 is: ', f3/COUNT); end.
В данной программе каждая функция генерирует 1000 чисел и на основе этого создаются таблицы частот. Процедура Display рисует все три матрицы частот на экране после генерации каждого случайного числа так, что вы можете наблюдать рост частот. На рис.7-2 показан вывод каждого генератора случайных чисел после генерации 1000 чисел. Средние значения равны 0,489932 у Ran1, 0,4858311 y Ran2 и 0,494014 у Random. Это приемлемо.
Сравнение генераторов случайных чисел
¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ L-+-+-+-+-+-+-+-+-- L-+-+-+-+-+-+-+-+-- L-+-+-+-+-+-+-+-+- Random Ran1 Ran2 ----------------------------------------------------------.
Вывод из программы отображения работы генераторов
случайных чисел.
Для эффективного использования программы вы должны наблюдать как за формой диаграммы, так и за динамикой роста, чтобы выявить короткие повторяющиеся циклы. Например, Ran2 генерирует значительно меньше чисел в области от 0,9 до 0,999999, чем Random и Ran1. Конечно данный текст не является всеобъемлющим, но он поможет вам понять способ, которым генератор порождает числа, и ускорит процесс анализа генераторов.