четверг, 27 марта 2014 г.

Никогда не говори 'никогда'

Почему не стоит удивляться невероятным на первый взгляд совпадениям — даже когда речь идет о двух розыгрышах лотереи, в которых выпадали шесть одинаковых чисел.

Свод математических правил, который я называю принципом невероятности, говорит о том, что случайные совпадения не должны нас удивлять. На самом деле они вполне ожидаемы. В основе этого принципа лежит закон больших чисел, согласно которому при одинаковой вероятности событий во всех испытаниях с увеличением числа последних частота события стремится к его вероятности и перестает быть случайной. Впрочем, даже когда число событий достаточно велико, нам может показаться, что их совсем немного. Подобное заблуждение ведет к существенной недооценке вероятности того или иного события: мы думаем, что она ничтожно мала, в то время как на самом деле это вполне возможно, не исключено даже, что оно произойдет обязательно.

Но вот вопрос: как можно не заметить огромное число событий? Ответ на него дает закон сочетаний, связанный с принципом невероятности. Он гласит, что число сочетаний между элементами экспоненциально возрастает с числом последних. Хорошо известным примером тому служит так называемый парадокс дней рождения.


Он заключается в следующем. Вас интересует, сколько человек должно находиться в комнате, чтобы вероятность того, что дни рождения хотя бы двух из них совпадают, превысила 50%? Ответ — 23. Если в комнате присутствуют 23 или более человек, то вероятность, что найдутся двое родившихся в один день, выше вероятности, что таковых не окажется вовсе.

Если раньше вы не знали о существовании парадокса дней рождения, то, скорее всего, ответ покажется вам странным. Ведь 23 — совсем небольшое число. Наверное, вы рассуждали так: шанс того, что кто-то другой родился в один день со мной, составляет 1/365. Таким образом, с вероятностью 364/365 можно утверждать, что дни рождения с кем-то другим у нас не совпадают. Если в комнате находится n человек, то с вероятностью 364/365 каждый n-1 из них появился на свет в другой день, чем я. Поэтому вероятность того, что все n-1 человек родились в другой день, чем я, составляет 364/365 x 364/365 x 364/365... x 364/365, т.е. 364/365, перемноженные n-1 раз. При n = 23 получаем 0,94.

Поскольку это вероятность того, что никто из находящихся в комнате не родился со мной в один день, то вероятность, что у одного из них день рождения все же совпадает с моим, составляет всего 1 - 0,94. (Это следует из предположения, что либо у кого-то день рождения совпадает с моим, либо никто не родился в один день со мной, поэтому сумма вероятностей таких двух событий должна равняться 1.) Итак, получаем: 1 - 0,94 = 0,06. А это очень маленькая величина.

Однако такой подход в данном случае не годится, поскольку возможность того, что чья-то дата появления на свет совпадает с вашей, — это вовсе не тот вопрос, на который мы ищем ответ. Я говорил о вероятности совпадения дней рождения любых двух людей, находящихся в одной комнате. При этом есть шанс, что у кого-то день рождения совпадает с вашим, а может быть, он совпадает у двух или более людей, но отличается от вашего.

Здесь и вступает в действие закон сочетаний. Число человек, которые могли бы родиться в один день с вами, равно n-1, а возможное число пар людей в комнате составляет n x (n-1)/2. С ростом п число пар быстро увеличивается. При n = 23 оно равно 253, что более чем в десять раз превышает n-1 = 22. Таким образом, если в комнате находится 23 человека, то в ней насчитывается 253 возможных пары, но только 22 из них включают вас.

Оценим теперь возможность того, что ни у кого из 23 человек даты появления на свет не совпадают. Для двух человек вероятность несовпадения составляет 364/365. Тогда шанс того, что эта пара и еще один, третий, человек родились в разные дни, равен 364/365 x 363/365. Подобным же образом, вероятность для трех и еще одного, четвертого, человека составляет 364/365 x 363/365 x 362/365. Продолжая в том же духе, получаем вероятность несовпадения дней рождения для всех 23 человек: 364/365 x 363/365 x 362/365 x 361/365... x 343/365.

А это равно 0,49. Поскольку вероятность несовпадения дат появления на свет всех 23 человек равна 0,49, вероятность, что кто-то из них родился в один день с другим, составляет 1 - 0,49, или 0,51, а это больше, чем 50%.

Игра в лотерею

В качестве еще одного примера того, как на первый взгляд невероятное событие оказывается вполне реальным, рассмотрим лотерею. 6 сентября 2009 г. в розыгрыше национальной лотереи Болгарии случайным образом выпали следующие числа: 4, 15, 23, 24, 35, 42. В них нет ничего особенного. Правда, цифры, которые их составляют, лежат в пределах интервала от 1 до 5, — но и в этом нет ничего необычного. Далее, среди них есть два соседних числа, 23 и 24, но такое случается гораздо чаще, чем кажется на первый взгляд (если вы попросите людей на улице назвать наобум шесть чисел от 1 до 49, то последовательные пары они выберут реже, чем это сделает «чистый случай»).

Удивительное произошло четырьмя днями позже: 10 сентября в ходе следующего тиража лотереи Болгарии счастливыми оказались числа 4, 15, 23, 24, 35, 42 — ровно те же самые, что и на предыдущей неделе. Это событие вызвало настоящую бурю в средствах массовой информации. «Такое случается впервые за 52-летнюю историю проведения лотереи. Мы потрясены, но совпадение произошло!» Эти слова официального представителя лотереи были опубликованы 18 сентября в изданиях информационного агентства «Рейтер». Свилен Нейков (Svilen Neikov), занимавший в то время пост министра спорта Болгарии, назначил расследование по поводу этого инцидента, которое показало, что никакого мошенничества не было.

Это редчайшее совпадение было просто еще одним примером вмешательства принципа невероятности. В чем тут дело? Во-первых, по всему миру ежегодно разыгрывается огромное количество лотерей. Во-вторых, они проводятся регулярно из года в год. Это значительно повышает вероятность повторения набора выигрышных чисел. И, в-третьих, вступает в силу закон сочетаний: каждый раз при розыгрыше результат может совпасть с любым из предыдущих. В итоге, так же как и с парадоксом дней рождения, при большом числе розыгрышей, n x (n-1)/2 пар результатов (где n— большое число) будут состоять из одинаковых наборов чисел.

Национальная лотерея Болгарии, в которой в 2009 г. произошел повтор выигрышных чисел, проводится по схеме «6 из 49», поэтому вероятность выпадения определенного набора из шести чисел составляет 1 к 13983816. Это означает, что результаты любых двух розыгрышей лотереи совпадут в одном случае из 13983816. А какова вероятность, что совпадут два результата розыгрышей из трех? Или два результата из 50?

Из трех результатов розыгрышей можно составить лишь три пары, а из 50 — уже 1225. Здесь вступает в действие закон сочетаний. Если мы пойдем дальше, то увидим, что из 1000 результатов розыгрышей можно составить 499500 пар. Другими словами, если пошагово умножать число результатов розыгрышей на 20, от 50 до 1000, то число пар будет увеличиваться каждый раз почти в 408 раз и возрастет с 1255 до 499500. А это очень большое число.

Сколько же тиражей необходимо провести, чтобы вероятность повторения шести одинаковых выигрышных чисел превысила 50% — т.е. чтобы это событие скорее произошло, чем нет? Используя те же рассуждения, что и в случае парадокса дней рождения, получаем 4404.

Если каждую неделю проводятся два розыгрыша, а значит за год— 104, то на проведение необходимого числа розыгрышей лотереи потребуется менее 43 лет. Следовательно, через 43 года с большей вероятностью произойдет повторение ранее полученных наборов из шести выигрышных чисел, чем не произойдет. А это придает совсем другой вес комментарию официального представителя лотереи Болгарии, в котором говорилось, что имело место невероятное совпадение.

До сих пор мы рассматривали лишь одну отдельную лотерею. Если взять статистику для большого числа лотерей по всему миру, покажется странным, если результаты розыгрышей не повторятся случайным образом. Теперь нас не должен удивлять тот факт, что 16 октября 2010 г. в тираже национальной лотереи Израиля под названием «Мифаль ха-Паис» выпали числа 13, 14, 26, 32, 33 и 36 — ровно те же, которые оказались счастливыми несколькими неделями ранее, а именно 21 сентября. Мы-то относимся к этому событию спокойно, но если бы вы знали, сколько людей позвонили на израильское радио во время дискуссионных программ, выражая свое негодование по поводу подтасовки результатов лотереи!

Результат болгарской лотереи был необычен повторением набора выигрышных чисел в двух следующих друг за другом тиражах. Но учитывая закон больших чисел в совокупности с тем фактом, что в проводимых по всему миру лотереях постоянно выпадают какие-то выигрышные числа, удивляться особенно нечему; к тому же подобное случалось и раньше. Например, в проводимой в Северной Каролине лотерее Cash 5 результаты розыгрышей в точности совпали 9 и 11 июля 2007 г.

Другой, весьма курьезный, пример действия закона сочетаний иллюстрирует история, произошедшая с некоей Морин Уилкокс (Maureen Wilcox) в 1980 г. Она приобрела билеты Массачусетсской государственной лотереи и лотереи, проводимой в Род-Айленде, оба из которых содержали выигрышные номера. Но вот несчастье: в билете лотереи Массачусетса значились счастливые цифры лотереи Род-Айленда, и наоборот. При покупке билетов десяти разных лотерей вы получаете десять шансов на выигрыш. Но из десяти билетов можно составить 45 пар, поэтому вероятность, что один из десяти билетов совпадет с одним из десяти наборов выигрышных чисел, более чем в четыре раза превышает ваш шанс выиграть в лотерее. Конечно, это вовсе не означает, что, покупая билеты множества разных лотерей, вы непременно разбогатеете, потому что совпадение номеров билета одной лотереи со счастливыми номерами другой не дает вам ничего, кроме повода удивиться, что такие чудеса случаются.

Закон сочетаний применяется при анализе ситуаций, когда имеется множество взаимодействующих людей или объектов. Представим себе группу из 30 студентов. Они могут взаимодействовать друг с другом самыми разными способами. Каждый из них может вести себя как независимая личность: таких личностей в группе 30. Они могут работать парами — в группе из 30 человек можно составить 435 разных пар: они могут действовать по трое — тогда в группе могут образоваться 4060 различных троек; и так далее, до ситуации, когда все работают как единый слаженный коллектив, — и такой коллектив, состоящий из 30 студентов, лишь один.

В итоге из наших студентов можно составить 1073741823 различные группы. Это более миллиарда — и всего из 30 человек! В общем случае из множества, состоящего из n элементов, можно образовать 2 в степени n - 1 подмножеств. Если n = 100, то таких подмножеств будет 2 в степени 100 - 1. что примерно равно 10 в степени 30. Действительно огромное число!

Если и оно кажется вам недостаточно большим, обратитесь к Всемирной паутине, насчитывающей около 2,5 млрд пользователей, каждый из которых может взаимодействовать с любым другим. В таком случае мы получаем 3 х 10 в степени 18 пар или 10 в степени 750000000 различных групп связанных друг с другом пользователей. Итак, событие, вероятность которого очень мала, почти наверняка произойдет, если ему предоставить достаточное количество возможностей случиться.

В следующий раз, когда вы столкнетесь со случайным на первый взгляд совпадением, вспомните о принципе невероятности.

(с) Дэвид Хэнд