Math Ajax

суббота, 9 января 2016 г.

Фишка споров о шансах, или нормативная теория пари на деньги

Every day there'd be a half dozen bets around about anything — elections and sports. Dollar bills were changing hands all the time. It was part of the ingrained way of life. You really believed this stuff.
Robert Schlaifer (цитируется по книге Theory that Would not Die)
Otherwise, to a Bayesian, you are not really being rational. If after we have our little chat, you still think your forecast is better than mine, you should be happy to bet on it, since you stand to make money. If you don’t, you should have taken my forecast and adopted it as your own.
Nate Silver, The Signal and The Noise

(note: это немного причёсанный текст моего старого выступления на московском lesswrong-митапе в июле 2014 года. Есть видео, но оно не совсем полное)

Шансы и вероятности. 

Все байесианцы делятся на две категории. Первая считает, что в теорему Байеса нужно подставлять три числа, а вторая — что два числа. Соответственно, первая крестится двумя перстами, а вторая — тремя.

Дело в том, что есть две формы теоремы Байеса: традиционная форма преобразует априорную вероятность в апостериорную вероятность, а альтернативная преобразует априорные шансы в апостериорные шансы.

Я не буду подробно останавливаться на этих двух формах, поскольку всё, что я сказал до этого, было просто риторическим приёмом, предназначенным для того, чтобы красиво ввернуть то, что бывают вероятности, а бывают шансы.

Шансы — это альтернативный вид вероятностей.

Если вероятность чего-то X, то шансы того же будут X/(1-X). Можно говорить, что шансы "X к 1-X за что-то" или "1-X к X против чего-то".

По шансам тоже можно восстановить вероятность; поэтому никакой информации при таких преобразованиях не теряется.

Например, вероятность того, что монета выпадет решкой — одна вторая, или 0,5. Шансы того же самого — одна вторая к одной второй (то есть 0,5 : 0,5), а это то же самое, что один к одному (то есть 1 : 1), или просто 1.

Шансы не обязаны в сумме давать единицу. Сумма шансов вообще никому ничего не обязана, и складывать шансы довольно бесмысленно[1].

Шансы известны тем, что их постоянно неправильно понимают журналисты, они удобнее математически, они используются в машинном обучении [логистическая регрессия, например] и букмекерских конторах. Кроме того, посредством логарифма шансов хорошо обьяснять провалы калибровки.

Ещё примеры шансов

Рассмотрим, например, игральный кубик. Вероятность того, что он выпадет единицей — одна шестая (нам нужен один исход, а всего их шесть). Шансы того, что он выпадет единицей — один к пяти (на каждый благоприятный исход приходится пять неблагоприятных). Или, в десятичных дробях, это будет примерно 0,1667 и 0,2 соответственно.

Вероятность того, что кубик выпадет НЕ единицей — пять шестых, или 0,8333. Шансы того же самого — пять к одному, или просто 5.

Вероятности находятся на отрезке $[0; 1]$, а шансы находятся на луче $[0; +\infty)$. При этом единичной вероятности соответствуют бесконечные шансы, и поэтому я испытываю непреодолимое желание объять необъятное и, заключив бесконечность в квадратные скобки, заявить, что шансы находятся на отрезке $[0; +\infty]$.

Байесляндия и "всем выгодно!".

Споры на шоколадку.

Часть первая, в которой мы узнаем, при чём тут букмекерские конторы.

Возьмём классический спор на шоколадку. Допустим, я согласился поспорить на  шоколадку. Это означает, что я счёл пари один к одному выгодным. Это  означает, что с моей точки зрения вероятность моей правоты больше 50 %.

Очень важная идея состоит в том, что спорить можно не только один к одному. Например, можно поставить один арбуз против двух арбузов. Или двести рублей против пятидесяти рублей.

Как понять, выгоден ли тебе какой-нибудь спор?

Пусть, например, это спор A:B касательно X. То есть ты ставишь A бутылок шотландского виски, надеясь заработать B бутылок шотландского виски. Твоя настоящая вероятность — $P(X) = p$, и если преобразовать её в шансы, то выйдет $O(X) = \frac{p}{1-p}$. Нужно просто сравнить $O(X)$ с $A/B$: если ваши шансы больше, то спор выгоден, иначе нет.

Это правило не очень легко запомнить, поэтому удобно просто восстанавливать его по примеру.

Например, я на 66% уверен в том, что завтра не будет дождя. Это означает, что мои шансы дождя — 0.33/0.66 = 1/2 = 0.5, и спор 1 к 1 — с соотношением ставок 1 — будет невыгоден (мне только что предложили надеяться на то, что завтра будет дождь, но я же знаю, что дождя не будет, и что, я дурак что ли какой-то на такое соглашаться?), но если поменять сторону спора — тогда мои шансы будут 2 — то мне станет уже выгодно спорить на шоколадку.

На практике такие предложения обычно заканчиваются тем, что слова людей начинают расходиться с делом. Что-то такое:

— Просто позвони Васе.
— Неа, я не буду, он уже спит и не будет рад меня видеть.
— Он не ложится в это время и всегда рад помочь людям.
— Ммммм... Нет, я думаю, что он лёг. Лучше завтра.
— Ставлю двести рублей против твоих пятидесяти на то, что он не лёг.
— Ладно, ладно, я позвоню.
— Эй, а где мои деньги?!

И ты испытываешь смешанные чувства. С одной стороны, ты очень легко переубедил собеседника, и это хорошо. С другой стороны, денег ты не получил, и это обидно.

Байесляндия

Часть вторая, в которой мы узнаем, как такое должно было происходить по-хорошему.

Нэйт Сильвер приводит замечательную метафору. Есть далёкая страна Байесляндия, жители которой, как принято по обычаю, носят на себе таблички примерно такого вида:
ВРАГ ВОЛШЕБНИКОВ СКРЫВАЕТСЯ В АВСТРАЛИИ 5 %
В ЭТОЙ ДЕРЕВНЕ ЕСТЬ ХОТЯ БЫ ОДИН КУЗНЕЦ 70 %
НЕЛЬЗЯ СЪЕСТЬ ПАЧКУ ПЕЧЕНЬЯ "ЮБИЛЕЙНОЕ" ЗА ДЕСЯТЬ МИНУТ НЕ ЗАПИВАЯ 95 %
ЖИЗНЬ НА МАРСЕ 2 %
СТРОИТЕЛЬСТВО ЭТОГО МОСТА ЗАТЯНЕТСЯ ДО СЛЕДУЮЩЕЙ ВЕСНЫ 90 %

Если два жителя с разными вероятностями встречают друг друга, то по закону Байесляндии они должны либо прийти к соглашению, — то есть обсудить все свои аргументы "за" и "против", и сойтись на одинаковых числах — либо заключить пари.

Например, если этот человек встретит человека, считающего, что съесть пачку Юбилейного — затея ерундовая, и даже после объяснений про то, что печенье очень сухое и его невозможно проглотить, считающего, что вероятность успеха — 20 %, то первый поставит 90 своих долларов против 10 долларов собеседника на то, что пачку печенья съесть невозможно, и оба будут довольными.

(почему  $90 \$$ против $10 \$$? Потому что шансы на "съесть нельзя" первого — 95/5 = 19, а второго — 80/20 = 4. Для того, чтобы найти соотношение ставок, которое выгодно обоим игрокам, нужно взять любое число посередине между 4 и 19. Например, 9 вполне годится.

Осталось только выбрать между "$9 \$$ к $1 \$$", "$90 \$$ к $10 \$$" и "$900 \$$ к $100 \$$". [2])

С точки зрения первого, он только что выиграл условные $0.95\cdot 10 \$ - 0.05\cdot 90 \$ = 5$ долларов. Он может проиграть 90 долларов, но этого скорее всего не случится; а 10 долларов на дороге не валяются. Вероятность неуспеха исчезающе мала, и поэтому пари выгодно.

С точки зрения второго, он только что выиграл условные $0.20\cdot 90 \$ - 0.80 \cdot 10 \$ = 10$ долларов. Да,  скорее всего, он проиграет 10 долларов, но ведь он может выиграть 90:  рискнуть 10, чтобы получить 90 с вероятностью 20% — отнюдь не самое худшее из возможных вложений. Если он будет руководствоваться этой стратегией и дальше, то в среднем он будет зарабатывать 10 долларов на каждом таком пари.

И после этого, разумеется, второй всё-таки пытается съесть пачку печенья "Юбилейное", страшно огребает и в итоге проигрывает 10 долларов.

Здесь важно понять, что дело было не в том, что один верил в прожорливость человека, а другой нет: они оба считали, что пачку печенья съесть скорее нельзя. Дело в том, что один верил в слабость прожорливости недостаточно сильно. Различия были не качественными, а количественными.

И да, количественные различия тоже важны. Вещи не делятся на абсолютно чёрные  и сверкающе белые: мир состоит из оттенков серого, и трудно быть искателем истины, не умея их различать.

------------
[1] На самом деле, иногда складывать шансы полезно: есть Odds Algorithm, но это уже оффтоп.

[2] Более изощрённый и/или изысканный подход изложен здесь.

Комментариев нет:

Отправить комментарий