КРИТЕРИЙ КЕЛЛИ В БЛЭК ДЖЕКЕ, ТОТАЛИЗАТОРЕ И НА РЫНКЕ АКЦИЙ THE KELLY CRITERION IN BLACKJACK, SPORTS BETTING, AND THE STOCK MARKET Edward O. Thorp Введение Центральная проблема для игроков состоит в том, чтобы найти ставки положительного ожидания. Но игрок также должен знать, как управлять своими деньгами, то есть на какую сумму держать пари. На рынке акций (и в целом на рынке ценных бумаг) проблема похожа, но более сложна. Игрок, который теперь зовется "инвестор", ищет "большую отдачу при управляемом риске". Для этих целей мы исследуем использование критерия Келли, который должен максимизировать ожидаемую величину логарифма благосостояния ("максимизировать ожидаемую логарифмическую полезность"). Критерий известен экономистам и финансовым теоретикам по названиям типа "стратегии геометрической средней максимизации портфеля", максимизации логарифмической полезности, стратегии оптимального роста, критерия роста капитала, и т.д. Автор приводит практическое применение критерия Келли, используя его для карточных игр, типа блэк джек. Мы представим некоторые полезные формулы и методы, позволяющие ответить на различные естественные вопросы об этом, которые возникают в блэк джеке и других играх на деньги. Затем мы проиллюстрируем его недавнее использование в успешной системе спортивных пари казино. Наконец, мы обсудим его применение на рынке ценных бумаг, где он помог автору сделать за тридцать лет "ставок" на общую сумму 80 миллиардов долларов. Пересмотрено 29 мая 1998 года
1 Введение Фундаментальная проблема в азартных играх состоит в том, чтобы найти возможности сделать ставку с положительным ожиданием. Аналогичная проблема в инвестировании заключается в том, чтобы найти сделку с хорошо отрегулированным риском и достаточной ожидаемой отдачей. Как только такие благоприятные возможности идентифицированы, игрок или инвестор должен решить, какую часть своего капитала поставить на кон (вложить). Именно эту проблему мы здесь рассматриваем. Интерес к ней существует по крайней мере с восемнадцатого столетия, с обсуждения Дэниелом Бернулли санкт-петербургского парадокса (Feller, 1966). Один подход состоит в том, чтобы поставить целью минимизировать вероятность потерять все в пределах определенного числа попыток, N. Другой пример должен был бы максимизировать вероятность достижения установленной цели за N попыток (Браун, 1996). Иной подход, хорошо изученный экономистами и не только, состоит в том, чтобы оценить деньги, используя функцию полезности. Она определяется для всех неотрицательных реальных чисел, продлевая величины реальных чисел и не снижая (большее количество денег по крайней мере столь же хорошо как меньшее количество денег). Некоторые примеры - U(x) = xα, 0 ≤ α < ∞ и U(x) = log x, где log означает loge, а log 0 = -∞. Как только функция полезности определена, цель состоит в том, чтобы максимизировать ожидаемую величину полезности капитала. Дэниел Берноулли использовал функцию полезности log x, чтобы "решить" C-Петербургский Парадокс, (Но его решение не устраняет парадокс, потому что каждая функция полезности, которая не ограничена сверху, включая log, имеет измененную версию санкт-петербургского Парадокса.) функция полезности log x была вновь открыта J.L Kelly (1956), показавшим, что она имеет некоторые замечательные свойства. Они были изучены и обобщены в исследовании Brieman (1961). Markowitz (1961) применяет ее к ценным бумагам. Для обсуждения критерия Kelly ("критерий среднего геометрического") с точки зрения финансов, см. McEnally (1986), Он также приводится в приложениях и ссылках. Меня со статьей Kelly познакомил Клод Шаннон в Массачучетском Технологическом (M.I.T,) в 1960, вскоре после того, как я создал математическую теорию расчета карт для блэк джека. Критерий Келли был ставкой для каждой попытки, с целью максимизировать E log X, ожидаемую величину логарифма (случайная переменная) капитала X. Я использовал его в реальной игре и представил это сообществу игроков в первом издании "Beat the Dealer", Thorp, (1962) Если все ставки блэк джека имеют положительное ожидание и независимый результат, ставки Келли, при игре на одну руку, будут чрезвычайно просты: ставьте долю вашего текущего капитала, равную вашему ожиданию. На практике это несколько меняется (в целом к низу) из-за необходимости делать некоторое отрицательное ожидание "ждущими ставками", при более высоких колебаниях, возникающих из-за выплат, больших, чем один к одному, и когда за столом больше одной руки одновременно. Вот свойства, которые сделали критерий Келли столь привлекательным. Для простоты понимания мы проиллюстрируем его на примере самого простого случая, броска монеты, но концепция и выводы применимы и в более сложных обстоятельствах.
2 Подбрасывание монеты Вообразите, что мы столкнулись с бесконечно богатым противником, кто будет делать равные ставки на броски монеты. Далее, предположите, что при каждом броске наша вероятность победы p> 1/2, а вероятность потери q = 1 - p. Наш начальный капитал - XO. Предположим, что мы выбираем цель максимизирования ожидаемой величины E (XN) через n попыток. Сколько мы поставим, BK, на k-ой попытке? Пусть TK = 1, если k-я попытка - выигрышная и TK =-1, если она проиграна, тогда XK -XK-1 + TKBK для k = 1,2,3.., и XN = XO + ΣNK=1TKBK. Тогда
 Так как игра имеет положительное ожидание, то есть p-q> 0 в этой ситуации равных выплат, то, чтобы максимизировать Е(Хл) мы хотели бы максимизировать E (BK) для каждой попытки). Таким образом, чтобы максимизировать ожидаемый рост мы должны ставить все наши ресурсы в каждой попытке. Таким образом B1 = X0 и, если мы выигрываем первую ставку, B2 = 2X0, и т.д. Однако, вероятность краха 1 - pN и при p < 1, lim n-∞ [1 —рn] = 1 , так что крах почти неизбежен. Таким образом, "смелый" критерий ставок для максимизвции ожидаемого роста обычно нежелателен. Аналогично, если мы играем, чтобы минимизировать вероятность возможного краха (а "крах" происходит, если XK = 0 на k-ом результате) известная формула краха игрока по Feller (1966) показывает, что мы минимизируем крах, делая минимальную ставку n на каждой попытке, но это, к сожалению, также минимизирует и ожидаемый рост. Таким образом, "робкая" ставка также непривлекательна. Предлагается промежуточная стратегия, которая лежит где-то между максимизированием E (XN) (и верным крахом) и уменьшением вероятности краха (и уменьшением E (Хп)). Асимптотически оптимальная стратегия была впервые предложена J.L. Kelly (1956). В описанной игре с монетой, так как вероятности и выплаты при каждой ставке одинаковы, кажется правдоподобным, что "оптимальная" стратегия потребует всегда держать пари на одну и ту же долю f вашего капитала. Чтобы сделать это возможным, мы примем, что капитал может бесконечно дробиться. Это предположение обычно не имеет большого значения в практическом применении. Если мы делаем ставки согласно Bi = fXi-1, где 0 ≤ f ≤ 1, это иногда называется "фиксированной долей" ставки, где S и F - числа успехов и поражений соответственно, в n попыток, тогда наш капитал после n попыток равен Xn = Xo(l + f)S (1- f)F, где S + F = n. При f в интервале 0 < f < 1, Рг (ХN = 0) = 0, Таким образом, "краха" в техническом смысле проблемы краха игрока, произойти не может. "Краху" будут впредь давать иное толкование, чтобы пояснить, что для произвольно маленького положительного ε, limn→∞[Рг(Xn ≤ ε)] = 1. Даже в этом смысле, как мы увидим, крах все-таки может случиться при некоторых обстоятельствах. Мы обращаем внимание, что так как  количество
 измеряет экспоненциальную скорость роста за попытку. Келли хотел максимизировать ожидаемую величину коэффициента скорости роста, гg{f}, где  Обратите внимание что g(f) = (1/n)E(logXn) - (1/n)logX0 , так для фиксированного n, максимизация g(f) - то же самое, чток максимизирование g(f) в обсуждении ниже. Посмотрите  когда f = f* = P - q. Теперь  Так, что g' (f) строго монотонно уменьшается на [0, 1), Также g' (0) = p-q > 0 и limf→1 - g' (f) = - ∞. Поэтому bp=pf непрерывностb g ' (f), .g (f) имеет уникальный максимум в f = f *, где g (f *} = p log p + q log q + log 2 > 0 Кроме того, g(0) = 0 и limf→1 - g{f) = - ∞, так что 'nj - уникальное число fC > 0, где 0 < f* < fC < 1, так как g(fC ) = 0. Природа функции g(f) теперь очевидна, и график g(f) против f выглядит, как показано на рисунке 1. Следующая теорема пересчитывает важные преимущества максимизирования g(f). Детали здесь опущены, но доказательства (i), (ii), (iii), и (vi) для простого двучленного случая могут быть найдены в Thorp (1969); больше общих доказательств этого, а также (iv) и (v) можно найти у Breiman (1961). Теорема 1 (i) Если g(f) > 0, то limn→∞ <Хn = ∞ почти наверное, то есть для каждого М, Pr [lim infn→∞<Хn > М] = 1; (ii) если g(f) < 0, то limn→∞ <Хn = 0 почти наверное, то есть для каждого ε > 0, Pr [lim supn→∞ <Хn < ε] = 1; (iii) Если g(f) = 0, то lim supn→∞ <Хn= ∞ почти наверное, и lim infn→∞ <Хn = 0 почти наверное. (iv) Учитывая стратегию <Ф *, которая максимизирует E log Xn и любую другую "существенно иную " <стратегию Ф (не обязательно стратегию фиксированных дробных ставок), то limn→∞ <Хn(<Ф*)/<Хn (<Ф) = ∞ почти наверное. (v) Ожидаемое время, необходимое чтобы текущий капитал XN достиг заранее установленной предписанной цели <С, будет, асимптотически, меньше при стратегии, которая максимизирует E log XN . (vi) Предположим, что отдача от одной ставки на i-той попытке - биноминальная случайная переменная Ui; далее предположим, что вероятность успеха - p, где 1/2 < pi < 1. Тогда E log XN максимизируется выбором при каждой попытке доли f*i = pi - qi которая максимизирует E log (1+fiUi). Часть (i) показывает что, если бы не конечное время, благосостояние игрока XN превысило бы любой установленный предел М, когда f выбрано в интервале (0, fC). Но, если f> fC , часть (ii) показывает, что крах почти неизбежен. Часть (iii) демонстрирует, что, если f = fC, Хn будет (почти наверное) беспорядочно колебаться между 0 и + ∞, Таким образом, утверждение одного из авторов, что Xn → X0 как n → ∞, когда f = fe, явно противоречит. частям (iv) и (v), показывающим, что стратегия Келли максимизирования E log XN является асимптотически оптимальной в соответствии с двумя важными критериями. "Существенно иная " стратегия - одна из таких, когда разница E ln XN* - E ln XN между стратегией Kelly и другой стратегией растет быстрее, чем стандартное отклонение ln XN* - ln XN , обеспечивая Р (ln XN* - ln XN > 0) → 1. Часть (vi) устанавливает законность использования Kelly метода выбора fЯ* при каждой попытке (даже если от одной попытки к следующей меняется вероятность) для максимизации E log XN. Пример 2.. 1 Игрок А играет против бесконечно богатого противника. Игрок выигрывает деньги при последовательных независимых бросках монеты с вероятностью победы p = .53 (без всякой связи). Игрок А имеет начальный капитал X0 , и капитал может бесконечно делиться. Применяя Теорему 1 (vi), f* = p - q = .53 - .47 = .06, Таким образом, в каждой игре он должен ставить 6 % текущего капитала, чтобы XN рос с максимальной скоростью и с нулевой вероятностью краха. Если Игрок постоянно ставит меньшую долю, чем 6 %, XN также будет расти до бесконечности, но медленнее. Если Игрок Л повторяет ставки долей большей, чем 6 %, но меньше fC, применяется то же самое. Решим уравнения g(f) = .53log (l +f) + .47log (l - f) = 0 в цифровой форме - fc = .11973¯. Так, если ставка больше чем примерно 12 %, то даже при том, что Игрок может временно наслаждаться быстрой скоростью победы, возможные колебания вниз непременно приведут величину XN к нулю. Вычисление дает коэффициент роста g (f *) = f ( .06) = .001801 так, что после n последовательных ставок log средней обеспенности Игрока А деньгами будет стремиться к .001801*n раз от стартового капитала. Установка .001801n = log 2, дает ожидаемое время около n = 385, чтобы удвоить капитал. Критерий Kelly может легко быть расширен на игры с неравными призами. Предположим, Игрок А выигрывает b единиц на каждую единицу ставки. Далее предположим, что на каждой попытке вероятность победы p> 0 и pb - q> 0, так что игра выгодна для Игрока А. Методы, подобные описанным, могут использоваться для максимизации  Аргументы, использованные в вычислении дают f* = (bp - q)/b, оптимальную долю текущего капитала, которая должна быть поставлена в каждой игре, чтобы максимизировать коэффициент роста g(f). Эта формула для f* появилась в Thorp (1984) и была предметом обсуждения в апреле 1997 в интернете на сайте Станфорда Вонга http://bj21.com . Одно из требований состояло в том, что можно по терять только ставку, так что не было причин рассматривать (простое) обобщение этой формулы для ситуации, когда единица ставки выигрывает b с вероятностью p> 0 и теряет a с вероятностью q. Тогда, если ожидание m ≡ bp - aq > 0, f* > 0 и f* = m/ab. Обобщение противостоит объективности. Можно покупать в кредит на финансовых рынках и терять гораздо больше ставки. Рассмотрите покупку товарного фьючерса или короткую продажу (когда потеря потенциально неограничена). См., например, Thorp и Kassouf (1967). Для педантов, которые настаивают, что эти выплаты не биноминальны, рассмотрите короткую продажу способом двоичных чисел. Этот способ описан у Брауна (1996). Критика, иногда звучащая в адрес стратегии Kelly - что капитал на самом деле не делится бесконечно. В реальном мире, ставки - умноженные минимальные единицы, типа 1 $ или .01 $. На рынках ценных бумаг минимальная единица может быть достижима всегда. С минимально позволенной ставке "крах" в обычном смысле возможен всегда. Не трудно показать, однако, (см. Thorp и Waiden, 1966) что, если минимальная позволенная ставка невелика относительно начального капитала игрока, то, вероятность краха в обычном смысле незначительна, а также, что теория, описанная здесь, имеет полезное применение.
© Edward O. Thorp Оригинал статьи (на английском) Перевод 2001 г. Investo.ru
|
Книги для трейдеров
|