Я решил в каком-то смысле начать всё сначала. Теперь у меня в голове сложилось нечто вроде «курса лекций» по статистике для трейдеров/инвесторов. Курса достаточно полного и в тоже время простого.
Начнем, пожалуй, с того, что перечислим базовые понятия, без которых ну совсем никак. Это следующие понятия: среднее (мат. ожидание), дисперсия и стандартное отклонение, ковариация и корреляция. Из этих вот простых кирпичиков и построено внушительное здание современной статистики…
СРЕДНЕЕ И ДОХОДНОСТЬ
Давайте задумаемся, что собственно такое среднее? Обычно в этот термин вкладывают смысл наиболее вероятного, ожидаемого значения (особенно это хорошо фиксируется в термине «мат. ожидание»). Это в целом верно, но только с некоторыми оговорками. Среднее имеет смысл наиболее ожидаемого значения для распределений с одной вершиной (типа нормального распределения). Можно, напр., представить себе распределение с двумя вершинами (вроде «рельефа» женских грудей ), тогда среднее будет в этом случае не самым вероятным, а наоборот наименее вероятным значением (оно будет находиться во «впадинке» между «грудями»). Это произойдет потому, что у распределения две вершины, а среднее по своей сути - мера центральной тенденции, т.е. оно всегда стремится к центру распределения. Однако большинство распределений в финансовом анализе имеют одну вершину, поэтому для нас среднее - очень хорошая мера центральной тенденции, поскольку одновременно оно задает ещё и наиболее вероятное значение случайной величины.
Какой смысл имеет среднее в финансовом анализе? Как правило, среднее отождествляется с таким важнейшим показателем актива как его доходность. Доходность обычно вычисляется по такой формуле:
R = (Pt-1 - Pt)/Pt = (Pt-1/Pt) - 1. (1)
Обе формы записи совершенно эквивалентны. Pt - значение цены актива в момент времени t, R - от англ. return - «доход», «доходность».
Если умножить «выход» формулы на 100, то получим доходность в процентах, т.е. процентный прирост цены актива.
Довольно часто в литературе можно также найти другую формулу для доходности:
R = ln(Pt-1/Pt), (2)
где ln - натуральный логарифм. Результат получается примерно, как и в первой формуле, так что какую использовать – дело вкуса (мне лично нравится обычная формула (1) без логарифма).
Если взять ряд цен некоторого актива и применить к нему формулу (1), то мы получим ряд доходностей актива. Стоит остановить внимание на понимании формулы доходности. Почему, напр., нельзя использовать просто ценовые приращения, т.е.:
R = Pt-1 – Pt? (3)
Здесь различие определяется способом торговли. При маржинальной торговле, как, напр., на ФОРЕКСе, доходность действительно определяется только ценовым приращением, поскольку мы не вкладываем реальные средства в какие-то активы, а торгуем стандартными лотами при таком-то плече. Если же мы реально покупаем какие-то активы (акции, валюты и т.п.) то формула (3) не годится по следующей причине. Объясню на примере. Допустим акция А стоит 20 р. и в среднем растёт на 1 р. (для нас сейчас неважно в день, неделю или месяц), акция B стоит 100 р. и также растёт на 1 р. По формуле (3) обе акции имеют одинаковую доходность. И при маржинальной торговле это действительно так. Но если мы реально покупаем эти акции, то получается, что купив акцию А всего за 20 р. мы имеем доход в 1 р., а купив акцию B за целых 100 р. мы имеем такой же доход. Очевидно, что доходность акции А больше, поскольку она требует меньших вложений при одинаковой прибыли. Формула (1) учитывает этот факт, поэтому при реальном инвестировании доходности следует определять по (1). Тогда по (1) доходность акции А будет: (1 р./20 р.)*100% = 5%, акции B: (1 р./100 р.)*100% = 1%. Мы видим, что доходность А гораздо выше.
Есть и ещё одна причина, по которой формула (1) может быть предпочтительнее (3). Дело в том, что волатильность зависит от уровня цен: чем выше цены, тем больше и волатильность. Очень простой пример: допустим есть два некоторых товара - товар А и товар B. Средняя рыночная цена А - 10 р., B - 100 р. Тогда вполне естественным будет, если мы найдем разброс цен для А, скажем, в плюс-минус 2 р., а для B - в плюс-минус 10 р. Точно так же обстоит ситуация и со многими финансовыми активами. За время своей эволюции цена некоторой акции может вырасти в несколько раз, соответственно будет расти и волатильность. Поэтому ряд доходностей, вычисленный по формуле (3):
R = Pt-1 - Pt
будет нестационарным, а это весьма нежелательно по ряду техническим математических причин (о чем мы ещё будем говорить далее…).
Однако если воспользоваться формулой (1):
R = (Pt-1 - Pt)/Pt,
то ряд доходностей уже будет стационарным, поскольку теперь приращения цены не абсолютные как по (3), а относительные - об этом заботится знаменатель формулы (1) - /Pt.
Кстати, явление роста волатильности с ростом цен в определенной мере наблюдается и на ФОРЕКСе, если цена за какую-то пару в процессе её эволюции увеличится на несколько фигур (напр., на 1000 пт., - понятно, что это происходит не за день и даже не за месяц), то и волатильность выраженная по формуле (3) также вполне может подняться на 10 - 20 пт. Однако наиболее ярко эти эффекты выражены в ценовых рядах акций.
Завершая рассмотрение этого вопроса, подытожу: если мы хотим строить какие-то прогностические модели для предсказания будущих доходностей, то лучше доходности вычислять по формуле (1), чтобы обезопасить себя от возможной нестационарности временного ряда, которая может возникнуть при использовании формулы (3).
Вернемся вновь собственно к среднему. Итак, мы изучили разные подходы к определению доходности. В итоге от ряда самих цен мы перешли к ряду доходностей актива. Ясно, что доходность – величина не постоянная. Однако в финансовых временных рядах, как правило, присутствует некоторый тренд (к вопросу о том, что это такое с т.з. теории временных рядов и какие тренды бывают, мы ещё вернемся). Поэтому правомерным бывает усреднение индивидуальных значений доходности. Таким образом, среднее значение выступает как некая обобщенная характеристика доходности.
В завершение рассмотрения среднего – немного математики. Для начала поговорим об обозначениях. Мы будем использовать следующие обозначения для среднего значения доходности некоторого фин. инструмента I:
E(I) = M(I) = mean(I).
mean(I) по мимо всего прочего, ещё и является функцией MATLAB для вычисления среднего. Далее мы всегда будем приводить полезные функции MATLAB.
Общеизвестную формулу для расчета среднего приводить не буду. Приведу другую формулу, которую, быть может, не все знают. Иногда бывает, что известны вероятности некоторых событий. Тогда среднее можно вычислить по такой формуле:
E = A*P(A) + B*P(B) + … + N*P(N). (4)
Вообще на самом деле формула (4) в статистике считается основной, а все остальные – производными от неё. Напр., Р. Винс в своей книге об управлении капиталом приводит пример такого «фин. инструмента»: с вероятностью 0.5 вы теряете 1 USD и с вероятностью 0.5 выигрываете 2 USD. Формула (4) позволяет вычислить среднее и в таком случае, когда нет какого-то явного ряда доходностей.
По (4) получаем: 2*0.5 – 1*0.5 = 0.5 USD.
На этом пока всё. Следующий выпуск будет посвящён дисперсии, стандартному отклонению и риску!