20.09.2019

Определение математического ожидания и дисперсии случайной величины. Математическое ожидание случайной величины в математической теории. Математическое ожидание суммы случайных величин


Понятие математического ожидания можно рассмотреть на примере с бросанием игрального кубика. При каждом броске фиксируются выпавшие очки. Для их выражения используются натуральные значения в диапазоне 1 – 6.

После определенного количества бросков при помощи не сложных расчетов можно найти среднее арифметическое значение выпавших очков.

Также, как и выпадение любого из значений диапазона, эта величина будет случайной.

А если увеличить количество бросков в несколько раз? При больших количествах бросков среднее арифметическое значение очков будет приближаться к конкретному числу, получившему в теории вероятностей название математического ожидания.

Итак, под математическим ожиданием понимается среднее значение случайной величины. Данный показатель может представляться и в качестве взвешенной суммы значений вероятной величины.

Это понятие имеет несколько синонимов:

  • среднее значение;
  • средняя величина;
  • показатель центральной тенденции;
  • первый момент.

Иными словами, оно является ничем иным как числом вокруг которого распределяются значения случайной величины.

В различных сферах человеческой деятельности подходы к пониманию математического ожидания будут несколько отличаться.

Оно может рассматриваться как:

  • средняя выгода, полученная от принятия какого-то решения, в том случае, когда такое решение рассматривается с точки зрения теории больших чисел;
  • возможная сумма выигрыша либо проигрыша (теория азартных игр), рассчитанная в среднем для каждой из ставок. На сленге они звучат как «преимущество игрока» (позитивно для игрока) либо «преимущество казино» (негативно для игрока);
  • процент прибыли, полученной от выигрыша.

Матожидание не является обязательным для абсолютно всех случайных величин. Оно отсутствует для тех у которых наблюдается расхождение соответствующей суммы или интеграла.

Свойства математического ожидания

Как и любому статистическому параметру, математическому ожиданию присущи свойства:


Основные формулы для математического ожидания

Вычисление математического ожидания может выполняться как для случайных величин, характеризующихся как непрерывностью (формула А), так и дискретностью (формула Б):

  1. M(X)=∑i=1nxi⋅pi, где xi – значения случайной величины, pi – вероятности:
  2. M(X)=∫+∞−∞f(x)⋅xdx, где f(x) – заданная плотность вероятностей.

Примеры вычисления математического ожидания

Пример А.

Можно ли узнать средний рост гномов в сказке о Белоснежке. Известно, что каждый из 7 гномов имел определенный рост: 1,25; 0,98; 1,05; 0,71; 0,56; 0,95 и 0,81 м.

Алгоритм вычислений достаточно прост:

  • находим сумму всех значений показателя роста (случайная величина):
    1,25+0,98+1,05+0,71+0,56+0,95+ 0,81 = 6,31;
  • полученную сумму делим на количество гномов:
    6,31:7=0,90.

Таким образом, средний рост гномов в сказке равен 90 см. Иными словами таково математическое ожидание роста гномов.

Рабочая формула — М(х)=4 0,2+6 0,3+10 0,5=6

Практическая реализация математического ожидания

К вычислению статистического показателя математического ожидания прибегают в различных сферах практической деятельности. В первую очередь речь идет о коммерческой сфере. Ведь введение Гюйгенсом этого показателя связано с определением шансов, которые могут быть благоприятными, либо напротив неблагоприятными, для какого-то события.

Этот параметр широко применяется для оценки рисков, особенно если речь идет о финансовых вложениях.
Так, в предпринимательстве расчет математического ожидания выступает в качестве метода для оценивания риска при расчете цен.

Также данный показатель может использоваться при расчете эффективности проведения тех или иных мероприятий, например, по охране труда. Благодаря ему можно вычислить вероятность наступления события.

Еще одна сфера применения данного параметра – менеджмент. Также он может рассчитываться при контроле качества продукции. Например, при помощи мат. ожидания можно рассчитать возможное количество изготовления бракованных деталей.

Незаменимым мат.ожидание оказывается и при проведении статистической обработки полученных в ходе научных исследований результатов. Он позволяет рассчитать и вероятность проявления желательного либо нежелательного исхода эксперимента или исследования в зависимости от уровня достижения поставленной цели. Ведь ее достижение может ассоциироваться с выигрышем и выгодой, а ее не достижение – в качестве проигрыша либо убытка.

Использование математического ожидания на Форекс

Практическое применение данного статистического параметра возможно при проведении операций на валютном рынке. С его помощью можно осуществлять анализ успешности торговых сделок. При чем увеличение значения ожидания свидетельствует об увеличении их успешности.

Также важно помнить, что математическое ожидание не должно рассматриваться в качестве единственного статистического параметра используемого для анализа работы трейдера. Использование нескольких статистических параметров наряду со средним значением повышает точность проводимого анализа в разы.

Данный параметр хорошо зарекомендовал себя при мониторинговых наблюдениях за торговыми счетами. Благодаря ему выполняется быстрая оценка работ, осуществляемых на депозитном счете. В тех случаях, когда деятельность трейдера удачна и он избегает убытков, пользоваться исключительно расчетом математического ожидания не рекомендуется. В этих случаях не учитываются риски, что снижает эффективность анализа.

Проведенные исследования тактик трейдеров свидетельствуют о том, что:

  • наиболее эффективными оказываются тактики, базирующиеся на случайном входе;
  • наименее эффективны – тактики, базирующиеся на структурированных входах.

В достижении позитивных результатов не менее важны:

  • тактика управления капиталом;
  • стратегии выходов.

Используя такой показатель как математическое ожидание можно предположить каким будет прибыль либо убыток при вложении 1 доллара. Известно, что этот показатель, рассчитанный для всех игр, практикуемых в казино, в пользу заведения. Именно это позволяет зарабатывать деньги. В случае длинной серии игр вероятность потери денег клиентом существенно возрастает.

Игры профессиональных игроков ограничены небольшими временными промежутками, что увеличивает вероятность выигрыша и снижает риск проигрыша. Такая же закономерность наблюдается и при выполнении инвестиционных операций.

Инвестор может заработать значительную сумму при положительном ожидании и совершении большого количества сделок за небольшой временной промежуток.

Ожидание может рассматриваться как разница между произведением процента прибыли (PW) на среднюю прибыль (AW) и вероятность убытка (PL) на средний убыток (AL).

В качестве примера можно рассмотреть следующий: позиция – 12,5 тыс. долларов, портфель — 100 тыс. долларов, риск на депозит – 1%. Прибыльность сделок составляет 40% случаев при средней прибыли 20%. В случае убытка средние потери составляют 5%. Расчет математического ожидания для сделки дает значение в 625 долларов.

Математическим ожиданием дискретной случайной величины называют сумму произведений всех ее возможных значений на их вероятности.

Пусть случайная величина может принимать только значения вероятности которых соответственно равны Тогда математическое ожидание случайной величины определяется равенством

Если дискретная случайная величина принимает счетное множество возможных значений, то

Причем математическое ожидание существует, если ряд в правой части равенства сходится абсолютно.

Замечание. Из определения следует, что математическое ожидание дискретной случайной величины есть неслучайная (постоянная) величина.

Определение математического ожидания в общем случае

Определим математическое ожидание случайной величины, распределение которой не обязательно дискретно. Начнем со случая неотрицательных случайных величин. Идея будет заключаться в том, чтобы аппроксимировать такие случайные величины с помощью дискретных, для которых математическое ожидание уже определено, а математическое ожидание положить равным пределу математических ожиданий приближающих ее дискретных случайных величин. Кстати, это очень полезная общая идея, состоящая в том, что некоторая характеристика сначала определяется для простых объектов, а затем для более сложных объектов она определяется с помощью аппроксимации их более простыми.

Лемма 1. Пусть есть произвольная неотрицательная случайная величина. Тогда существует последовательность дискретных случайных величин, таких, что


Доказательство. Разобьем полуось на равные отрезки длины и определим

Тогда свойства 1 и 2 легко следуют из определения случайной величины, и

Лемма 2. Пусть -неотрицательная случайная величина и и две последовательности дискретных случайных величин, обладающих свойствами 1-3 из леммы 1. Тогда

Доказательство. Отметим, что для неотрицательных случайных величин мы допускаем

В силу свойства 3 легко видеть, что существует последовательность положительных чисел, такая что

Отсюда следует, что

Используя свойства математических ожиданий для дискретных случайных величин, получаем

Переходя к пределу при получаем утверждение леммы 2.

Определение 1. Пусть - неотрицательная случайная величина, -последовательность дискретных случайных величин, обладающих свойствами 1-3 из леммы 1. Математическим ожиданием случайной величины называется число

Лемма 2 гарантирует, что не зависит от выбора аппроксимирующей последовательности.

Пусть теперь - произвольная случайная величина. Определим

Из определения и легко следует, что

Определение 2. Математическим ожиданием произвольной случайной величины называется число

Если хотя бы одно из чисел в правой части этого равенства конечно.

Свойства математического ожидания

Свойство 1. Математическое ожидание постоянной величины равно самой постоянной:

Доказательство. Будем рассматривать постоянную как дискретную случайную величину, которая имеет одно возможное значение и принимает его с вероятностью следовательно,

Замечание 1. Определим произведение постоянной величины на дискретную случайную величину как дискретную случайную возможные значения которой равны произведениям постоянной на возможные значения; вероятности возможных значений равны вероятностям соответствующих возможных значений Например, если вероятность возможного значения равна то вероятность того, что величина примет значение также равна

Свойство 2. Постоянный множитель можно выносить за знак математического ожидания:

Доказательство. Пусть случайная величина задана законом распределения вероятностей:

Учитывая замечание 1, напишем закон распределения случайной величины

Замечание 2. Прежде, чем перейти к следующему свойству, укажем, что две случайные величины называют независимыми, если закон распределения одной из них не зависит от того, какие возможные значения приняла другая величина. В противном случае случайные величины зависимы. Несколько случайных величин называют взаимно независимыми, если законы распределения любого числа их них не зависят от того, какие возможные значения приняли остальные величины.

Замечание 3. Определим произведение независимых случайных величин и как случайную величину возможные значения которой равны произведениям каждого возможного значения на каждое возможное значение вероятности возможных значений произведения равны произведениям вероятностей возможных значений сомножителей. Например, если вероятность возможного значения равна, вероятность возможного значения равна то вероятность возможного значения равна

Свойство 3. Математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий:

Доказательство. Пусть независимые случайные величины и заданы своими законами распределения вероятностей:

Составим все значения, которые может принимать случайная величина Для этого перемножим все возможные значения на каждое возможное значение; в итоге получим и учитывая замечание 3, напишем закон распределения предполагая для простоты, что все возможные значения произведения различны (если это не так, то доказательство проводится аналогично):

Математическое ожидание равно сумме произведений всех возможных значений на их вероятности:

Следствие. Математическое ожидание произведения нескольких взаимно независимых случайных величин равно произведению их математических ожиданий.

Свойство 4. Математическое ожидание суммы двух случайных величин равно сумме математических ожиданий слагаемых:

Доказательство. Пусть случайные величины и заданы следующими законами распределения:

Составим все возможные значения величины Для этого к каждому возможному значению прибавим каждое возможное значение; получим Предположим для простоты, что эти возможные значения различны (если это не так, то доказательство проводится аналогично), и обозначим их вероятности соответственно через и

Математическое ожидание величины равно сумме произведений возможных значений на их вероятности:

Докажем, что Событие, состоящее в том, что примет значение (вероятность этого события равна), влечет за собой событие, которое состоит в том, что примет значение или (вероятность этого события по теореме сложения равна), и обратно. Отсюда и следует, что Аналогично доказываются равенства

Подставляя правые части этих равенств в соотношение (*), получим

или окончательно

Дисперсия и среднее квадратическое отклонение

На практике часто требуется оценить рассеяние возможных значений случайной величины вокруг ее среднего значения. Например, в артиллерии важно знать, насколько кучно лягут снаряды вблизи цели, которая должна быть поражена.

На первый взгляд может показаться, что для оценки рассеяния проще всего вычислить все возможные значения отклонения случайной величины и затем найти их среднее значение. Однако такой путь ничего не даст, так как среднее значение отклонения, т.е. для любой случайной величины равно нулю. Это свойство объясняется тем, что одни возможные отклонения положительны, а другие - отрицательны; в результате их взаимного погашения среднее значение отклонения равно нулю. Эти соображения говорят о целесообразности заменить возможные отклонения их абсолютными значениями или их квадратами. Так и поступают на деле. Правда, в случае, когда возможные отклонения заменяют их абсолютными значениями, приходится оперировать с абсолютными величинами, что приводит иногда к серьезным затруднениям. Поэтому чаще всего идут по другому пути, т.е. вычисляют среднее значение квадрата отклонения, которое и называется дисперсией.

Случайные величины помимо законов распределения могут описываться также числовыми характеристиками .

Математическим ожиданием М (x) случайной величины называется ее среднее значение.

Математическое ожидание дискретной случайной величины вычисляется по формуле

где значения случайной величины, р i - ихвероятности.

Рассмотрим свойства математического ожидания:

1. Математическое ожидание константы равно самой константе

2. Если случайную величину умножить на некоторое число k, то и математическое ожидание умножится на это же число

М (kx) = kМ (x)

3. Математическое ожидание суммы случайных величин равно сумме их математических ожиданий

М (x 1 + x 2 + … + x n) = М (x 1) + М (x 2) +…+ М (x n)

4. М (x 1 - x 2) = М (x 1) - М (x 2)

5. Для независимых случайных величин x 1 , x 2 , … x n математическое ожидание произведения равно произведению их математических ожиданий

М (x 1 , x 2 , … x n) = М (x 1) М (x 2) … М (x n)

6. М (x - М (x)) = М (x) - М (М(x)) = М (x) - М (x) = 0

Вычислим математическое ожидание для случайной величины из Примера 11.

М (x) = = .

Пример 12. Пусть случайные величины x 1 , x 2 заданы соответственно законами распределения:

x 1 Таблица 2

x 2 Таблица 3

Вычислим М (x 1) и М (x 2)

М (x 1) = (- 0,1) 0,1 + (- 0,01) 0,2 + 0 · 0,4 + 0,01 · 0,2 + 0,1 · 0,1 = 0

М (x 2) = (- 20) 0,3 + (- 10) 0,1 + 0 · 0,2 + 10 · 0,1 + 20 · 0,3 = 0

Математические ожидания обеих случайных величин одинаковы- они равны нулю. Однако характер их распределения различный. Если значения x 1 мало отличаются от своего математического ожидания, то значения x 2 в большой степени отличаются от своего математического ожидания, и вероятности таких отклонений не малы. Эти примеры показывают, что по среднему значению нельзя определить, какие отклонения от него имеют место как в меньшую, так и в большую сторону. Так при одинаковой средней величине выпадающих в двух местностях осадков за год нельзя сказать, что эти местности одинаково благоприятны для сельскохозяйственных работ. Аналогично по показателю средней заработной платы не возможно судить об удельном весе высоко- и низкооплачиваемых работниках. Поэтому, вводится числовая характеристикадисперсия D (x) , которая характеризует степень отклонения случайной величины от своего среднего значения:

D (x) = M (x - M (x)) 2 . (2)

Дисперсия –это математическое ожидание квадрата отклонения случайной величины от математического ожидания. Для дискретной случайной величины дисперсия вычисляется по формуле:

D (x) = = (3)

Из определения дисперсии следует, что D (x) 0.

Свойства дисперсии:

1. Дисперсия константы равна нулю

2. Если случайную величину умножить на некоторое число k , то дисперсия умножится на квадрат этого числа

D (kx) = k 2 D (x)

3. D (x) = М (x 2) – М 2 (x)

4. Для попарно независимых случайных величин x 1 , x 2 , … x n дисперсия суммы равна сумме дисперсий.

D (x 1 + x 2 + … + x n) = D (x 1) + D (x 2) +…+ D (x n)

Вычислим дисперсию для случайной величины из Примера 11.

Математическое ожидание М (x) = 1. Поэтому по формуле (3) имеем:

D (x) = (0 – 1) 2 ·1/4 + (1 – 1) 2 ·1/2 + (2 – 1) 2 ·1/4 =1·1/4 +1·1/4= 1/2

Отметим, что дисперсию вычислять проще, если воспользоваться свойством 3:

D (x) = М (x 2) – М 2 (x).

Вычислим дисперсии для случайных величин x 1 , x 2 из Примера 12 по этой формуле. Математические ожидания обеих случайных величин равны нулю.

D (x 1) = 0,01· 0,1 + 0,0001· 0,2 + 0,0001· 0,2 + 0,01· 0,1 = 0,001 + 0,00002 + 0,00002 + 0,001 = 0,00204

D (x 2) = (-20) 2 · 0,3 + (-10) 2 · 0,1 + 10 2 · 0,1 + 20 2 · 0,3 = 240 +20 = 260

Чем ближе значение дисперсии к нулю, тем меньше разброс случайной величины относительно среднего значения.

Величина называется среднеквадратическим отклонением . Модой случайной величины x дискретного типа Md называется такое значение случайной величины, которому соответствует наибольшая вероятность.

Модой случайной величины x непрерывного типа Md , называется действительное число, определяемое как точка максимума плотности распределения вероятностей f(x).

Медианой случайной величины x непрерывного типа Mn называется действительное число, удовлетворяющее уравнению

Математическим ожиданием случайной величины X называется среднее значение .

1. M(C) = C

2. M(CX) = CM(X) , где C = const

3. M(X ± Y) = M(X) ± M(Y)

4. Если случайные величины X и Y независимы, то M(XY) = M(X)·M(Y)

Дисперсия

Дисперсией случайной величины X называется

D(X) = S(x – M(X)) 2 p = M(X 2 ) – M 2 (X) .

Дисперсия представляет собой мерой отклонения значений случайной величины от своего среднего значения.

1. D(C) = 0

2. D(X + C) = D(X)

3. D(СX) = C 2 D(X) , где C = const

4. Для независимых случайных величин

D(X ± Y) = D(X) + D(Y)

5. D(X ± Y) = D(X) + D(Y) ± 2Cov(x, y)

Квадратный корень из дисперсии случайной величины X называется средним квадратичным отклонением .

@ Задача 3 : Пусть случайная величина X принимает всего два значения (0 или 1) с вероятностями q, p , где p + q = 1 . Найти математическое ожидание и дисперсию.

Решение:

M(X) = 1·p + 0·q = p; D(X) = (1 – p) 2 p + (0 – p) 2 q = pq.

@ Задача 4 : Математическое ожидание и дисперсия случайной величины X равны 8. Найти математическое ожидание и дисперсия случайных величин: а) X – 4 ; б) 3X – 4 .

Решение: M(X – 4) = M(X) – 4 = 8 – 4 = 4; D(X – 4) = D(X) = 8; M(3X – 4) = 3M(X) – 4 = 20; D(3X – 4) = 9D(X) = 72.

@ Задача 5 : Совокупность семей имеет следующее распределение по числу детей:

x i x 1 x 2
p i 0,1 p 2 0,4 0,35

Определить x 1 , x 2 и p 2 , если известно, что M(X) = 2; D(X) = 0,9 .

Решение: Вероятность p 2 равна p 2 = 1 – 0,1 – 0,4 – 0,35 = 0,15. Неизвестные x находятся из уравнений: M(X) = x 1 ·0,1 + x 2 ·0,15 + 2·0,4 + 3·0,35 = 2; D(X) = ·0,1 + ·0,15 + 4·0,4 + 9·0,35 – 4 = 0,9. x 1 = 0; x 2 = 1.

Генеральная совокупность и выборка. Оценки параметров

Выборочное наблюдение

Статистическое наблюдение можно организовать сплошное и не сплошное. Сплошное наблюдение предусматривает обследование всех единиц изучаемой совокупности (генеральной совокупности). Генеральная совокупность это множество физических или юридических лиц, которую исследователь изучает согласно своей задачи. Это часто экономически невыгодно, а иногда и невозможно. В связи с этим изучается только часть генеральной совокупности – выборочная совокупность .

Результаты, полученные на основе выборочной совокупности, можно распространить на генеральную совокупность, если следовать следующим принципам:



1. Выборочная совокупность должна определяться случайным образом.

2. Число единиц выборочной совокупности должно быть достаточным.

3. Должна обеспечиваться репрезентативность ( представительность) выборки. Репрезентативная выборка представляет собой меньшую по размеру, но точную модель той генеральной совокупности, которую она должна отражать.

Типы выборок

В практике применяются следующие типы выборок:

а) собственно-случайная, б) механическая, в) типическая, г) серийная, д) комбинированная.

Собственно-случайная выборка

При собственно-случайной выборке отбор единиц выборочной совокупности производится случайным образом, например, посредством жеребьевки или генератора случайных чисел.

Выборки бывают повторные и бесповторные. При повторной выборке единица, попавшая в выборку, возвращается и сохраняет равную возможность снова попасть в выборку. При бесповторной выборке единица совокупности, попавшая в выборку, в дальнейшем в выборке не участвует.

Ошибкиприсущие выборочному наблюдению, возникающие в силу того, что выборочная совокупность не полностью воспроизводит генеральную совокупность, называются стандартными ошибками . Они представляют собой среднее квадратичное расхождение между значениями показателей, полученных по выборке, и соответствующими значениями показателей генеральной совокупности.

Расчетные формулы стандартной ошибки при случайном повторном отборе следующая: , а при случайном бесповторном отборе следующая: , где S 2 – дисперсия выборочной совокупности, n/N – доля выборки, n, N - количества единиц в выборочной и генеральной совокупности. При n = N стандартная ошибка m = 0.

Механическая выборка

При механической выборке генеральная совокупность разбивается на равные интервалы и из каждого интервала случайным образом отбирается по одной единице.

Например, при 2%-ной доли выборки из списка генеральной совокупности отбирается каждая 50-я единица.

Стандартная ошибка механической выборки определяется как ошибка собственно-случайной бесповторной выборки.

Типическая выборка

При типической выборке генеральная совокупность разбивается на однородные типические группы, затем из каждой группы случайным образом производится отбор единиц.

Типической выборкой пользуются в случае неоднородной генеральной совокупности. Типическая выборка дает более точные результаты, потому что обеспечивается репрезентативность.

Например, учителя, как генеральная совокупность, разбиваются на группы по следующим признакам: пол, стаж, квалификация, образование, городские и сельские школы и т.д.

Стандартные ошибки типической выборки определяются как ошибки собственно-случайной выборки, с той лишь разницей, что S 2 заменяется средней величиной от внутригрупповых дисперсий.

Серийная выборка

При серийной выборке генеральная совокупность разбивается на отдельные группы (серии), затем случайным образом выбранные группы подвергаются сплошному наблюдению.

Стандартные ошибки серийной выборки определяются как ошибки собственно-случайной выборки, с той лишь разницей, что S 2 заменяется средней величиной от межгрупповых дисперсий.

Комбинированная выборка

Комбинированная выборка является комбинацией двух или более типов выборок.

Точечная оценка

Конечной целью выборочного наблюдения является нахождение характеристик генеральной совокупности. Так как этого невозможно сделать непосредственно, то на генеральную совокупность распространяют характеристики выборочной совокупности.

Принципиальная возможность определения средней арифметической генеральной совокупности по данным средней выборки доказывается теоремой Чебышева . При неограниченном увеличении n вероятность того, что отличие выборочной средней от генеральной средней будет сколь угодно мало, стремится к 1.

Это означает, что характеристика генеральной совокупности с точностью . Такая оценка называется точечной .

Интервальная оценка

Базисом интервальной оценки является центральная предельная теорема .

Интервальная оценка позволяет ответить на вопрос: внутри какого интервала и с какой вероятностью находится неизвестное, искомое значение параметра генеральной совокупности?

Обычно говорят о доверительной вероятности p = 1 a, с которой будет находиться в интервале D < < + D, где D = t кр m > 0 предельная ошибка выборки, a - уровень значимости (вероятность того, что неравенство будет неверным), t кр - критическое значение, которое зависит от значений n и a. При малой выборке n < 30 t кр задается с помощью критического значения t-распределения Стъюдента для двустороннего критиерия с n – 1 степенями свободы с уровнем значимости a (t кр (n – 1, a) находится из таблицы «Критические значения t–распределения Стъюдента», приложение 2). При n > 30, t кр - это квантиль нормального закона распределения (t кр находится из таблицы значений функции Лапласа F(t) = (1 a)/2 как аргумент). При p = 0,954 критическое значение t кр = 2 при p = 0,997 критическое значение t кр = 3. Это означает, что предельная ошибка обычно больше стандартной ошибки в 2-3 раза.

Таким образом, суть метода выборки заключается в том, что на основании статистических данных некоторой малой части генеральной совокупности удается найти интервал, в котором с доверительной вероятностью p находится искомая характеристика генеральной совокупности (средняя численность рабочих, средний балл, средняя урожайность, среднее квадратичное отклонение и т.д.).

@ Задача 1. Для определения скорости расчетов с кредиторами предприятий корпорации в коммерческом банке была проведена случайная выборка 100 платежных документов, по которым средний срок перечисления и получения денег оказался равным 22 дням ( = 22) со стандартным отклонением 6 дней (S = 6). С вероятностью p = 0,954 определить предельнуюошибку выборочной средней и доверительный интервал средней продолжительности расчетов предприятий данной корпорации.

Решение: Предельнаяошибка выборочной средней согласно (1) равна D = 2· 0,6 = 1,2, а доверительный интервал определяется как (22 – 1,2; 22 + 1,2), т.е. (20,8; 23,2).

§6.5 Корреляция и регрессия

Теория вероятности - особый раздел математики, который изучают только студенты высших учебных заведений. Вы любите расчёты и формулы? Вас не пугают перспективы знакомства с нормальным распределением, энтропией ансамбля, математическим ожиданием и дисперсией дискретной случайной величины? Тогда этот предмет вам будет очень интересен. Давайте познакомимся с несколькими важнейшими базовыми понятиями этого раздела науки.

Вспомним основы

Даже если вы помните самые простые понятия теории вероятности, не пренебрегайте первыми абзацами статьи. Дело в том, что без четкого понимания основ вы не сможете работать с формулами, рассматриваемыми далее.

Итак, происходит некоторое случайное событие, некий эксперимент. В результате производимых действий мы можем получить несколько исходов - одни из них встречаются чаще, другие - реже. Вероятность события - это отношение количества реально полученных исходов одного типа к общему числу возможных. Только зная классическое определение данного понятия, вы сможете приступить к изучению математического ожидания и дисперсии непрерывных случайных величин.

Среднее арифметическое

Ещё в школе на уроках математики вы начинали работать со средним арифметическим. Это понятие широко используется в теории вероятности, и потому его нельзя обойти стороной. Главным для нас на данный момент является то, что мы столкнемся с ним в формулах математического ожидания и дисперсии случайной величины.

Мы имеем последовательность чисел и хотим найти среднее арифметическое. Всё, что от нас требуется - просуммировать всё имеющееся и разделить на количество элементов в последовательности. Пусть мы имеем числа от 1 до 9. Сумма элементов будет равна 45, и это значение мы разделим на 9. Ответ: - 5.

Дисперсия

Говоря научным языком, дисперсия - это средний квадрат отклонений полученных значений признака от среднего арифметического. Обозначается одна заглавной латинской буквой D. Что нужно, чтобы её рассчитать? Для каждого элемента последовательности посчитаем разность между имеющимся числом и средним арифметическим и возведем в квадрат. Значений получится ровно столько, сколько может быть исходов у рассматриваемого нами события. Далее мы суммируем всё полученное и делим на количество элементов в последовательности. Если у нас возможны пять исходов, то делим на пять.

У дисперсии есть и свойства, которые нужно запомнить, чтобы применять при решении задач. Например, при увеличении случайной величины в X раз, дисперсия увеличивается в X в квадрате раз (т. е. X*X). Она никогда не бывает меньше нуля и не зависит от сдвига значений на равное значение в большую или меньшую сторону. Кроме того, для независимых испытаний дисперсия суммы равна сумме дисперсий.

Теперь нам обязательно нужно рассмотреть примеры дисперсии дискретной случайной величины и математического ожидания.

Предположим, что мы провели 21 эксперимент и получили 7 различных исходов. Каждый из них мы наблюдали, соответственно, 1,2,2,3,4,4 и 5 раз. Чему будет равна дисперсия?

Сначала посчитаем среднее арифметическое: сумма элементов, разумеется, равна 21. Делим её на 7, получая 3. Теперь из каждого числа исходной последовательности вычтем 3, каждое значение возведем в квадрат, а результаты сложим вместе. Получится 12. Теперь нам остается разделить число на количество элементов, и, казалось бы, всё. Но есть загвоздка! Давайте её обсудим.

Зависимость от количества экспериментов

Оказывается, при расчёте дисперсии в знаменателе может стоять одно из двух чисел: либо N, либо N-1. Здесь N - это число проведенных экспериментов или число элементов в последовательности (что, по сути, одно и то же). От чего это зависит?

Если количество испытаний измеряется сотнями, то мы должны ставить в знаменатель N. Если единицами, то N-1. Границу ученые решили провести достаточно символически: на сегодняшний день она проходит по цифре 30. Если экспериментов мы провели менее 30, то делить сумму будем на N-1, а если более - то на N.

Задача

Давайте вернемся к нашему примеру решения задачи на дисперсию и математическое ожидание. Мы получили промежуточное число 12, которое нужно было разделить на N или N-1. Поскольку экспериментов мы провели 21, что меньше 30, выберем второй вариант. Итак, ответ: дисперсия равна 12 / 2 = 2.

Математическое ожидание

Перейдем ко второму понятию, которое мы обязательно должны рассмотреть данной статье. Математическое ожидание - это результат сложения всех возможных исходов, помноженных на соответствующие вероятности. Важно понимать, что полученное значение, как и результат расчёта дисперсии, получается всего один раз для целой задачи, сколько бы исходов в ней не рассматривалось.

Формула математического ожидания достаточно проста: берем исход, умножаем на его вероятность, прибавляем то же самое для второго, третьего результата и т. д. Всё, связанное с этим понятием, рассчитывается несложно. Например, сумма матожиданий равна матожиданию суммы. Для произведения актуально то же самое. Такие простые операции позволяет с собой выполнять далеко не каждая величина в теории вероятности. Давайте возьмем задачу и посчитаем значение сразу двух изученных нами понятий. Кроме того, мы отвлекались на теорию - пришло время попрактиковаться.

Ещё один пример

Мы провели 50 испытаний и получили 10 видов исходов - цифры от 0 до 9 - появляющихся в различном процентном отношении. Это, соответственно: 2%, 10%, 4%, 14%, 2%,18%, 6%, 16%, 10%, 18%. Напомним, что для получения вероятностей требуется разделить значения в процентах на 100. Таким образом, получим 0,02; 0,1 и т.д. Представим для дисперсии случайной величины и математического ожидания пример решения задачи.

Среднее арифметическое рассчитаем по формуле, которую помним с младшей школы: 50/10 = 5.

Теперь переведем вероятности в количество исходов «в штуках», чтобы было удобнее считать. Получим 1, 5, 2, 7, 1, 9, 3, 8, 5 и 9. Из каждого полученного значения вычтем среднее арифметическое, после чего каждый из полученных результатов возведем в квадрат. Посмотрите, как это сделать, на примере первого элемента: 1 - 5 = (-4). Далее: (-4) * (-4) = 16. Для остальных значений проделайте эти операции самостоятельно. Если вы всё сделали правильно, то после сложения всех вы получите 90.

Продолжим расчёт дисперсии и математического ожидания, разделив 90 на N. Почему мы выбираем N, а не N-1? Правильно, потому что количество проведенных экспериментов превышает 30. Итак: 90/10 = 9. Дисперсию мы получили. Если у вас вышло другое число, не отчаивайтесь. Скорее всего, вы допустили банальную ошибку при расчётах. Перепроверьте написанное, и наверняка всё встанет на свои места.

Наконец, вспомним формулу математического ожидания. Не будем приводить всех расчётов, напишем лишь ответ, с которым вы сможете свериться, закончив все требуемые процедуры. Матожидание будет равно 5,48. Напомним лишь, как осуществлять операции, на примере первых элементов: 0*0,02 + 1*0,1… и так далее. Как видите, мы просто умножаем значение исхода на его вероятность.

Отклонение

Ещё одно понятие, тесно связанное с дисперсией и математическим ожиданием - среднее квадратичное отклонение. Обозначается оно либо латинскими буквами sd, либо греческой строчной «сигмой». Данное понятие показывает, насколько в среднем отклоняются значения от центрального признака. Чтобы найти её значение, требуется рассчитать квадратный корень из дисперсии.

Если вы построите график нормального распределения и захотите увидеть непосредственно на нём квадратичного отклонения, это можно сделать в несколько этапов. Возьмите половину изображения слева или справа от моды (центрального значения), проведите перпендикуляр к горизонтальной оси так, чтобы площади получившихся фигур были равны. Величина отрезка между серединой распределения и получившейся проекцией на горизонтальную ось и будет представлять собой среднее квадратичное отклонение.

Программное обеспечение

Как видно из описаний формул и представленных примеров, расчеты дисперсии и математического ожидания - не самая простая процедура с арифметической точки зрения. Чтобы не тратить время, имеет смысл воспользоваться программой, используемой в высших учебных заведениях - она называется «R». В ней есть функции, позволяющие рассчитывать значения для многих понятий из статистики и теории вероятности.

Например, вы задаете вектор значений. Делается это следующим образом: vector <-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

В заключение

Дисперсия и математическое ожидание - это без которых сложно в дальнейшем что-либо рассчитать. В основном курсе лекций в вузах они рассматриваются уже в первые месяцы изучения предмета. Именно из-за непонимания этих простейших понятий и неумения их рассчитать многие студенты сразу начинают отставать по программе и позже получают плохие отметки по результатам сессии, что лишает их стипендии.

Потренируйтесь хотя бы одну неделю по полчаса в день, решая задания, схожие с представленными в данной статье. Тогда на любой контрольной по теории вероятности вы справитесь с примерами без посторонних подсказок и шпаргалок.