Случайные величины и распределения

Курс охватывает базовые понятия теории вероятностей, связанные со случайными величинами и законами их распределения. Вы изучите математические операции над ними и познакомитесь с ключевыми примерами дискретных и непрерывных распределений.

1. Случайные величины и распределения

Случайные величины и распределения

Представьте, что вы стоите на остановке в ожидании автобуса. Вы знаете, что он ходит примерно каждые 15 минут, но точное время его прибытия предсказать невозможно. Оно зависит от множества факторов: пробок на дорогах, погоды, количества пассажиров на предыдущих остановках. Или вспомните покупку лотерейного билета: ваш выигрыш может составить 0 рублей, 100 рублей или даже 1 000 000 рублей. В математике и статистике для описания таких непредсказуемых результатов используется случайная величина.

Случайная величина — это переменная, значение которой зависит от исхода случайного события. В отличие от обычных алгебраических переменных (например, ширины стола, которую можно измерить линейкой), случайная величина принимает различные значения с определенной вероятностью. Традиционно их обозначают заглавными латинскими буквами: , , .

> Теория вероятностей есть не что иное, как здравый смысл, сведенный к исчислению. > > Пьер-Симон Лаплас

Дискретные и непрерывные случайные величины

Все случайные величины делятся на два больших класса в зависимости от того, какие значения они могут принимать.

Дискретные случайные величины

Дискретная случайная величина принимает отдельные, изолированные значения, которые можно пересчитать. Между этими значениями нет промежуточных вариантов.

Классический пример — бросок стандартной шестигранной игральной кости. Пусть — количество выпавших очков. Эта величина может принимать только целые значения: 1, 2, 3, 4, 5 или 6. Выпадение 3,5 очков физически невозможно.

Другие примеры дискретных величин: * Количество покупателей, зашедших в магазин за день (может быть 100 или 101, но не 100,2). * Число бракованных деталей в партии из 1000 штук. * Количество звонков, поступивших в колл-центр за час.

Непрерывные случайные величины

Непрерывная случайная величина может принимать абсолютно любое значение из некоторого интервала. Количество возможных значений здесь бесконечно, и они плавно переходят друг в друга.

Пример — точный вес яблока, сорванного с дерева. Весы могут показать 150 граммов. Более точные весы покажут 150,2 грамма. Лабораторное оборудование зафиксирует 150,235 граммов. Значение ограничено лишь точностью нашего измерительного прибора.

Другие примеры непрерывных величин: * Точное время ожидания курьера. * Рост случайно выбранного человека на улице. * Скорость ветра в данный момент времени.

| Характеристика | Дискретная случайная величина | Непрерывная случайная величина | |---|---|---| | Множество значений | Конечное или счетное (можно пронумеровать) | Бесконечное (любое число из интервала) | | Природа значений | Отдельные точки, скачки | Сплошная линия, плавные переходы | | Пример | Количество детей в семье | Объем выпитой воды за день |

Законы распределения

Просто знать, какие значения может принимать случайная величина, недостаточно. Нам нужно понимать, как часто (с какой вероятностью) появляется каждое из этих значений. Правило, которое устанавливает связь между возможными значениями случайной величины и их вероятностями, называется законом распределения.

Ряд распределения

Для дискретных величин закон распределения удобнее всего задавать в виде таблицы, которая называется рядом распределения. В верхней строке записываются все возможные значения, а в нижней — соответствующие им вероятности.

Рассмотрим пример. Вы подбрасываете правильную монету дважды. Пусть — количество выпавших «орлов». Возможные исходы эксперимента: Решка-Решка (0 орлов), Решка-Орел (1 орел), Орел-Решка (1 орел), Орел-Орел (2 орла). Всего 4 равновероятных исхода.

Ряд распределения для величины будет выглядеть так: * Значение 0: вероятность 1/4 (0,25) * Значение 1: вероятность 2/4 (0,50) * Значение 2: вероятность 1/4 (0,25)

Сумма всех вероятностей в таком ряду всегда должна быть строго равна единице. Это логично: какое-то из этих событий произойдет со стопроцентной вероятностью.

Функция распределения

Для непрерывных величин составить такую таблицу невозможно, так как значений бесконечно много, и вероятность попадания в любую конкретную точку (например, ровно в 150,00000... граммов) математически равна нулю. Поэтому для них используют функцию распределения вероятностей.

Она обозначается как и вычисляется по формуле:

Где: * — значение функции распределения в точке . * — вероятность события. * — наша случайная величина. * — конкретное числовое значение, с которым мы сравниваем величину.

Эта функция показывает вероятность того, что случайная величина примет значение, строго меньшее заданного числа . Функция распределения всегда начинается от 0 (невозможные события) и плавно растет до 1 (достоверные события).

Примеры популярных распределений

В природе и бизнесе многие случайные процессы подчиняются одним и тем же математическим законам. Рассмотрим три самых известных распределения.

1. Биномиальное распределение (Дискретное)

Описывает количество «успехов» в серии из нескольких одинаковых и независимых испытаний.

Представьте, что менеджер по продажам делает 10 холодных звонков. Вероятность того, что клиент согласится на встречу (успех), равна 0,2 (или 20%). Биномиальное распределение позволит рассчитать вероятность любого исхода: от 0 успешных звонков до всех 10.

2. Нормальное распределение (Непрерывное)

Самое важное распределение в статистике, также известное как Гауссовское распределение. Визуально оно напоминает симметричный колокол. Большинство значений группируется вокруг среднего показателя, а чем дальше от среднего, тем реже встречаются значения.

Этому закону подчиняется множество природных и социальных явлений: рост и вес людей, погрешности при измерениях, баллы на стандартизированных экзаменах. Например, если средний балл за тест составляет 70 из 100, то большинство студентов получат оценки от 60 до 80. Оценки около 100 или около 20 будут встречаться крайне редко.

3. Равномерное распределение (Непрерывное)

Возникает, когда случайная величина может с одинаковой вероятностью принять любое значение в пределах определенного интервала.

Пример: поезда метро ходят строго каждые 5 минут. Вы спускаетесь на станцию в случайный момент времени. Время вашего ожидания поезда — это непрерывная случайная величина, равномерно распределенная на отрезке от 0 до 5 минут. Вероятность прождать от 1 до 2 минут точно такая же, как вероятность прождать от 4 до 5 минут.

Операции над случайными величинами

В реальных задачах мы редко работаем только с одной случайной величиной. Часто их нужно складывать, вычитать или умножать на числа.

Чтобы понимать, как ведут себя величины при операциях, используют их числовые характеристики, главная из которых — математическое ожидание. Оно обозначается как (где — ожидание, а — случайная величина) и представляет собой среднее ожидаемое значение величины при многократном повторении эксперимента.

Умножение на константу

Если случайную величину умножить на постоянное число (константу), то ее математическое ожидание умножится на это же число.

Где: * — математическое ожидание. * — постоянное число (константа). * — случайная величина.

Пример: Средняя ежедневная выручка кофейни () составляет 200 долл. Владелец хочет перевести эту сумму в рубли. Курс валют зафиксирован на уровне 90 руб. за 1 долл. Новая случайная величина . Ожидаемая выручка в рублях составит руб.

Сложение случайных величин

Математическое ожидание суммы двух случайных величин всегда равно сумме их математических ожиданий, независимо от того, связаны они друг с другом или нет.

Где: * — математическое ожидание. * и — случайные величины.

Пример: Компания продает два вида товаров: смартфоны и ноутбуки. Пусть — случайная прибыль от продажи смартфонов за месяц, и мы знаем, что в среднем она составляет 500 000 руб. Пусть — случайная прибыль от продажи ноутбуков, в среднем равная 300 000 руб.

Даже если продажи смартфонов и ноутбуков зависят друг от друга (например, в период праздников растут обе категории), ожидаемая общая прибыль компании за месяц составит ровно 500 000 + 300 000 = 800 000 руб.

Понимание этих операций позволяет бизнесу прогнозировать доходы, страховым компаниям — рассчитывать риски по портфелю клиентов, а инженерам — оценивать надежность сложных систем, состоящих из множества деталей.

Итоги

* Случайная величина описывает результаты экспериментов, исход которых невозможно предсказать заранее со стопроцентной точностью. * Величины бывают дискретными (принимают конкретные, раздельные значения) и непрерывными (принимают любые значения из интервала). * Закон распределения показывает, с какой вероятностью случайная величина принимает свои возможные значения. * Операции над случайными величинами (сложение, умножение на число) подчиняются строгим математическим правилам, что позволяет легко рассчитывать средние ожидаемые результаты для сложных систем.

2. Операции над случайными величинами

Операции над случайными величинами

Представьте, что вы управляете сетью из двух кофеен. Вы знаете среднюю ежедневную выручку каждой из них, но точные суммы каждый день меняются из-за погоды, настроения покупателей и множества других факторов. Как рассчитать ожидаемую общую прибыль? А что произойдет с вашими рисками, если вы решите поднять цены на 10%?

В предыдущей статье мы выяснили, что непредсказуемые результаты описываются с помощью случайных величин, а их поведение подчиняется законам распределения. Однако в реальной жизни мы редко анализируем события в вакууме. Бизнес-показатели, физические измерения и финансовые риски постоянно складываются, умножаются и трансформируются.

> Математика — это искусство называть разные вещи одним и тем же именем. > > Анри Пуанкаре

Чтобы управлять сложными системами, необходимо понимать, как работают математические операции над случайными величинами.

Сдвиг и масштабирование: работа с константами

Самые простые операции — это прибавление к случайной величине постоянного числа (константы) или умножение на него.

Прибавление константы

Если к случайной величине прибавить фиксированное число, то все ее возможные значения увеличатся на это число, а вероятности останутся неизменными. График распределения просто «сдвинется» по оси вправо или влево.

Где: * — математическое ожидание (среднее ожидаемое значение). * — исходная случайная величина. * — постоянное число (константа).

Пример: Курьер доставляет заказы. Случайная величина — это чаевые, которые он получает за один заказ. В среднем руб. Служба доставки вводит фиксированную доплату: 100 руб. за каждый выполненный заказ. Теперь доход курьера за заказ равен . Его новое математическое ожидание составит руб.

Умножение на константу

При умножении случайной величины на число изменяется масштаб. Значения «растягиваются» или «сжимаются», но вероятности каждого отдельного исхода сохраняются.

Где: * — математическое ожидание. * — постоянный множитель. * — случайная величина.

Рассмотрим, как меняется ряд распределения дискретной случайной величины при этих операциях. Пусть — количество проданных автомобилей в автосалоне за день.

| Характеристика | 0 авто | 1 авто | 2 авто | |---|---|---|---| | Вероятность () | 0,2 | 0,5 | 0,3 | | Сдвиг () | 2 | 3 | 4 | | Масштаб () | 0 | 3 | 6 |

Как видно из таблицы, сами вероятности (0,2, 0,5 и 0,3) остаются на своих местах, меняются только значения в верхней строке, к которым эти вероятности привязаны.

Сложение и вычитание случайных величин

Часто нам нужно объединить две разные случайные величины. Например, узнать суммарное время поездки, которое состоит из времени ожидания автобуса (величина ) и времени в пути (величина ).

Главное правило сложения гласит, что математическое ожидание суммы всегда равно сумме математических ожиданий.

Где: * — математическое ожидание. * — первая случайная величина. * — вторая случайная величина.

Это правило универсально. Оно работает всегда, независимо от того, зависят ли и друг от друга.

Пример: Завод производит детали. — количество бракованных деталей на первой линии (в среднем 5 штук в день). — количество бракованных деталей на второй линии (в среднем 3 штуки в день). Даже если линии питаются от одного генератора и сбои на них происходят одновременно, ожидаемое общее число бракованных деталей за день составит ровно штук.

Аналогичное правило действует и для вычитания:

Где: * — математическое ожидание. * и — случайные величины.

Умножение случайных величин

С умножением двух случайных величин все немного сложнее. Математическое ожидание произведения равно произведению математических ожиданий только в том случае, если величины независимы.

Независимость означает, что исход одного события никак не влияет на вероятности исходов другого события.

Где: * — математическое ожидание. * и — строго независимые случайные величины.

Пример: Вы владеете автоматом по продаже газировки. — количество покупателей за день (в среднем 100 человек). — объем напитка, который наливает автомат одному покупателю (в среднем 0,2 литра, но из-за погрешности насоса значение слегка колеблется). Поскольку количество людей никак не влияет на работу насоса, эти величины независимы. Ожидаемый общий расход напитка за день составит литров.

Если бы величины были зависимы (например, при большом потоке людей насос перегревался бы и наливал меньше), использовать эту простую формулу было бы нельзя.

Изменение дисперсии при операциях

Математическое ожидание показывает нам средний результат. Но в бизнесе и науке не менее важно оценивать риски и разброс значений. За это отвечает дисперсия.

Дисперсия показывает, насколько сильно значения случайной величины отклоняются от ее среднего (математического ожидания).

Где: * — дисперсия случайной величины . * — математическое ожидание. * — случайная величина.

Как ведут себя риски (дисперсия) при математических операциях?

1. Прибавление константы не меняет дисперсию

Если вы увеличите зарплату всех сотрудников на 10 000 руб., средняя зарплата вырастет, но разрыв между самой маленькой и самой большой зарплатой останется прежним.

Где: * — дисперсия. * — случайная величина. * — постоянное число.

2. Умножение на константу увеличивает дисперсию в квадрате

Если вы умножаете случайную величину на число , ее разброс увеличивается в раз.

Где: * — дисперсия. * — постоянный множитель. * — случайная величина.

Пример: Вы инвестировали в акции. Дисперсия вашей ежедневной прибыли равна 10. Вы решили увеличить вложения ровно в 3 раза. Новая случайная величина . Новая дисперсия составит . Риск (разброс) вырос не в 3, а в 9 раз!

3. Сложение независимых величин складывает их дисперсии

Если вы складываете две независимые случайные величины, их дисперсии всегда суммируются.

Где: * — дисперсия. * и — независимые случайные величины.

Интересный факт: дисперсия разности независимых величин тоже равна сумме их дисперсий!

Почему так происходит? Представьте, что вы режете доску (величина ) пилой, которая тоже имеет погрешность (величина ). Итоговая длина доски — это . Ошибки не компенсируют друг друга, а накапливаются. Неопределенность только возрастает.

Функции от случайных величин

Иногда нам нужно применить к случайной величине более сложную функцию: возвести в квадрат, извлечь корень или найти логарифм.

Здесь кроется самая частая ошибка новичков в статистике. Математическое ожидание функции от случайной величины не равно функции от математического ожидания.

Рассмотрим возведение в квадрат.

Пример: Вы бросаете стандартную шестигранную игральную кость. Пусть — выпавшее число. Мы знаем, что среднее значение при броске кости: . Если мы возведем это среднее в квадрат, получим: .

Теперь давайте найдем честное математическое ожидание квадрата случайной величины — . Для этого возведем в квадрат каждое возможное значение кости и найдем их среднее: * Возможные значения : 1, 4, 9, 16, 25, 36. * Вероятность каждого исхода: 1/6. * .

Как видите, .

Это правило критически важно в экономике. Например, если — это случайная цена на сырье, а ваша прибыль зависит от цены нелинейно (допустим, падает пропорционально квадрату цены), вы не можете просто подставить среднюю цену в формулу прибыли. Вам придется рассчитывать математическое ожидание для каждого возможного сценария.

Итоги

* Прибавление константы к случайной величине сдвигает ее среднее значение, но никак не влияет на разброс (дисперсию). * Умножение случайной величины на константу увеличивает ее среднее значение в раз, а дисперсию — в раз. * Математическое ожидание суммы случайных величин всегда равно сумме их ожиданий, независимо от того, связаны они между собой или нет. * Математическое ожидание произведения равно произведению ожиданий только для независимых случайных величин. * При сложении или вычитании независимых случайных величин их неопределенность (дисперсия) всегда складывается и накапливается.