Вероятность, комбинаторика и основы статистики
Как эта тема связывает весь курс
Раньше мы работали с выражениями, уравнениями, функциями и графиками, а также с производной и геометрическими формулами. Вероятность и статистика продолжают ту же линию:
как в алгебре мы аккуратно работали с областью допустимых значений, так и здесь важно понимать, какие исходы возможны и какие невозможны
как в теме про функции мы учились читать график, так и в статистике мы учимся читать графики данных (столбики, гистограммы)
как производная отвечает за скорость изменения, так статистика отвечает за изменчивость данных (разброс)Эта тема нужна для задач про качество продукции, риски, проценты, выборки, опросы, а также для понимания базовых идей анализа данных.
Комбинаторика: как правильно считать варианты
Комбинаторика отвечает на вопрос: сколько способов можно сделать выбор или составить набор.
Правило произведения и правило суммы
Правило произведения: если действие состоит из двух шагов, и
первый шаг можно сделать способами
после каждого из них второй шаг можно сделать способамито всего способов .
Пояснение к записи :
и — количества вариантов на каждом шаге
знак означает умножениеПравило суммы: если нужно выбрать один вариант из двух непересекающихся наборов возможностей, и
в первом наборе вариантов
во втором наборе вариантовто всего .
Пояснение:
важно, чтобы один и тот же вариант не считался дважды (наборы должны не пересекаться)Факториал
Чтобы удобно записывать количество перестановок, используют факториал.
Пояснение каждого элемента:
— натуральное число
читают как «эн факториал»
многоточие означает, что произведение продолжается по порядкуПримеры:
-
-
Перестановки: важен порядок
Перестановка — это способ упорядочить все разных объектов.
Количество перестановок:
Пояснение:
— число перестановок из объектов
— факториал, то есть произведение чисел от до Пример смысла: сколько способов рассадить 5 разных студентов в ряд из 5 мест? Ответ .
Размещения: выбираем и упорядочиваем
Размещения из (без повторений) — это выбор объектов из , где порядок важен.
Пояснение каждого элемента:
— число размещений
— сколько всего объектов
— сколько выбираем
дробь означает деление
— факториал числа (сколько объектов не выбрали)Интуиция: сначала считаем все упорядочивания , а затем «убираем» варианты, где учитывались лишние места.
Сочетания: выбираем без учёта порядка
Сочетания из (без повторений) — это выбор объектов из , где порядок не важен.
Пояснение каждого элемента:
— число сочетаний
«делит» на число перестановок внутри выбранной группы (потому что порядок не важен)
учитывает оставшиеся невыбранные объектыПример смысла: выбрать 3 человека из 10 в команду — это , потому что не важно, кто «первый».
!Шпаргалка: чем отличаются перестановки, размещения и сочетания
Вероятность: как измеряют случайность
Исход, опыт и событие
Случайный опыт — действие, результат которого заранее неизвестен точно (например, бросок кубика).
Исход — конкретный результат (например, выпало 4).
Событие — набор исходов, который нас интересует (например, «выпало чётное»).Классическая вероятность
Если все исходы равновозможны, вероятность события считают так:
Пояснение каждого элемента:
— вероятность события
— число благоприятных исходов (которые подходят событию)
— число всех возможных исходов
дробь означает «часть от целого»Важно:
всегда
означает «невозможно», означает «обязательно»Дополнение (противоположное событие)
Событие «не » обозначают . Тогда:
Пояснение:
— это вероятность «произойдёт что-то из всех возможных исходов»
если событие занимает часть исходов, то оставшаяся часть — это Пример смысла: если вероятность «попал в цель» 0.7, то «не попал» 0.3.
Сложение вероятностей
Если события и несовместимы (не могут произойти одновременно), то:
Пояснение:
читают как « или »
несовместимость означает: нет исходов, где выполняются оба события сразуПример смысла: на кубике события «выпало 1» и «выпало 2» несовместимы.
Умножение вероятностей и независимость
События и называют независимыми, если наступление одного не влияет на вероятность другого.
Для независимых событий:
Пояснение:
читают как « и »
точка — умножениеТипичный пример независимости: два броска монеты (если монета честная и броски не влияют друг на друга).
Условная вероятность (когда мы узнали дополнительную информацию)
Если известно, что событие уже произошло, вероятность события может измениться. Это условная вероятность:
Пояснение каждого элемента:
читают как «вероятность при условии »
— вероятность того, что случатся оба события
— вероятность условия (должна быть больше нуля)Интуиция: мы как бы «сужаем мир» до случаев, где уже выполнено.
!Диаграмма Венна для понимания объединения и пересечения событий
Как комбинаторика помогает вероятности
Очень часто вероятность считают так:
Определяют, что считается «равновозможным исходом».
Считают число всех исходов комбинаторикой.
Считают число благоприятных исходов комбинаторикой.
Подставляют в формулу .Пример смысла (без перегруза вычислениями):
если из колоды выбирают несколько карт, то «сколько способов выбрать» — это сочетания
если важен порядок (например, код из цифр без повторений), то это размещения Основы статистики: как описывать данные
Статистика отвечает на вопрос: какое число «типичное» и насколько данные разбросаны.
Набор данных и выборка
Данные — это измерения или наблюдения (например, оценки, рост, время выполнения).
Выборка — часть объектов, по которым собрали данные (например, 30 студентов группы).Важно: выводы о «всех» по выборке требуют осторожности, потому что выборка может быть нерепрезентативной.
Среднее арифметическое
Если есть числа , то среднее:
Пояснение каждого элемента:
— значения данных
— сколько значений всего
— среднее значениеСмысл: «сумму разделили поровну» на наблюдений.
Медиана и мода
Медиана — число посередине, если данные отсортировать.
- если нечётное — это ровно центральное значение
- если чётное — обычно берут среднее двух центральных
Мода — значение, которое встречается чаще всегоЗачем они нужны:
среднее может сильно «съехать» из-за одного очень большого или очень маленького значения
медиана более устойчива к выбросамРазброс: дисперсия и стандартное отклонение (базовая идея)
Когда среднее найдено, хочется понять, насколько значения «разлетаются» вокруг него.
Один из стандартных показателей — дисперсия (для простого знакомства можно использовать формулу для набора данных):
Пояснение:
— дисперсия
— отклонение значения от среднего
квадрат нужен, чтобы минусы не сокращали плюсы и чтобы сильные отклонения учитывались больше
деление на делает показатель «средним квадратом отклонений»Стандартное отклонение:
Пояснение:
— стандартное отклонение
— квадратный корень из дисперсии
смысл: возвращаемся к тем же единицам измерения, что и исходные данные (например, «баллы», «см»)Практическая интерпретация:
маленькое — значения близки друг к другу
большое — значения сильно отличаютсяКак показывают данные на графиках
Чаще всего в школьной и прикладной статистике используют:
столбчатую диаграмму для категорий (например, сколько студентов выбрали специальность)
гистограмму для числовых интервалов (например, распределение оценок по диапазонам)!Пример гистограммы: как выглядит распределение числовых данных
Частые ошибки и как их избегать
Путать «или» и «и».
- «или» чаще связано с , «и» — с .
Складывать вероятности событий, которые могут произойти одновременно.
- формула работает только для несовместимых.
Неправильно выбирать комбинаторическую модель.
- порядок важен: размещения/перестановки
- порядок не важен: сочетания
Делать выводы по среднему, не глядя на разброс.
- одинаковое среднее возможно при очень разном «разлёте» значений.
Короткое резюме
комбинаторика считает количество способов: правила суммы и произведения, факториал, перестановки, размещения, сочетания
классическая вероятность: при равновозможных исходах
полезные правила: дополнение , сложение для несовместимых, умножение для независимых, условная вероятность
статистика описывает данные: среднее, медиана, мода, разброс (дисперсия и стандартное отклонение)Полезные источники (по желанию)
Википедия: Комбинаторика
Википедия: Вероятность
Википедия: Условная вероятность
Википедия: Среднее арифметическое
Википедия: Дисперсия