1. Основы алгебры: выражения, уравнения и неравенства
Основы алгебры: выражения, уравнения и неравенства
Алгебра начинается с абстракции. Мы заменяем конкретные числа символами, чтобы описать общие правила, закономерности и алгоритмы. В машинном обучении (Machine Learning) модели не знают заранее, какие именно пиксели изображения или слова текста поступят на вход. Поэтому вся внутренняя логика нейронных сетей и алгоритмов строится на универсальных алгебраических конструкциях.
Алгебраическое выражение — это математическая фраза, которая состоит из чисел, переменных и арифметических операций, но не содержит знака равенства или неравенства. Выражения позволяют описывать состояния систем и вычислять промежуточные результаты.
Любое выражение состоит из трех базовых элементов: * Переменные — символы (обычно латинские буквы), обозначающие неизвестные или меняющиеся значения. * Коэффициенты — числа, на которые умножаются переменные. Они определяют «вес» или значимость конкретной переменной. * Константы — фиксированные числа, которые не привязаны к переменным и остаются неизменными.
Рассмотрим выражение . Здесь и — переменные, и — коэффициенты, а — константа. Если мы подставим конкретные значения, например, и , то сможем вычислить итоговое значение: .
Представьте, что вы разрабатываете алгоритм для предсказания стоимости квартиры. У вас есть базовые параметры: площадь в квадратных метрах () и расстояние до центра в километрах (). Алгебраическое выражение для оценки стоимости может выглядеть так: .
Здесь и — это коэффициенты, отражающие влияние каждого параметра на цену. Площадь увеличивает стоимость, поэтому коэффициент положительный, а удаленность от центра снижает её, поэтому коэффициент отрицательный. — это константа, базовая стоимость. Подставив и , мы получим: руб.
Уравнения: поиск баланса
Если соединить два выражения знаком равенства, получится уравнение. Решить уравнение — значит найти такие значения переменных, при которых левая часть становится в точности равна правой. Эти значения называются корнями уравнения.
> Уравнение — это весы, находящиеся в равновесии. Любая операция, которую вы применяете к одной чаше, должна быть применена и к другой, иначе равновесие нарушится. > > Уильям Сойер, «Прелюдия к математике»
Самый простой тип — линейные уравнения. В них переменные находятся только в первой степени (нет квадратов, кубов или корней). Общий вид линейного уравнения с одной переменной записывается так: , где — переменная, а и — известные числа.
Процесс решения сводится к изоляции переменной на одной стороне от знака равенства. Возьмем уравнение .
Квадратные уравнения
Когда переменная возводится во вторую степень, уравнение становится квадратным. Такие уравнения описывают параболы и часто встречаются при оптимизации функций потерь в машинном обучении, где алгоритм ищет минимум ошибки (самую нижнюю точку параболы).
Стандартная форма квадратного уравнения:
Где: * — неизвестная переменная. * , , — известные коэффициенты, причём .
Для нахождения корней используется формула через дискриминант:
Где: * — корни уравнения (их может быть два, один или ни одного действительного). * , , — коэффициенты из стандартной формы. * Выражение под корнем () называется дискриминантом.
Допустим, у нас есть уравнение . Здесь , , . Сначала найдем дискриминант: . Теперь подставим его в формулу корней: . Получаем два корня: и .
Сравнение математических конструкций
Чтобы лучше структурировать эти понятия, рассмотрим их ключевые отличия.
| Конструкция | Назначение | Пример | Роль в машинном обучении | | :--- | :--- | :--- | :--- | | Выражение | Описание вычислений | | Подсчет прогноза модели (взвешенная сумма) | | Уравнение | Поиск точного значения | | Нахождение точки, где градиент (ошибка) равен нулю | | Неравенство | Установка границ и условий | | Функции активации (пропускать сигнал или нет) |
Системы уравнений: пересечение условий
Часто в задачах присутствует не одна неизвестная, а несколько, и для их нахождения одного уравнения недостаточно. В таких случаях используются системы уравнений — набор из двух или более уравнений, которые должны выполняться одновременно.
Классический пример системы из двух линейных уравнений с двумя переменными: 1) 2)
Решить систему — значит найти такую пару чисел (, ), которая делает верными оба равенства. Геометрически каждое линейное уравнение с двумя переменными представляет собой прямую линию на графике. Решение системы — это точка пересечения этих прямых.
Существует несколько методов решения систем: * Метод подстановки: выражаем одну переменную через другую из первого уравнения и подставляем во второе. * Метод сложения: складываем или вычитаем уравнения друг из друга, чтобы исключить одну из переменных.
Применим метод сложения к нашей системе. Если мы сложим левые и правые части обоих уравнений, переменная исчезнет, так как . Получаем: . Итого: , откуда . Теперь подставим найденный в любое из исходных уравнений, например, во второе: . Отсюда . Решение системы: , .
В машинном обучении системы уравнений разрастаются до колоссальных масштабов. При обучении нейронной сети алгоритм фактически решает систему из миллионов уравнений, пытаясь подобрать такие веса (переменные), которые минимизируют ошибку на всех обучающих примерах одновременно.
Неравенства и ограничения
Неравенства работают по тем же правилам, что и уравнения, но вместо знака равенства используют знаки сравнения: больше (), меньше (), больше или равно (), меньше или равно ().
Главное правило, которое нужно помнить при работе с неравенствами: при умножении или делении обеих частей неравенства на отрицательное число, знак неравенства меняется на противоположный.
Рассмотрим пример: .
В машинном обучении неравенства критически важны. Например, популярная функция активации ReLU (Rectified Linear Unit) работает на основе простого неравенства: если входящий сигнал , функция передает его дальше без изменений. Если , функция выдает ноль. Это позволяет нейронным сетям отсекать ненужную информацию и решать сложные нелинейные задачи.
Модуль числа (Абсолютная величина)
Еще одно важное понятие базовой алгебры — модуль числа, или его абсолютная величина. Модуль показывает расстояние от числа до нуля на координатной прямой, поэтому он всегда положителен или равен нулю. Обозначается двумя вертикальными линиями: .
Если , то . Если , то .
В алгоритмах машинного обучения модуль используется для измерения ошибок. Если модель предсказала цену дома в тысяч долларов, а реальная цена тысяч, ошибка равна тысяч. Если для другого дома предсказание тысяч при реальности в тысяч, ошибка равна тысяч. Чтобы алгоритм не решил, что средняя ошибка равна нулю (), используется модуль: . На этом принципе построена метрика Mean Absolute Error (MAE).
Понимание того, как собирать переменные в выражения, приравнивать их в уравнениях и ограничивать неравенствами — это фундамент. На этих простых правилах базируются сложные многомерные пространства и матрицы, к которым мы перейдем на следующих этапах.