1. Дифференциальное исчисление функций многих переменных: частные производные и экстремумы
Дифференциальное исчисление функций многих переменных: частные производные и экстремумы
Добро пожаловать на второй курс математического анализа. Если на первом курсе мы исследовали поведение функций одной переменной — представьте это как движение муравья по натянутой проволоке, — то теперь мы выходим в открытое пространство. Мы будем изучать функции, зависящие от двух, трех и более переменных. Это математический язык реального мира, где процессы зависят от множества факторов одновременно: погода зависит от давления, температуры и влажности; прибыль компании — от затрат на рекламу, стоимости сырья и логистики.
В этой статье мы заложим фундамент многомерного анализа: разберемся, как измерять скорость изменения функции в разных направлениях (частные производные) и как находить пики и впадины на сложных поверхностях (экстремумы).
Функции многих переменных: от линии к поверхности
Функция одной переменной графически представляет собой кривую на плоскости. Функция двух переменных задает поверхность в трехмерном пространстве.
Где:
!График функции двух переменных, представляющий собой параболоид вращения.
Представьте, что вы стоите на склоне горы. Ваша высота над уровнем моря () зависит от вашей долготы () и широты (). Это и есть физический смысл функции двух переменных.
Частные производные: искусство заморозки
В анализе функций одной переменной производная показывала мгновенную скорость изменения функции. Но как определить скорость изменения, если двигаться можно в любую сторону?
Для этого вводят понятие частной производной. Идея проста: мы хотим узнать, как меняется функция, если менять только одну переменную, а остальные считать константами (заморозить их).
Определение и обозначение
Частная производная функции по переменной обозначается специальным символом (читается как «де» или «бэ»):
Где:
Геометрически — это тангенс угла наклона касательной к сечению поверхности плоскостью .
!Геометрический смысл частной производной по x как наклон касательной в сечении.
Пример вычисления
Рассмотрим функцию:
Где:
Найдем частную производную по (). Мы считаем обычным числом (как 5 или 10). Производная от по будет равна 0, так как это константа.
Где:
Теперь найдем частную производную по (). Теперь — это константа.
Где:
Градиент: вектор наискорейшего роста
Если собрать все частные производные в один вектор, мы получим градиент. Это одно из важнейших понятий в машинном обучении и физике.
Где:
Физический смысл: Градиент всегда указывает направление самого быстрого возрастания функции. Если вы стоите на горе, градиент покажет, куда сделать шаг, чтобы подняться максимально круто вверх. Длина вектора градиента показывает, насколько крутой этот подъем.
Экстремумы функций многих переменных
Как и в случае с одной переменной, нас часто интересует поиск максимумов и минимумов функции (оптимизация). В многомерном анализе алгоритм поиска экстремумов состоит из двух этапов: необходимого и достаточного условий.
Необходимое условие экстремума
В точке экстремума (на вершине холма или на дне впадины) касательная плоскость горизонтальна. Это значит, что скорость изменения по всем направлениям равна нулю.
Точка называется стационарной, если:
Где:
Это условие необходимо, но недостаточно. Точка может быть стационарной, но не быть ни минимумом, ни максимумом (так называемая «седловая точка», похожая на перевал в горах).
!Седловая точка: стационарная точка, не являющаяся экстремумом.
Достаточное условие экстремума (Матрица Гессе)
Чтобы понять, чем является найденная точка, нужно проанализировать вторые производные. Из них составляют определитель, называемый гессианом (или дискриминантом Сильвестра).
Обозначим вторые производные:
Где:
Составим определитель :
Где:
Правило проверки:
Пример полного исследования
Исследуем функцию на экстремумы.
Так как , экстремум существует. Так как , это точка минимума.
Заключение
Мы сделали первый шаг в изучении многомерного анализа. Понимание частных производных и градиента открывает двери к пониманию сложных физических полей, методов оптимизации в экономике и алгоритмов обучения нейросетей. В следующих статьях мы рассмотрим кратные интегралы, которые позволят нам вычислять объемы под этими поверхностями.