1. Введение в программирование на Python для ML
Введение в программирование на Python для ML
Зачем вам Python в Machine Learning
Python — основной язык в прикладном Machine Learning (ML), потому что он:В ML вы будете постоянно делать три вещи:
Python хорошо подходит для каждого из этих шагов.
!Упрощённая схема, где именно Python используется в типичном ML-проекте
Что нужно установить
Есть два удобных пути. Выберите один.Вариант A: Anaconda (проще для новичка)
Anaconda — это пакет, который ставит Python и популярные инструменты для работы с данными.Вариант B: Обычный Python + venv (ближе к индустрии)
Зачем нужно виртуальное окружение
Виртуальное окружение (черезvenv) — это отдельный набор библиотек для конкретного проекта.Как мы будем писать и запускать код
В курсе будут два формата..py — хорошо для привычки писать “настоящие” программыЧтобы запустить Jupyter после установки:
Откроется вкладка в браузере, где вы создадите новый Notebook.
Базовый синтаксис Python, который нужен для ML
Ниже — минимальная база, без которой невозможно двигаться к моделям.Переменные
Переменная — это имя, которое ссылается на значение.Важно: в Python не нужно заранее объявлять тип — он определяется по значению.
Типы данных, с которыми вы будете работать чаще всего
| Тип | Пример | Где пригодится в ML |
|---|---|---|
| int | 42 | счётчики, размеры, индексы |
| float | 0.25 | числа с дробью: средние, веса, метрики |
| str | "cat" | названия колонок, пути к файлам |
| bool | True | фильтрация, условия |
| list | [1, 2, 3] | наборы значений, строки таблицы |
| dict | { "age": 20 } | параметры моделей, метаданные |
Числа и операции
В ML вы часто будете получать дробные значения (например, средние и вероятности), поэтому важно различать / и //.
Условия: if, elif, else
Ключевой момент: Python использует отступы (обычно 4 пробела), чтобы понимать, какие строки относятся к блоку.
Циклы: for и while
while нужен реже, но важно знать:
Функции: как “упаковывать” логику
Функция — это именованный блок кода, который можно переиспользовать.В ML почти всё строится на функциях: предобработка, обучение, оценка.
Ошибки и исключения
Если Python не может выполнить код, он выдаёт исключение (exception) — сообщение об ошибке.Пример: деление на ноль.
Чтобы программа не падала “внезапно”, можно обработать ошибку:
В ML это полезно при чтении файлов, обработке “грязных” данных и проверках.
Импорт библиотек: как подключать инструменты для ML
Python становится ML-инструментом благодаря библиотекам.Пример импорта:
import ... as ... задаёт короткое имя (псевдоним), чтобы писать код быстрееnp и pd — общепринятые сокращенияМинимальный набор библиотек для старта
Первое знакомство с данными: pandas
В реальном ML вы почти всегда начинаете с таблицы.Создадим небольшую таблицу прямо в коде:
Полезные операции:
На следующих этапах курса мы научимся:
Числа для моделей: NumPy
Модели “понимают” числа, поэтому в ML постоянно используются массивы.mean() — среднее значениеshape — размерность (очень важное понятие в ML, позже разберём глубже)Стиль кода: почему это важно
В ML-проектах код быстро разрастается. Понятный стиль экономит время.Основные привычки:
salary, age, model, а не a1, x2Официальные рекомендации по стилю Python: PEP 8
> "Beautiful is better than ugly." — из The Zen of Python (PEP 20) (PEP 20)
Что дальше по курсу
После этой статьи вы должны уверенно:importВ следующих материалах мы перейдём к практической работе с данными: загрузка файлов, очистка, базовая аналитика и подготовка признаков — это фундамент перед обучением первой модели.