1. Что такое данные и базы данных: зачем они нужны и какие бывают
Что такое данные и базы данных: зачем они нужны и какие бывают
Представь, что ты ведёшь дневник тренировок в блокноте. Каждый день записываешь: дату, упражнение, количество подходов, вес. Через месяц блокнот полон — а найти, сколько ты жал лёжа три недели назад, уже нереально. Приходится листать страницы одну за другой. А теперь представь, что у тебя не один блокнот, а пятьсот — и все они о разных вещах: друзьях, фильмах, оценках, поездках. Как в этом разобраться? Именно эту проблему решают базы данных — но начнём с самого начала.
Что такое данные
Данные — это любые зафиксированные сведения о чём-либо. Твоя фамилия в школьном журнале — данные. Температура за окном на термометре — данные. Количество лайков под постом — тоже данные. По сути, данные — это сырой материал, из которого потом можно извлечь смысл.
Важно отличать данные от информации. Данные — это отдельные факты без контекста. Информация — это данные, которые уже обработаны и несут смысл. Например, число «5» — это просто данные. А фраза «Иванов получил 5 по математике 15 марта» — уже информация, потому что число обрело смысл в контексте.
> Данные — это сырой материал. Информация — это данные, получившие смысл и контекст.
В цифровом мире данные хранятся в электронном виде: текстовые файлы, таблицы Excel, фотографии, сообщения в мессенджерах. Каждый день человек генерирует огромное количество данных — от поисковых запросов до геолокации телефона. По оценкам Statista, к 2025 году общий объём данных в мире превысит 180 зеттабайт. Чтобы представить масштаб: один зеттабайт — это триллион гигабайт.
Зачем нужны базы данных
Вернёмся к блокноту. Пока записей мало — пять, десять, двадцать — ты легко находишь нужное. Но что делать, когда записей тысячи? Нужен способ не просто хранить данные, а быстро находить нужные, добавлять новые, удалять устаревшие и не путаться при этом.
База данных — это организованное хранилище данных, в котором информация структурирована так, чтобы её можно было быстро находить, добавлять, изменять и удалять.
Почему бы не обойтись обычным файлом или таблицей? Вот простой пример. Допустим, у тебя есть Excel-файл с контактами всех учеников школы — 800 человек. Тебе нужно найти всех, кто учится в 9-м классе и живёт на улице Ленина. В Excel ты будешь фильтровать вручную или писать сложные формулы. База данных решает такую задачу за доли секунды с помощью одного запроса.
Базы данных повсюду: когда ты ищешь товар в интернет-магазине, бронируешь билет на поезд или проверяешь оценки в электронном журнале — за всем этим стоит база данных. Без них современный мир просто не работал бы.
Какие бывают базы данных
Базы данных различаются по способу организации данных. Есть два главных типа, и понимание разницы между ними — одна из ключевых тем всего курса.
Реляционные базы данных
Реляционная база данных — это база, в которой данные хранятся в таблицах, связанных между собой. Представь школьный журнал: каждая страница — это таблица. На одной — список учеников, на другой — оценки, на третьей — расписание. Между этими страницами есть связи: оценка принадлежит конкретному ученику, ученик учится в конкретном классе.
Главный принцип реляционной базы — каждая таблица хранит данные об одном типе объектов. Ученики — отдельно, оценки — отдельно, предметы — отдельно. А связи между ними обеспечиваются с помощью ключей — специальных идентификаторов, о которых поговорим подробнее в следующих главах.
Самый известный язык для работы с реляционными базами — SQL (Structured Query Language, структурированный язык запросов). С его помощью можно создавать таблицы, искать данные, добавлять, менять и удалять записи.
Примеры реляционных баз данных: MySQL, PostgreSQL, SQLite, Microsoft SQL Server. Они используются в банковских системах, интернет-магазинах, социальных сетях — везде, где важна точность и согласованность данных.
Нереляционные базы данных (NoSQL)
Нереляционные базы данных — это базы, которые не используют табличную структуру. Данные могут храниться в виде документов, пар «ключ-значение», графов или колонок. Звучит абстрактно, поэтому — аналогия.
Представь два способа хранить коллекцию наклеек. Первый — в альбоме с размеченными ячейками: каждая наклейка на своём месте, все одного размера. Это реляционный подход. Второй — в коробке: наклейки лежат кучей, каждая помечена ярлыком, и ты достаёшь нужную по ярлыку. Это похоже на нереляционный подход — он гибче, но требует другого способа поиска.
Нереляционные базы данных обозначают аббревиатурой NoSQL (Not Only SQL, «не только SQL»). Это не значит, что SQL там не используется вообще — просто данные организованы иначе.
| Тип | Как хранит данные | Аналогия | Пример базы | |---|---|---|---| | Документная | В виде документов (JSON) | Папка с анкетами | MongoDB | | «Ключ-значение» | Пары: ключ → значение | Словарь | Redis | | Графовая | Узлы и связи между ними | Карта друзей ВКонтакте | Neo4j | | Колоночная | Данные по колонкам | Столбцы Excel | Cassandra |
Когда использовать реляционную базу, а когда нереляционную? Если данные строго структурированы и важны связи между ними — подойдёт реляционная. Если данные часто меняют структуру или нужно обрабатывать огромные объёмы с высокой скоростью — стоит рассмотреть нереляционную. Но это обобщение; в реальном проекте выбор зависит от десятка факторов.
Как данные превращаются в базу данных
Допустим, у тебя есть список любимых фильмов в блокноте. Каждая запись содержит: название, год, жанр, оценку. Это уже данные. Но чтобы превратить их в базу данных, нужно:
На практике это выглядит так. Допустим, ты ведёшь учёт прочитанных книг. В блокноте у тебя 30 записей. Ты решаешь перенести их в базу данных. Сначала определяешь поля: название, автор, год издания, жанр, прочитана ли. Потом создаёшь таблицу с этими полями и заполняешь её. Теперь ты можешь за секунду найти все книги определённого автора или посчитать, сколько книг ты прочитал за год.
Типичное заблуждение
Многие думают, что база данных — это то же самое, что таблица в Excel. На самом деле разница принципиальная. Excel — это программа для работы с электронными таблицами, где данные хранятся в одном файле. База данных — это система, которая умеет одновременно работать с миллионами записей, обеспечивает безопасность, контроль доступа и целостность данных. Excel подходит для личных задач и небольших проектов. База данных нужна, когда данные используются множеством людей или программ одновременно.
> Excel — это блокнот. База данных — это целый архив с системой каталогизации, охраной и правилами доступа.