Основы информатики: комплексная подготовка к ЕНТ с нуля

1. Представление информации и системы счисления в цифровой среде

Представление информации и системы счисления в цифровой среде

Почему современный компьютер, способный генерировать сложнейшие нейросетевые изображения и управлять космическими аппаратами, внутри себя «видит» лишь бесконечные цепочки из нулей и единиц? Ответ кроется в физической реализации электронных схем: гораздо проще и надежнее отличить наличие электрического сигнала от его отсутствия, чем пытаться распознать десять разных уровней напряжения для каждой цифры привычной нам десятичной системы. Весь цифровой мир — это результат грандиозного перевода человеческих смыслов на язык двух состояний.

Алфавит цифрового мира и измерение информации

Прежде чем данные попадут в память компьютера, они должны быть дискретизированы. Дискретизация — это процесс преобразования непрерывного сигнала (например, звуковой волны или плавного перехода цвета) в набор отдельных, конечных значений. Чтобы измерить объем этих значений, в информатике введено понятие «бит».

С технической точки зрения бит — это наименьшая единица информации, принимающая одно из двух значений: или . Однако с точки зрения теории информации, предложенной Клодом Шенноном, бит — это количество информации, которое уменьшает неопределенность наших знаний в два раза. Если вы подбрасываете монету, результат (орел или решка) несет ровно один бит информации, так как вариантов всего два и они равновероятны.

Для вычисления количества информации в сообщениях о событиях с разным числом исходов используется формула Хартли:

Где:

— количество возможных равновероятных событий (мощность алфавита);

— количество бит, приходящееся на одно событие (информационный вес символа).

Если мы рассматриваем алфавит из 256 символов (стандартная кодировка ASCII), то информационный вес одного символа составит бит, так как . Эти бит образуют следующую важную единицу — байт. Именно байт стал «золотым стандартом» адресации памяти.

В задачах ЕНТ часто встречаются ловушки, связанные с приставками. В отличие от физики, где «кило» означает ровно (), в классической информатике (согласно стандарту МЭК, хотя на практике часто используют упрощения) приставки базируются на степенях двойки.

Важно помнить нюанс: если в условии задачи спрашивается объем файла в битах, а дано в Кбайтах, нужно последовательно умножать на (переход к байтам) и на (переход к битам). Ошибка в одну степень двойки — самый частый повод потери баллов на экзамене.

Анатомия позиционных систем счисления

Система счисления — это способ записи чисел с помощью набора знаков (цифр). Мы привыкли к десятичной системе, но она не является единственно возможной. Все системы делятся на непозиционные (например, римская, где значение символа всегда десять) и позиционные. В позиционных системах вес цифры зависит от её места (разряда) в числе.

Любое число в позиционной системе счисления с основанием можно представить в виде развернутой формы:

Где:

— само число;

— основание системы (количество используемых цифр);

— цифры числа в соответствующих разрядах;

— количество целых разрядов.

Рассмотрим число в десятичной системе (): . Здесь в сумме дают исходное число. Этот же принцип работает для двоичной (), восьмеричной () и шестнадцатеричной () систем, которые являются фундаментом ИТ-архитектуры.

Двоичная система (Binary)

Использует только цифры и . Это «родной» язык процессора. Любое логическое утверждение (истина/ложь) или состояние транзистора (открыт/закрыт) идеально ложится на эту систему.

Восьмеричная система (Octal)

Использует цифры от до . Раньше она была популярна в программировании, так как позволяет компактно записывать двоичные числа (одна восьмеричная цифра заменяет ровно три двоичных — триаду).

Шестнадцатеричная система (Hexadecimal)

Самая важная для программиста после двоичной. Использует цифры и латинские буквы (), (), (), (), (), (). Шестнадцатеричная запись используется для указания адресов памяти, кодов цветов в веб-дизайне (например, #FFFFFF — белый) и в идентификаторах устройств. Одна цифра здесь заменяет четыре двоичных (тетраду).

Алгоритмы перевода: из человеческого в машинный и обратно

Для успешного решения заданий ЕНТ необходимо довести навыки перевода между системами до автоматизма. Существует два основных направления: в десятичную систему и из неё.

Перевод в десятичную систему

Для этого используется развернутая форма числа, описанная выше. Нужно пронумеровать разряды справа налево, начиная с нуля, и вычислить сумму произведений цифр на основание в степени разряда.

> Пример: Переведем двоичное число в десятичную систему. > 1. Расставим разряды: . > 2. Запишем сумму: . > 3. Вычислим: .

Перевод из десятичной системы

Здесь применяется алгоритм последовательного деления на основание искомой системы.

Делим число на основание .

Записываем остаток (даже если он равен ).

Полученное частное снова делим на .

Повторяем, пока частное не станет меньше основания.

Результат записываем, начиная с последнего частного и заканчивая первым остатком (в обратном порядке).

> Пример: Переведем число в двоичную систему. > - (остаток 1) > - (остаток 0) > - (остаток 0) > - (остаток 1) > - Последнее частное — 1. > Собираем снизу вверх: .

«Быстрый» перевод между 2, 8 и 16

Поскольку и , перевод между этими системами можно делать без промежуточного перехода в десятичную.

Для перехода 2 → 8: разбиваем двоичное число на группы по 3 цифры (триады) справа налево и заменяем каждую группу восьмеричной цифрой.

Для перехода 2 → 16: разбиваем на группы по 4 цифры (тетрады) и заменяем шестнадцатеричной цифрой.

Пример: . Для 16-ричной: ( в десятичной, то есть ) и (). Итог: . Для 8-ричной: (добавили незначащий ноль), , . Итог: .

Хранение текстовой и мультимедийной информации

Когда мы нажимаем клавишу на клавиатуре, компьютер не получает букву «А». Он получает электрический импульс, который интерпретируется как числовой код. Таблица, устанавливающая соответствие между символом и числом, называется кодировкой.

ASCII (American Standard Code for Information Interchange). Исторически первая массовая кодировка. Использует или бит. 8-битная версия позволяет закодировать символов, чего хватает для латиницы, цифр, знаков пунктуации и одного дополнительного алфавита (например, кириллицы).

Unicode (Юникод). Современный стандарт, призванный охватить все языки мира, включая иероглифы и эмодзи. Самая популярная реализация — UTF-8. Она переменной длины: один символ может занимать от до байт. В задачах ЕНТ часто упоминается кодировка Unicode (UTF-16), где на каждый символ стабильно отводится бит ( байта).

Кодирование изображений

Изображение в компьютере представляется в виде сетки из маленьких точек — пикселей. Этот способ называется растровой графикой. Каждый пиксель имеет свой цвет, который кодируется числом. Глубина цвета () — это количество бит, используемых для хранения цвета одного пикселя. Количество доступных цветов () рассчитывается по уже знакомой формуле .

В системе RGB (Red, Green, Blue) цвет формируется смешением трех основных каналов. Если на каждый канал отводится по бит ( байт), то на весь пиксель уходит бита. Это дает млн цветов (режим True Color).

Общий объем несжатого изображения вычисляется как:

Где:

— объем файла в битах;

— общее количество пикселей (ширина высота);

— глубина цвета.

Кодирование звука

Звук — это непрерывная волна. Чтобы перевести её в цифру, используется метод импульсно-кодовой модуляции. Мы «измеряем» амплитуду звука через равные промежутки времени. Здесь важны два параметра:

Частота дискретизации () — сколько раз в секунду мы делаем замер (измеряется в Гц).

Разрядность (глубина) кодирования () — сколько бит выделяется на хранение одного замера.

Информационный объем аудиофайла:

Где:

— время звучания в секундах;

— количество каналов (1 для моно, 2 для стерео).

Граничные случаи и специфика ЕНТ

При подготовке к экзамену важно обратить внимание на «нестандартные» системы счисления. Может встретиться задача на систему с основанием или . Алгоритмы остаются теми же: деление для перевода «из» и степени для перевода «в».

Особое внимание уделите сравнению чисел в разных системах. > Задача: Что больше: или ? > Переведем в десятичную: > > > Ответ: .

Также помните о максимальном числе, которое можно записать в разрядах. В двоичной системе это . Например, в битах (1 байт) максимальное целое число без знака — это (). Понимание этого ограничения критически важно для понимания того, почему в некоторых старых играх или программах счетчики «сбрасывались» после достижения определенных значений.

Цифровая среда — это не просто набор технологий, а строгая математическая модель, где любая информация, будь то текст, звук или видео, приводится к универсальному числовому знаменателю. Освоение систем счисления и принципов измерения информации — это первый и самый важный шаг к пониманию того, как работает «железо» и как пишутся эффективные программы. В следующей главе мы увидим, как эти биты и байты перемещаются по жилам компьютерной архитектуры и взаимодействуют с процессором.