1. Представление информации и системы счисления в цифровой среде
Представление информации и системы счисления в цифровой среде
Почему современный компьютер, способный генерировать сложнейшие нейросетевые изображения и управлять космическими аппаратами, внутри себя «видит» лишь бесконечные цепочки из нулей и единиц? Ответ кроется в физической реализации электронных схем: гораздо проще и надежнее отличить наличие электрического сигнала от его отсутствия, чем пытаться распознать десять разных уровней напряжения для каждой цифры привычной нам десятичной системы. Весь цифровой мир — это результат грандиозного перевода человеческих смыслов на язык двух состояний.
Алфавит цифрового мира и измерение информации
Прежде чем данные попадут в память компьютера, они должны быть дискретизированы. Дискретизация — это процесс преобразования непрерывного сигнала (например, звуковой волны или плавного перехода цвета) в набор отдельных, конечных значений. Чтобы измерить объем этих значений, в информатике введено понятие «бит».
С технической точки зрения бит — это наименьшая единица информации, принимающая одно из двух значений: или . Однако с точки зрения теории информации, предложенной Клодом Шенноном, бит — это количество информации, которое уменьшает неопределенность наших знаний в два раза. Если вы подбрасываете монету, результат (орел или решка) несет ровно один бит информации, так как вариантов всего два и они равновероятны.
Для вычисления количества информации в сообщениях о событиях с разным числом исходов используется формула Хартли:
Где:
Если мы рассматриваем алфавит из 256 символов (стандартная кодировка ASCII), то информационный вес одного символа составит бит, так как . Эти бит образуют следующую важную единицу — байт. Именно байт стал «золотым стандартом» адресации памяти.
В задачах ЕНТ часто встречаются ловушки, связанные с приставками. В отличие от физики, где «кило» означает ровно (), в классической информатике (согласно стандарту МЭК, хотя на практике часто используют упрощения) приставки базируются на степенях двойки.
| Единица измерения | Сокращение | Соотношение в степенях | Значение в байтах | | :--- | :--- | :--- | :--- | | Килобайт | Кбайт / KB | | 1024 | | Мегабайт | Мбайт / MB | | 1 048 576 | | Гигабайт | Гбайт / GB | | 1 073 741 824 | | Терабайт | Тбайт / TB | | ~ 1 триллион |
Важно помнить нюанс: если в условии задачи спрашивается объем файла в битах, а дано в Кбайтах, нужно последовательно умножать на (переход к байтам) и на (переход к битам). Ошибка в одну степень двойки — самый частый повод потери баллов на экзамене.
Анатомия позиционных систем счисления
Система счисления — это способ записи чисел с помощью набора знаков (цифр). Мы привыкли к десятичной системе, но она не является единственно возможной. Все системы делятся на непозиционные (например, римская, где значение символа всегда десять) и позиционные. В позиционных системах вес цифры зависит от её места (разряда) в числе.
Любое число в позиционной системе счисления с основанием можно представить в виде развернутой формы:
Где:
Рассмотрим число в десятичной системе (): . Здесь в сумме дают исходное число. Этот же принцип работает для двоичной (), восьмеричной () и шестнадцатеричной () систем, которые являются фундаментом ИТ-архитектуры.
Двоичная система (Binary)
Использует только цифры и . Это «родной» язык процессора. Любое логическое утверждение (истина/ложь) или состояние транзистора (открыт/закрыт) идеально ложится на эту систему.Восьмеричная система (Octal)
Использует цифры от до . Раньше она была популярна в программировании, так как позволяет компактно записывать двоичные числа (одна восьмеричная цифра заменяет ровно три двоичных — триаду).Шестнадцатеричная система (Hexadecimal)
Самая важная для программиста после двоичной. Использует цифры и латинские буквы (), (), (), (), (), (). Шестнадцатеричная запись используется для указания адресов памяти, кодов цветов в веб-дизайне (например,#FFFFFF — белый) и в идентификаторах устройств. Одна цифра здесь заменяет четыре двоичных (тетраду).Алгоритмы перевода: из человеческого в машинный и обратно
Для успешного решения заданий ЕНТ необходимо довести навыки перевода между системами до автоматизма. Существует два основных направления: в десятичную систему и из неё.
Перевод в десятичную систему
Для этого используется развернутая форма числа, описанная выше. Нужно пронумеровать разряды справа налево, начиная с нуля, и вычислить сумму произведений цифр на основание в степени разряда.> Пример: Переведем двоичное число в десятичную систему. > 1. Расставим разряды: . > 2. Запишем сумму: . > 3. Вычислим: .
Перевод из десятичной системы
Здесь применяется алгоритм последовательного деления на основание искомой системы.> Пример: Переведем число в двоичную систему. > - (остаток 1) > - (остаток 0) > - (остаток 0) > - (остаток 1) > - Последнее частное — 1. > Собираем снизу вверх: .
«Быстрый» перевод между 2, 8 и 16
Поскольку и , перевод между этими системами можно делать без промежуточного перехода в десятичную.Пример: . Для 16-ричной: ( в десятичной, то есть ) и (). Итог: . Для 8-ричной: (добавили незначащий ноль), , . Итог: .
Хранение текстовой и мультимедийной информации
Когда мы нажимаем клавишу на клавиатуре, компьютер не получает букву «А». Он получает электрический импульс, который интерпретируется как числовой код. Таблица, устанавливающая соответствие между символом и числом, называется кодировкой.
Кодирование изображений
Изображение в компьютере представляется в виде сетки из маленьких точек — пикселей. Этот способ называется растровой графикой. Каждый пиксель имеет свой цвет, который кодируется числом. Глубина цвета () — это количество бит, используемых для хранения цвета одного пикселя. Количество доступных цветов () рассчитывается по уже знакомой формуле .В системе RGB (Red, Green, Blue) цвет формируется смешением трех основных каналов. Если на каждый канал отводится по бит ( байт), то на весь пиксель уходит бита. Это дает млн цветов (режим True Color).
Общий объем несжатого изображения вычисляется как:
Где:
Кодирование звука
Звук — это непрерывная волна. Чтобы перевести её в цифру, используется метод импульсно-кодовой модуляции. Мы «измеряем» амплитуду звука через равные промежутки времени. Здесь важны два параметра:Информационный объем аудиофайла:
Где:
Граничные случаи и специфика ЕНТ
При подготовке к экзамену важно обратить внимание на «нестандартные» системы счисления. Может встретиться задача на систему с основанием или . Алгоритмы остаются теми же: деление для перевода «из» и степени для перевода «в».
Особое внимание уделите сравнению чисел в разных системах. > Задача: Что больше: или ? > Переведем в десятичную: > > > Ответ: .
Также помните о максимальном числе, которое можно записать в разрядах. В двоичной системе это . Например, в битах (1 байт) максимальное целое число без знака — это (). Понимание этого ограничения критически важно для понимания того, почему в некоторых старых играх или программах счетчики «сбрасывались» после достижения определенных значений.
Цифровая среда — это не просто набор технологий, а строгая математическая модель, где любая информация, будь то текст, звук или видео, приводится к универсальному числовому знаменателю. Освоение систем счисления и принципов измерения информации — это первый и самый важный шаг к пониманию того, как работает «железо» и как пишутся эффективные программы. В следующей главе мы увидим, как эти биты и байты перемещаются по жилам компьютерной архитектуры и взаимодействуют с процессором.