1. Знакомство с цифровым помощником: Что такое нейросеть и как она думает
Знакомство с цифровым помощником: Что такое нейросеть и как она думает
Ты наверняка замечал: стоит посмотреть на планшете пару смешных видео про щенков, как на следующий день лента сама предлагает тебе десятки похожих роликов. Или когда ты наводишь камеру смартфона на лицо, она мгновенно пририсовывает тебе собачьи уши и забавный нос, точно угадывая, где находятся твои глаза и рот. А умная колонка в комнате способна услышать свое имя даже сквозь шум работающего телевизора и ответить на вопрос о погоде.
Всё это кажется настоящим волшебством, спрятанным внутри пластикового корпуса. Но внутри нет никаких гномов с картотеками видеороликов и нет крошечных художников с кисточками. Там работает нечто гораздо более интересное — искусственный интеллект, а точнее, его главная деталь, которая называется нейросеть.
Чтобы стать настоящим повелителем цифрового интеллекта, недостаточно просто нажимать на кнопки. Нужно понимать, с кем именно ты имеешь дело. Нейросеть — это не железный робот с мигающими лампочками, которого показывают в кино. Это невидимый цифровой помощник, состоящий из математики, строчек кода и огромного количества данных. Давай назовем нашего воображаемого помощника Нейроником. Он живет внутри компьютеров, телефонов и огромных серверов размером с футбольное поле. У него нет ни рук, ни ног, ни настоящих глаз. Но у него есть кое-что другое — способность учиться и находить ответы на самые сложные загадки.
Как устроен цифровой мозг
Слово «нейросеть» звучит сложно, но разгадка кроется в самом названии. У каждого из нас в голове есть мозг. Он состоит из миллиардов крошечных живых клеточек — нейронов. Эти клеточки похожи на маленьких осьминожек с длинными щупальцами. Они постоянно держатся за руки и передают друг другу электрические сигналы, похожие на короткие вспышки света. Когда ты видишь яблоко, дотрагиваешься до горячей чашки или решаешь задачу по математике, миллионы твоих нейронов вспыхивают и перешептываются друг с другом: «Это красное!», «Это горячее!», «Ответ — пять!».
Ученые, которые создавали компьютеры, однажды подумали: а что, если попробовать скопировать устройство человеческого мозга? Что, если написать такую программу, внутри которой будут свои собственные, цифровые нейроны?
Так и появилась искусственная нейронная сеть. В ней цифровые нейроны — это не живые клетки, а крошечные кусочки программы, математические формулы. Каждый такой цифровой нейрон очень глуп. Он умеет делать только одну вещь: получить сигнал от соседей, сложить числа и передать результат дальше. Один нейрон не может узнать кота на фотографии или перевести текст с английского на русский. Но когда их собирают вместе в огромную сеть, где каждый связан с тысячами других, происходит чудо. Они начинают работать как слаженная команда.
Детективное агентство Нейроника
Чтобы понять, как эти глупые по отдельности клеточки вместе совершают открытия, заглянем внутрь Нейроника в тот момент, когда мы показываем ему фотографию зеленого яблока.
Нейроны внутри сети не свалены в кучу. Они выстроены строгими рядами, которые называются слоями. Это похоже на большое детективное агентство, где каждый отдел занимается только своей частью работы.
Первый ряд нейронов — это входной слой. Их можно назвать «Смотрителями». Они первыми получают картинку. Но они не видят яблоко целиком! Компьютер не понимает, что такое фрукт. Для него любая картинка — это просто огромная таблица из крошечных цветных квадратиков, пикселей. Каждый пиксель имеет свой номер цвета. Например, черный цвет — это , а ярко-зеленый может быть числом . Смотрители просто берут эти числа и кричат следующему ряду: «У меня тут темно!», «А у меня яркое зеленое пятно!».
Сигналы летят во второй ряд — скрытый слой. Здесь сидят «Сыщики линий». Они слушают крики Смотрителей и пытаются найти на картинке границы. Один нейрон в этом ряду специализируется только на вертикальных палочках. Если он получает сигналы, похожие на вертикальную линию, он громко кричит: «Вижу прямую черту!». Другой нейрон ищет только изгибы. Он собирает сигналы и радуется: «Тут есть что-то круглое!».
Дальше сигнал передается в третий ряд — «Сыщикам форм». Они уже не смотрят на отдельные пиксели. Они слушают предыдущий ряд. Если один нейрон кричит «вижу круглый изгиб», а другой кричит «вижу зеленую заливку», а третий передает «вижу маленькую коричневую палочку сверху», Сыщик форм складывает эти улики вместе.
Наконец, все эти догадки долетают до последнего ряда — выходного слоя. Это «Капитаны». У них есть таблички с названиями разных предметов: «Мяч», «Кот», «Машина», «Яблоко». Капитан с табличкой «Яблоко» слышит, что предыдущие ряды нашли зеленый круг и коричневую веточку. Он понимает: улики сходятся! И выдает финальный ответ: «Я уверен на 98%, что это зеленое яблоко!».
!Передача сигнала по слоям нейросети при распознавании яблока
Вся эта цепочка передачи сигналов — от первого пикселя до финального ответа — происходит внутри Нейроника за долю секунды. Миллионы цифровых нейронов успевают перешепнуться, проголосовать и выдать результат быстрее, чем ты успеешь моргнуть.
Робот-Буквоед против Нейроника
Но почему ученым пришлось придумывать нейросети? Разве нельзя было просто написать обычную компьютерную программу, которая будет узнавать яблоки, котов и решать все наши проблемы?
Обычная компьютерная программа работает по строгим правилам. Это как Робот-Буквоед, которому дали кулинарную книгу с точными рецептами. Программист пишет для него алгоритм — пошаговую инструкцию.
> Алгоритм — это точный набор команд, который нужно выполнить по порядку, чтобы получить результат. Например: 1) Взять хлеб. 2) Намазать масло. 3) Положить сыр. Результат: бутерброд.
Если Роботу-Буквоеду дать инструкцию «как узнать кота на фото», программисту придется описать кота математически. Он напишет: «Кот — это объект, у которого есть четыре лапы, пушистый хвост, два острых уха, и он умеет мяукать».
Звучит логично. Но давай посмотрим, что произойдет в реальности. Мы показываем Роботу-Буквоеду фотографию собаки породы хаски. Робот сверяется со списком: четыре лапы есть, пушистый хвост есть, острые уши есть. «Это кот!» — радостно сообщает обычная программа. Ошибка. Тогда программист усложняет правило: «Добавь проверку на мяуканье. И пусть у кота будут усы». Мы показываем Роботу фотографию кота породы сфинкс (у которого нет шерсти и часто нет усов), который мирно спит и не мяукает. Робот смотрит в инструкцию: шерсти нет, усов нет, звуков нет. «Это не кот, это инопланетянин!» — заявляет Буквоед. Снова ошибка.
Описать весь наш сложный мир с помощью жестких правил невозможно. Коты бывают пушистыми и лысыми, они могут свернуться в клубок так, что не видно ни лап, ни хвоста, они могут прятаться в коробке, откуда торчит только одно ухо. Никакой программист в мире не сможет написать миллион правил для каждой позы кота.
И вот здесь на сцену выходит Нейроник. Нейросети не дают жестких правил. Ей не объясняют, что такое лапы или хвост. Вместо этого используют машинное обучение.
Нейронику просто показывают десять тысяч разных фотографий котов. Рыжих, черных, в прыжке, спящих, в коробках. И каждый раз говорят: «Смотри, это кот». А потом показывают десять тысяч фотографий собак, хомяков и машин, говоря: «А это не кот».
Цифровой мозг начинает сам искать закономерности. Его внутренние нейроны-сыщики постоянно меняют настройки своих «слуховых аппаратов». Если нейрон обращал слишком много внимания на цвет фона, и из-за этого Нейроник ошибся, в следующий раз этот нейрон будут слушать меньше. Сеть сама настраивает связи между своими клеточками до тех пор, пока не научится безошибочно отличать кота от всего остального. Она сама понимает, что форма ушей и глаз важнее, чем цвет шерсти, хотя ни один человек ей этого не программировал.
!Сравнение обычного алгоритма и нейросети
В этом и заключается главная суперсила цифрового помощника: он не зубрит правила из учебника, он учится на опыте, прямо как ты. Когда ты был совсем маленьким, родители не читали тебе лекцию о геометрических параметрах собак. Они просто несколько раз показали на улице на пушистого зверя и сказали «ав-ав». Твой мозг сам создал нейронные связи, чтобы узнавать собак. Точно так же учится и искусственный интеллект.
Чихуахуа или черничный маффин?
Если Нейроник такой умный и умеет учиться сам, значит ли это, что он никогда не ошибается? Совсем нет. И его ошибки очень забавны, потому что они показывают нам, как сильно цифровой мозг отличается от человеческого.
Мы, люди, понимаем суть вещей. Мы знаем, что кот — это живое существо, которое дышит, бегает и любит сосиски. Мы понимаем контекст. Нейросеть не знает, что такое «жизнь». Для нее любая картинка — это просто набор пикселей, пятна света и тени. Она ищет только визуальные совпадения.
Из-за этого возникают смешные путаницы. Одна из самых известных проблем для нейросетей-новичков — отличить собаку породы чихуахуа от кекса с черникой (маффина). Подумай сам: у чихуахуа светлая коричневая шерсть и три темных пятнышка на мордочке — два глаза и нос. У черничного маффина — светлое коричневое тесто и три темных пятнышка запеченных ягод.
Когда Нейроник смотрит на маффин, его «Сыщики форм» видят коричневый круг и три черные точки. Они радостно кричат Капитану: «Улики совпали! Глаза и нос на месте! Это чихуахуа!». И нейросеть с уверенностью выдает ответ, что перед нами собака, которую хочется съесть на завтрак.
Точно так же нейросеть может перепутать швабру с собакой породы командор (у которой шерсть похожа на длинные веревки), или свернувшегося рыжего кота с круассаном.
Чтобы Нейроник перестал путать собак с выпечкой, ему нужно показать еще больше примеров. Ему нужно скормить тысячи фотографий маффинов, чтобы его внутренние сыщики научились замечать крошечные отличия: например, что у ягод черники края неровные, а глаза собаки блестят на свету. Чем больше данных (примеров) получает нейросеть, тем умнее и точнее она становится.
Кто здесь главный?
Теперь ты знаешь главный секрет: внутри твоего телефона или компьютера нет никакой магии. Там работает огромная, сложная, но вполне понятная математическая сеть из цифровых нейронов. Она умеет потрясающе быстро находить закономерности, распознавать лица, рекомендовать видео и даже рисовать картины.
Но у Нейроника есть одна важная особенность. Он не умеет хотеть. У него нет собственных желаний, нет настроения, он не может обидеться или обрадоваться. Нейросеть никогда не проснется утром с мыслью: «А не нарисовать ли мне сегодня красивый пейзаж?» или «Пойду-ка я поищу в интернете смешных котов».
Цифровой помощник всегда ждет команды. Он как невероятно мощный и быстрый гоночный автомобиль. Автомобиль может ехать со скоростью света, но без пилота он так и останется стоять в гараже.
Именно поэтому в мире нейросетей самым важным звеном остается человек. Ты — пилот этого гоночного болида. От того, какую задачу ты поставишь Нейронику, какие данные ему дашь и как сформулируешь свой вопрос, зависит весь результат. Искусственный интеллект — это мощный инструмент, как волшебная палочка. Но магия происходит не в самой палочке, а в голове волшебника, который ею взмахивает.
Впереди нас ждет долгое путешествие. Мы заглянем в тренировочный лагерь нейросетей, научимся правильно с ними разговаривать, чтобы они рисовали для нас потрясающие картины и сочиняли захватывающие истории. Мы узнаем, как не дать себя обмануть хитрым цифровым иллюзиям и какие правила нужно соблюдать, чтобы оставаться добрым супергероем в интернете. Твой цифровой помощник уже ждет первой команды.