Интенсивный курс: Анализ данных эксперимента NA62 (PhD за 3 месяца)

1. Теоретические основы физики каонов и поиск новой физики за пределами Стандартной модели

Теоретические основы физики каонов и поиск новой физики за пределами Стандартной модели

Добро пожаловать на интенсивный курс по анализу данных эксперимента NA62. Наша цель — за три месяца пройти путь от базового понимания до уровня, необходимого для защиты PhD в области физики высоких энергий. Мы начинаем с фундамента: почему мы вообще изучаем каоны и как редчайшие процессы могут открыть дверь в Новую физику.

Введение: Почему NA62 и каоны?

Эксперимент NA62 в ЦЕРН (CERN) — это высокоточная установка, расположенная на Протонном суперсинхротроне (SPS). Главная цель эксперимента — измерение вероятности ультраредкого распада положительно заряженного каона на пион и пару нейтрино-антинейтрино: .

Почему физики тратят десятилетия и миллионы евро на изучение именно этого процесса? Ответ кроется в точности. Стандартная модель (СМ) физики элементарных частиц предсказывает вероятность этого распада с беспрецедентной точностью. Любое статистически значимое отклонение экспериментальных данных от этого предсказания станет неопровержимым доказательством существования физики за пределами Стандартной модели.

Каоны и кварковая структура

Чтобы понять динамику распада, нужно разобраться в структуре участвующих частиц. Каоны (K-мезоны) — это адроны, состоящие из одного кварка и одного антикварка.

Положительный каон () имеет следующий кварковый состав:

Где:

— положительно заряженный каон.

— -кварк (верхний кварк).

— -кварк (анти-странный кварк).

Пион (), который является продуктом распада, состоит из:

Где:

— положительно заряженный пион.

— -кварк.

— -кварк (анти-нижний кварк).

Таким образом, процесс фундаментально представляет собой превращение странного антикварка () в нижний антикварк (). Это переход между поколениями кварков, который регулируется слабым взаимодействием.

!Кварковый состав каона и пиона, демонстрирующий изменение странного кварка на нижний.

Матрица CKM и смешивание ароматов

В Стандартной модели переходы между кварками описываются матрицей Кабиббо-Кобаяши-Маскавы (CKM). Она определяет силу взаимодействия между кварками разных ароматов.

Где:

— матрица смешивания кварков.

Элементы (например, , ) — комплексные числа, модуль которых определяет вероятность перехода кварка типа в кварк типа (или наоборот) при участии -бозона.

Для распада ключевую роль играют элементы (связь топ-кварка и странного кварка) и (связь топ-кварка и нижнего кварка), так как доминирующий вклад в процесс вносят петлевые диаграммы с участием тяжелого топ-кварка.

Золотой канал:
Этот канал распада называют «золотым» по двум причинам:
Он чрезвычайно редок.

Он теоретически «чист».

Почему он редкий? (FCNC и механизм GIM)

На фундаментальном уровне распад представляет собой ток, меняющий аромат, но не меняющий электрический заряд (Flavor Changing Neutral Current — FCNC). В Стандартной модели такие процессы запрещены на древесном уровне (то есть в простейшем виде без петель).

Они могут происходить только за счет квантовых поправок высших порядков — так называемых «пингвинных» диаграмм или диаграмм «ящик» (box diagrams), где участвуют виртуальные тяжелые кварки (, ) и бозоны (, ).

!Пингвинная диаграмма Фейнмана, описывающая редкий распад каона через квантовую петлю.

Кроме того, эти процессы сильно подавлены механизмом Глэшоу-Илиопулоса-Майани (GIM). Этот механизм обеспечивает сокращение вкладов от различных кварков в петле, делая итоговую вероятность события ничтожно малой.

Теоретическое предсказание

Вероятность распада принято описывать через коэффициент ветвления (Branching Ratio, BR). Для нашего процесса предсказание СМ составляет:

Где:

— вероятность того, что каон распадется именно по этому каналу, а не по какому-либо другому.

— индекс, указывающий на предсказание Стандартной модели.

Это означает, что из 100 миллиардов распадов каонов, мы ожидаем увидеть всего около 8 событий такого типа. Это поиск иголки не в стоге сена, а в целом поле стогов.

Поиск Новой физики (BSM)

Если Стандартная модель так хороша, зачем мы ищем отклонения? Дело в том, что СМ не объясняет ряд фундаментальных явлений: * Темную материю. * Асимметрию материи и антиматерии (нарушение CP-инвариантности). * Массу нейтрино.

Физика за пределами Стандартной модели (Beyond Standard Model — BSM) предлагает различные расширения теории. Многие из этих теорий предсказывают существование новых частиц, которые могут участвовать в петлевых процессах распада каона.

Если существуют новые частицы (например, лептокварки, аксионы, темные фотоны или суперсимметричные партнеры), они могут:

Изменить частоту распада (увеличить или уменьшить ).

Имитировать этот сигнал, если новая частица рождается вместо пары нейтрино: .

Кинематика и недостающая масса

Как мы вообще можем увидеть нейтрино? Ответ прост: никак. Нейтрино не взаимодействуют с детекторами NA62. Мы видим их по отсутствию энергии и импульса.

Мы измеряем импульс входящего каона () и импульс исходящего пиона (). Затем мы вычисляем квадрат недостающей массы ():

Где:

— квадрат недостающей массы (инвариантная масса системы невидимых частиц).

— 4-импульс каона (энергия и трехмерный импульс).

— 4-импульс пиона.

В системе покоя, если мы пренебрежем массой нейтрино, формула упрощается. Анализ распределения является главным инструментом анализа.

* Для распада спектр недостающей массы непрерывен (так как улетают три частицы: пион и два нейтрино). * Для фоновых распадов (например, ) спектр имеет пики в конкретных значениях массы.

> «Мы ищем то, чего нет, чтобы понять то, что есть». — Поговорка физиков-экспериментаторов.

Основные фоновые процессы

Главный враг эксперимента NA62 — это другие, гораздо более частые распады каонов, которые могут имитировать сигнал. Самые опасные из них:

(): Самый частый распад (BR ). Если мюон ошибочно идентифицирован как пион, это создает ложный сигнал.

(): Частый распад (BR ). Если фотоны от распада не зарегистрированы детекторами, событие выглядит как плюс недостающая энергия.

Борьба с этими фонами требует феноменальной работы детекторов: системы идентификации частиц (чтобы отличить от ) и системы вето фотонов (чтобы не пропустить ни одного ).

Заключение

Теоретическая база эксперимента NA62 строится на прецизионной проверке Стандартной модели через петлевые процессы FCNC. Изучая редчайший распад , мы получаем доступ к физике сверхвысоких энергий, недоступной для прямых наблюдений на коллайдерах. Любое отклонение от станет указанием на существование новых частиц или взаимодействий.

В следующей статье мы разберем устройство детектора NA62 и то, как инженеры и физики воплотили эти теоретические требования в железе.

2. Архитектура детектора NA62, триггерные системы и процесс сбора экспериментальных данных

Архитектура детектора NA62, триггерные системы и процесс сбора экспериментальных данных

В предыдущей статье мы выяснили, что поиск «Золотого канала» требует исключительной точности. Мы ищем событие с вероятностью на фоне миллиардов других распадов. Чтобы реализовать это на практике, физикам и инженерам пришлось построить уникальную установку.

Сегодня мы разберем «железо» эксперимента NA62: как мы видим невидимое, зачем детектору вакуум и как электроника принимает решение о сохранении события за микросекунды.

Общая концепция: Камера-обскура для частиц

Эксперимент NA62 — это не классический коллайдерный детектор (как ATLAS или CMS), который окружает точку столкновения сферой. NA62 — это детектор с фиксированной мишенью. Он вытянут в длину почти на 270 метров.

Главная задача установки — восстановить кинематику реакции, чтобы вычислить квадрат недостающей массы:

Где:

— квадрат недостающей массы.

— 4-импульс входящего каона (энергия и импульс до распада).

— 4-импульс исходящего пиона (энергия и импульс после распада).

Следовательно, детектор функционально делится на две части:

Upstream (Вверх по потоку): Измеряет и определяет тип частицы.

Downstream (Вниз по потоку): Измеряет и идентифицирует продукты распада.

!Схема экспериментальной установки NA62, показывающая расположение основных детекторов вдоль оси пучка.

Формирование пучка и идентификация каонов

Всё начинается с ускорителя SPS (Super Proton Synchrotron) в ЦЕРН. Протоны с энергией 400 ГэВ (гигаэлектронвольт) ударяют в бериллиевую мишень. В результате столкновения рождается «зоопарк» вторичных частиц: пионы, протоны, каоны и другие.

С помощью магнитов мы отбираем положительно заряженные частицы с импульсом . Однако в этом пучке каонов всего около 6%. Остальное — пионы и протоны. Нам нужно знать, какая именно частица влетела в установку.

KTAG: Черенковский детектор

Для этого используется детектор KTAG (Kaon Tagger). Он работает на основе эффекта Черенкова. Когда частица летит в среде быстрее скорости света в этой среде, она испускает световой конус (аналог звукового удара).

Угол излучения зависит от скорости частицы:

Где:

— угол излучения черенковского света.

— показатель преломления среды (газа внутри детектора).

— скорость частицы в единицах скорости света ().

Поскольку при одинаковом импульсе () каоны, пионы и протоны имеют разные массы, их скорости () различаются. KTAG настроен так, чтобы «видеть» свет только от каонов. Это позволяет нам поставить метку времени: «В этот момент пролетел каон».

GTK: Гигатрекер

Зная, что это каон, нам нужно точно измерить его импульс и направление. Для этого используется GTK (GigaTracker). Это три станции кремниевых пиксельных детекторов, стоящих на пути пучка.

GTK — это технологическое чудо. Он должен выдерживать поток в 750 миллионов частиц в секунду, измерять время с точностью до 200 пикосекунд и при этом быть максимально тонким, чтобы не рассеивать пучок. Если каон столкнется с материалом детектора, он может распасться не так, как нам нужно, создав фон.

Область распада (Decay Volume)

После прохождения GTK каоны попадают в 65-метровую вакуумную трубу. Вакуум необходим критически. Если бы там был воздух, каоны сталкивались бы с молекулами газа, имитируя редкие распады.

Давление в этой трубе составляет порядка миллибар (глубокий вакуум).

Спектрометр и идентификация продуктов (Downstream)

Если каон распался в трубе, продукты распада летят дальше. Нам нужно поймать пион () и доказать, что это именно пион, а не мюон или электрон.

STRAW: Соломенный трекер

Чтобы измерить импульс пиона (), используется магнитный спектрометр STRAW. Он состоит из тысяч тонких трубок («соломинок»), наполненных газом. Когда заряженная частица пролетает сквозь трубку, она ионизирует газ, и мы регистрируем электрический сигнал.

Спектрометр находится внутри вакуумного объема (уникальная особенность NA62), чтобы минимизировать многократное рассеяние, которое ухудшает точность измерения импульса.

RICH: Кольцевой черенковский детектор

Мы измерили импульс. Но кто летит? Пион или мюон? При одном и том же импульсе мюон легче пиона, а значит, летит быстрее. Детектор RICH (Ring Imaging Cherenkov) измеряет радиус кольца черенковского света.

Радиус кольца связан со скоростью частицы:

Где:

— радиус кольца света на фотодетекторах.

— фокусное расстояние зеркала.

— черенковский угол (зависящий от скорости).

RICH позволяет отличить пион от мюона с вероятностью ошибки менее .

Системы вето: Охота на фотоны и мюоны

Вспомним главный фоновый процесс: . Нейтральный пион () мгновенно распадается на два фотона (). Чтобы отсеять этот фон, нам нужно детектировать эти фотоны. Если мы видим пион и хотя бы один фотон — это не наш сигнал.

LKr (Жидкокриптоновый калориметр): Огромный бак с жидким криптоном. Он поглощает фотоны и измеряет их энергию с высочайшей точностью. Эффективность регистрации фотонов здесь достигает .

LAV (Large Angle Veto): 12 кольцевых станций вдоль вакуумной трубы, перехватывающих фотоны, летящие под большими углами.

MUV (Muon Veto): Система детекторов за толстой железной стеной в конце установки. Пионы застревают в железе, а мюоны проходят сквозь него. Если MUV сработал — событие отбрасывается.

!Структура электромагнитного калориметра на жидком криптоне для регистрации фотонов.

Триггерная система и TDAQ

Детекторы генерируют огромный поток данных. Частота входных событий — около 10 МГц (10 миллионов событий в секунду). Записать всё это на диск невозможно технически и финансово.

Здесь вступает в игру система триггеров (Trigger and Data Acquisition — TDAQ). Это фильтр, который решает: «Интересное это событие или мусор?».

Уровень 0 (L0 Trigger)

Это аппаратный уровень (FPGA — программируемые логические матрицы). Он принимает решения за доли микросекунды. * Логика: «Есть сигнал в RICH? Нет сигнала в MUV? Есть энергия в калориметре?» * Коэффициент подавления: Снижает поток с 10 МГц до 1 МГц.

Уровень 1 (L1 Trigger)

Это программный уровень. Данные, прошедшие L0, отправляются на ферму компьютеров. Здесь запускаются упрощенные алгоритмы реконструкции траекторий. * Логика: «Совпадает ли трек в GTK с треком в STRAW?» * Коэффициент подавления: Снижает поток до ~100 кГц.

Только события, прошедшие оба уровня, записываются на ленточные накопители в компьютерном центре ЦЕРН для дальнейшего анализа.

Заключение

Архитектура NA62 — это компромисс между точностью измерения (для расчета ) и герметичностью (для вето фоновых частиц). Каждый детектор выполняет свою узкую задачу, но только вместе они позволяют увидеть редчайший распад .

Теперь, когда мы понимаем, как установка собирает данные, в следующей части курса мы перейдем к самому интересному — программному анализу. Мы узнаем, как из сырых байтов восстановить физические величины и как отделить зерна от плевел с помощью статистических методов.

3. Программный инструментарий: ROOT, Geant4 и фреймворк анализа данных эксперимента NA62

Программный инструментарий: ROOT, Geant4 и фреймворк анализа данных эксперимента NA62

В предыдущих частях нашего интенсивного курса мы изучили теоретическую физику редких распадов и разобрали аппаратную архитектуру детектора NA62. Теперь перед нами встает практическая задача: как превратить петабайты сырых данных, поступающих с детектора, в научный результат — график, таблицу или значение вероятности распада?

Физика высоких энергий (HEP — High Energy Physics) неразрывно связана с программированием. В этой статье мы познакомимся с «большой тройкой» инструментов любого физика в ЦЕРН: библиотекой ROOT, симулятором Geant4 и специфическим программным обеспечением коллаборации NA62.

ROOT: Фундамент анализа данных

Если вы спросите физика-экспериментатора, на чем держится современная наука, он ответит: «На C++ и ROOT».

ROOT — это объектно-ориентированный фреймворк, разработанный в ЦЕРН для обработки и анализа больших объемов данных. Это не просто библиотека для построения графиков, это полноценная экосистема, включающая в себя интерпретатор C++, средства ввода-вывода данных, математические библиотеки и инструменты визуализации.

Почему ROOT?

Эксперимент NA62 записывает миллиарды событий. Стандартные форматы данных (CSV, JSON, XML) здесь неприменимы из-за их огромного объема и медленной скорости чтения. ROOT предлагает свой формат файлов (.root) и структуру данных, называемую TTree (Дерево).

TTree оптимизировано для колоночного доступа. Представьте себе таблицу, где строки — это события (столкновения частиц), а столбцы — параметры (энергия, импульс, время). Если вам нужно построить гистограмму энергии пиона, ROOT позволяет считать с диска только один столбец «Энергия», не загружая в память остальные терабайты информации. Это ускоряет анализ в тысячи раз.

Основные объекты ROOT

TH1 (Histogram): Одномерная гистограмма. Основной способ визуализации распределений.

TF1 (Function): Математическая функция для аппроксимации (фиттинга) данных.

TLorentzVector: Класс для работы с релятивистской кинематикой.

В физике частиц мы работаем с 4-векторами импульса-энергии. Квадрат инвариантной массы частицы вычисляется по формуле:

Где:

— инвариантная масса частицы.

— полная энергия частицы.

— модуль трехмерного импульса частицы.

В ROOT это делается одной строкой кода, так как класс TLorentzVector уже содержит методы для вычисления M(), Perp(), Eta() и других кинематических переменных.

!Структура хранения данных в ROOT: Дерево, Ветви и Листья.

Geant4: Виртуальная реальность для частиц

Чтобы понять, что мы видим в реальном детекторе, нам нужно сравнить это с тем, что мы ожидаем увидеть. Для этого используется метод Монте-Карло (MC).

Geant4 (GEometry ANd Tracking) — это инструментарий для симуляции прохождения частиц через вещество. С его помощью мы создаем точную цифровую копию детектора NA62.

Как это работает?

Генератор событий: Сначала программа генерирует распад, например, , выбирая импульсы частиц согласно теоретическим распределениям.

Транспорт частиц: Geant4 берет каждую частицу и «ведет» ее через виртуальный детектор шаг за шагом (step by step).

Взаимодействие: На каждом шаге рассчитывается вероятность взаимодействия с материалом (ионизация газа, тормозное излучение, ядерные реакции).

Вероятность взаимодействия на длине пути описывается экспоненциальным законом:

Где:

— вероятность того, что частица провзаимодействует на пути .

— пройденное расстояние в веществе.

— длина свободного пробега (параметр, зависящий от материала и типа частицы).

Если симуляция показывает, что пион оставил след в спектрометре STRAW, но застрял в железной стене мюонного вето (MUV), мы записываем это как виртуальное событие.

Сравнивая реальные данные (Data) и симуляцию (MC), мы можем вычислить аксептанс (Acceptance) — долю событий, которые наш детектор способен зарегистрировать.

!Визуализация взаимодействия частиц с веществом в Geant4.

Фреймворк NA62 (NA62FW)

ROOT и Geant4 — это общие инструменты. Но у каждого эксперимента есть своя специфика. Фреймворк NA62 — это программная надстройка, которая связывает всё воедино. Он написан на C++ и имеет модульную структуру.

Процесс обработки данных делится на три этапа:

1. Реконструкция (Reconstruction)

С детектора приходят сырые байты (Raw Data): номера сработавших проволочек, время прихода сигнала в наносекундах, амплитуда напряжения. Физику это ни о чем не говорит. Задача реконструкции — превратить сигналы электроники в физические объекты.

* Clustering (Кластеризация): Объединение соседних сработавших ячеек калориметра в один кластер энергии. * Tracking (Трекинг): Соединение точек в пространстве (hits) в одну линию — траекторию частицы.

Например, для определения координаты в дрейфовой камере используется время дрейфа электронов :

Где:

— координата прохождения частицы.

— координата сигнальной проволочки.

— скорость дрейфа электронов в газе.

— измеренное время дрейфа.

2. Анализ (Analysis Level)

На этом уровне работает большинство аспирантов. Вы получаете файлы, где уже есть готовые объекты: Ktrack (трек каона), PiTrack (трек пиона), Clusters (кластеры фотонов).

Ваша задача — написать UserAnalyzer. Это класс C++, в котором вы реализуете логику отбора событий (Selection).

Пример логики отбора:

3. Пост-процессинг

На этом этапе создаются финальные графики с использованием ROOT. Вы накладываете данные на симуляцию, вычисляете систематические ошибки и готовите картинки для публикации.

Рабочий процесс (Workflow) аналитика

Как будет выглядеть ваш типичный день работы над PhD?

Написание кода: Вы пишете алгоритм отбора событий на C++, используя классы NA62FW.

Компиляция: Сборка проекта с помощью системы CMake.

Тестовый запуск: Запуск анализа на небольшом куске данных (локально).

Batch Processing: Отправка задачи на компьютерную ферму (GRID или HTCondor), чтобы обработать все данные за год (это может занять дни).

Слияние (Hadd): Объединение тысяч выходных гистограмм в один файл.

Интерпретация: Открытие итогового файла в ROOT и поиск пика сигнала.

Заключение

Программный инструментарий эксперимента NA62 — это сложный, но мощный механизм. ROOT дает нам математический аппарат и средства визуализации, Geant4 позволяет моделировать физические процессы, а фреймворк NA62 превращает сигналы электроники в понятные физические объекты.

В следующей, заключительной части нашего курса мы объединим все знания: теорию, детектор и софт, чтобы провести полный анализ события и понять, как рассчитывается финальный результат эксперимента.

4. Методы отбора событий, подавление фона и идентификация редкого распада заряженного каона

Методы отбора событий, подавление фона и идентификация редкого распада заряженного каона

Мы подошли к кульминации нашего курса. Мы изучили теорию, построили (виртуально) детектор и освоили программный инструментарий. Теперь перед нами стоит главная задача физика-аналитика: найти иголку в стоге сена. А точнее, найти несколько событий распада среди триллионов других распадов.

В этой статье мы разберем стратегию «Слепого анализа», научимся определять сигнальные регионы и узнаем, как отличить пион от мюона с вероятностью ошибки меньше, чем один на десять миллионов.

Философия «Слепого анализа» (Blind Analysis)

Прежде чем писать код отбора, нужно принять важное методологическое решение. В физике редких распадов мы используем технику слепого анализа.

Суть метода проста: мы закрываем (маскируем) ту область данных, где ожидаем увидеть сигнал, и не смотрим туда до самого конца исследования. Мы разрабатываем критерии отбора, калибруем детектор и оцениваем уровень фона, используя только контрольные образцы (control samples) и боковые полосы (sidebands) — области данных, где сигнала точно нет.

Зачем это нужно? Чтобы избежать предвзятости экспериментатора (experimenter's bias). Если бы мы видели сигнальную область в процессе настройки, мы могли бы подсознательно «подкрутить» параметры отбора так, чтобы получить желаемый результат (например, предсказание Стандартной модели).

> «Открытие коробки» (Unblinding) — это торжественный момент, когда алгоритм фиксируется окончательно, маска снимается, и мы видим, что на самом деле поймал детектор.

Топология сигнала

Что мы ищем? Процесс имеет очень простую сигнатуру в детекторе:

Один входящий трек: Каон, зарегистрированный в гигатрекере (GTK).

Один исходящий трек: Пион, зарегистрированный в соломенном спектрометре (STRAW).

Вершина распада: Точка соединения этих двух треков должна находиться внутри вакуумной трубы (Fiducial Volume).

Ничего больше: Никаких фотонов, мюонов или дополнительных заряженных частиц.

Кажется простым, но дьявол кроется в деталях. Основная борьба идет с фонами, которые имитируют эту топологию.

Кинематический отбор:

Главным дискриминатором является квадрат недостающей массы. Напомним формулу:

Где:

— квадрат недостающей массы.

— 4-импульс каона (измерен GTK).

— 4-импульс пиона (измерен STRAW).

Поскольку нейтрино практически не имеют массы, для сигнала теоретическое значение должно быть положительным и распределенным непрерывно (так как это трехчастичный распад).

Однако существуют фоновые процессы, которые имеют четкие пики: * (): (если считать мюон пионом). * (): .

[VISUALIZATION: График распределения квадрата недостающей массы (m_miss^2) для эксперимента NA62. По оси X значения от 0 до 0.1 GeV^2/c^4. По оси Y количество событий (логарифмическая шкала). На графике видны три огромных пика фона: K_mu2 (около 0), K_pi2 (около 0.018) и K_3pi (в начале). Между пиками выделены две заштрихованные области

5. Статистическая обработка данных, слепой анализ и оценка систематических погрешностей результата

Статистическая обработка данных, слепой анализ и оценка систематических погрешностей результата

Поздравляю, коллеги. Мы добрались до финальной стадии нашего интенсивного курса. Мы изучили теоретическую базу, разобрали «железо» детектора NA62, освоили программный фреймворк и научились отбирать события-кандидаты.

Но в физике высоких энергий получить набор событий — это только половина дела. Как доказать, что эти события — действительно редкий распад , а не статистическая флуктуация фона? Как оценить точность нашего измерения? И что делать, если мы вообще не нашли ни одного события?

Сегодня мы превратим наши «сырые» подсчеты в строгий научный результат, достойный публикации в Physical Review Letters.

Стратегия слепого анализа: Математика доверия

В прошлой лекции мы упоминали концепцию «слепого анализа» (Blind Analysis). Теперь давайте разберем её техническую реализацию.

Главная проблема экспериментатора — предвзятость. Если вы знаете, где должен быть сигнал, вы подсознательно будете подбирать критерии отбора так, чтобы этот сигнал «проявился». Чтобы этого избежать, мы маскируем сигнальную область.

Определение областей

Мы работаем в пространстве двух переменных: импульс пиона () и квадрат недостающей массы ().

Сигнальная область (Signal Region): Область значений, где мы ожидаем увидеть согласно моделированию Монте-Карло (MC). Эта область закрыта маской. Мы не видим реальных данных внутри неё до самого конца.

Контрольные области (Control Regions): Области, густо населенные фоновыми процессами (например, пики от и ). Мы используем их для калибровки и проверки наших алгоритмов.

Боковые полосы (Sidebands): Области рядом с сигнальной, но где сигнала быть не должно. Если мы видим там события, значит, наши «хвосты» распределений фона шире, чем мы думали.

!Визуализация концепции слепого анализа с маскированной сигнальной областью и открытыми контрольными регионами.

Оценка фона: Data-Driven методы

Самая большая ошибка новичка — слепо верить симуляции Geant4. Симуляция идеальна, а реальный детектор «шумит», каналы электроники выгорают, а пучок может быть нестабильным. Поэтому количество фоновых событий в сигнальной области оценивается с помощью методов, основанных на данных (Data-Driven).

Рассмотрим метод нормализации.

Допустим, мы хотим оценить количество фоновых событий от распада (), которые «просочились» в нашу сигнальную область из-за ошибок реконструкции.

Мы используем формулу:

Где:

— ожидаемое количество фоновых событий в сигнальной области.

— количество реальных событий, измеренных в контрольной области (например, в пике массы ).

— количество симулированных событий, попавших в сигнальную область.

— количество симулированных событий, попавших в контрольную область.

Дробь называется коэффициентом подавления или экстраполяции. Мы берем форму распределения из Монте-Карло, но нормируем её высоту по реальным данным. Это позволяет компенсировать неточности в значении потока каонов или эффективности триггера.

Single Event Sensitivity (SES)

Прежде чем открывать «черный ящик», мы должны рассчитать чувствительность нашего эксперимента. В эксперименте NA62 используется величина SES (Single Event Sensitivity) — это значение вероятности распада (Branching Ratio), которому соответствовало бы наблюдение ровно одного сигнального события.

Формула для SES:

Где:

— чувствительность одного события.

— полное количество каонов, влетевших в детектор за время эксперимента (обычно порядка ).

— эффективность отбора событий (Selection Efficiency).

— эффективность триггера (Trigger Efficiency).

— геометрический аксептанс (доля распадов, которые геометрически попадают в объем детектора).

Если мы ожидаем, что Стандартная модель верна (), то ожидаемое количество сигнальных событий () будет:

Где:

— ожидаемое число событий сигнала.

— вероятность распада согласно Стандартной модели.

— чувствительность одного события.

Если , мы ожидаем увидеть около 8 событий. Если , мы не увидим ничего, даже если Стандартная модель верна. Наша цель — сделать SES как можно меньше (увеличивая и эффективность).

Систематические погрешности

В любой научной работе результат записывается как:

Где:

— измеренное значение.

— статистическая погрешность.

— систематическая погрешность.

Статистическая погрешность зависит только от количества набранных событий (). Для пуассоновского процесса она приблизительно равна . Чем дольше работает эксперимент, тем меньше эта ошибка.

Систематическая погрешность — это наше незнание о несовершенстве прибора или метода. Она не уменьшается со временем.

Источники систематики в NA62:

Неопределенность внешних параметров: Например, мы используем значение вероятности распада из таблиц PDG (Particle Data Group) для нормализации. Но это табличное значение тоже измерено с ошибкой.

Эффекты наложения (Pile-up): Когда две частицы влетают в детектор одновременно, электроника может неправильно измерить их энергию.

Стабильность энергетической шкалы: Если калибровка калориметра «поплыла» на 1% из-за изменения температуры в зале, это может сместить пик массы и изменить количество фона.

Как оценивают систематику?

Мы проводим тесты на стабильность. Мы намеренно меняем параметры отбора в разумных пределах и смотрим, как меняется результат.

Например, мы требуем, чтобы энергия фотона была меньше 2 ГэВ. Изменим порог на 2.1 ГэВ и 1.9 ГэВ. Если измеренный Branching Ratio скачет на 20%, значит, наш анализ нестабилен, и мы должны включить этот разброс в систематическую ошибку.

Суммарная ошибка вычисляется как квадратичная сумма:

Где:

— полная погрешность измерения.

— статистическая компонента.

— систематическая компонента.

Unblinding: Момент истины

Когда все фоны оценены, систематика посчитана, и статья практически написана, происходит процедура Unblinding (снятие маски).

На собрании коллаборации запускается скрипт без маски. Мы видим события в сигнальной области.

Возможны три сценария:

Событий нет или их мало. Мы устанавливаем Верхний предел (Upper Limit). Мы говорим: «С вероятностью 95% частота распада не превышает ».

Событий столько, сколько предсказывает СМ. Мы подтверждаем Стандартную модель и уточняем параметры матрицы CKM.

Событий значительно больше. Это намек на Новую физику.

Статистическая значимость

Чтобы заявить об открытии, отклонение от фона должно быть значительным. В физике частиц золотым стандартом является 5 сигма ().

Вероятность того, что фон случайно сфлуктуирует на , составляет примерно 1 к 3.5 миллионам.

!Иллюстрация статистической значимости 5 сигма, необходимой для заявления об открытии.

Вычисление финального Branching Ratio

Предположим, мы открыли ящик и увидели событий. Мы оценили фон как . Тогда измеренная вероятность распада:

Примечание: В реальности формула сложнее, так как уже содержит , поэтому часто пишут просто , где — чувствительность нормированная.

Давайте запишем упрощенно, чтобы понять суть:

Где:

— искомый коэффициент ветвления.

— количество «чистых» сигнальных событий (наблюдаемые минус фон).

— полное число каонов.

— полная эффективность регистрации.

Заключение курса

За эти четыре лекции мы прошли путь от абстрактных лагранжианов до конкретных чисел.

Мы поняли, зачем ищем этот распад (тест Стандартной модели).

Мы изучили, чем ищем (детектор NA62).

Мы узнали, как обрабатываем данные (ROOT, C++).

И сегодня мы выяснили, как доказываем свою правоту (статистика).

Анализ данных эксперимента NA62 — это марафон, требующий знаний в квантовой механике, инженерии, программировании и статистике. Теперь у вас есть карта этого маршрута. Осталось только пройти его самостоятельно.

Удачи в защите вашей диссертации!

1. Теоретические основы физики каонов и поиск новой физики за пределами Стандартной модели

Теоретические основы физики каонов и поиск новой физики за пределами Стандартной модели

Введение: Почему NA62 и каоны?

Каоны и кварковая структура

Матрица CKM и смешивание ароматов

Золотой канал: Этот канал распада называют «золотым» по двум причинам: Он чрезвычайно редок. Он теоретически «чист».

Почему он редкий? (FCNC и механизм GIM)

Теоретическое предсказание

Поиск Новой физики (BSM)

Кинематика и недостающая масса

Основные фоновые процессы

Заключение

2. Архитектура детектора NA62, триггерные системы и процесс сбора экспериментальных данных

Архитектура детектора NA62, триггерные системы и процесс сбора экспериментальных данных

Общая концепция: Камера-обскура для частиц

Формирование пучка и идентификация каонов

KTAG: Черенковский детектор

GTK: Гигатрекер

Область распада (Decay Volume)

Спектрометр и идентификация продуктов (Downstream)

STRAW: Соломенный трекер

RICH: Кольцевой черенковский детектор

Системы вето: Охота на фотоны и мюоны

Триггерная система и TDAQ

Уровень 0 (L0 Trigger)

Уровень 1 (L1 Trigger)

Заключение

3. Программный инструментарий: ROOT, Geant4 и фреймворк анализа данных эксперимента NA62

Программный инструментарий: ROOT, Geant4 и фреймворк анализа данных эксперимента NA62

ROOT: Фундамент анализа данных

Почему ROOT?

Основные объекты ROOT

Geant4: Виртуальная реальность для частиц

Как это работает?

Фреймворк NA62 (NA62FW)

1. Реконструкция (Reconstruction)

2. Анализ (Analysis Level)

3. Пост-процессинг

Рабочий процесс (Workflow) аналитика

Заключение

4. Методы отбора событий, подавление фона и идентификация редкого распада заряженного каона

Методы отбора событий, подавление фона и идентификация редкого распада заряженного каона

Философия «Слепого анализа» (Blind Analysis)

Топология сигнала

Кинематический отбор:

5. Статистическая обработка данных, слепой анализ и оценка систематических погрешностей результата

Статистическая обработка данных, слепой анализ и оценка систематических погрешностей результата

Стратегия слепого анализа: Математика доверия

Определение областей

Оценка фона: Data-Driven методы

Single Event Sensitivity (SES)

Систематические погрешности

Источники систематики в NA62:

Как оценивают систематику?

Unblinding: Момент истины

Статистическая значимость

Вычисление финального Branching Ratio

Заключение курса

Золотой канал:
Этот канал распада называют «золотым» по двум причинам:
Он чрезвычайно редок.

Он теоретически «чист».