Интенсивный курс: Анализ данных эксперимента NA62 (PhD за 3 месяца)

Этот курс предлагает ускоренное погружение в физику элементарных частиц с фокусом на эксперимент NA62 в ЦЕРН. Студенты изучат физику редких распадов каонов, работу с детектором, программные инструменты ROOT и методы статистического анализа данных.

1. Теоретические основы физики каонов и поиск новой физики за пределами Стандартной модели

Теоретические основы физики каонов и поиск новой физики за пределами Стандартной модели

Добро пожаловать на интенсивный курс по анализу данных эксперимента NA62. Наша цель — за три месяца пройти путь от базового понимания до уровня, необходимого для защиты PhD в области физики высоких энергий. Мы начинаем с фундамента: почему мы вообще изучаем каоны и как редчайшие процессы могут открыть дверь в Новую физику.

Введение: Почему NA62 и каоны?

Эксперимент NA62 в ЦЕРН (CERN) — это высокоточная установка, расположенная на Протонном суперсинхротроне (SPS). Главная цель эксперимента — измерение вероятности ультраредкого распада положительно заряженного каона на пион и пару нейтрино-антинейтрино: .

Почему физики тратят десятилетия и миллионы евро на изучение именно этого процесса? Ответ кроется в точности. Стандартная модель (СМ) физики элементарных частиц предсказывает вероятность этого распада с беспрецедентной точностью. Любое статистически значимое отклонение экспериментальных данных от этого предсказания станет неопровержимым доказательством существования физики за пределами Стандартной модели.

Каоны и кварковая структура

Чтобы понять динамику распада, нужно разобраться в структуре участвующих частиц. Каоны (K-мезоны) — это адроны, состоящие из одного кварка и одного антикварка.

Положительный каон () имеет следующий кварковый состав:

Где:

  • — положительно заряженный каон.
  • — -кварк (верхний кварк).
  • — -кварк (анти-странный кварк).
  • Пион (), который является продуктом распада, состоит из:

    Где:

  • — положительно заряженный пион.
  • — -кварк.
  • — -кварк (анти-нижний кварк).
  • Таким образом, процесс фундаментально представляет собой превращение странного антикварка () в нижний антикварк (). Это переход между поколениями кварков, который регулируется слабым взаимодействием.

    !Кварковый состав каона и пиона, демонстрирующий изменение странного кварка на нижний.

    Матрица CKM и смешивание ароматов

    В Стандартной модели переходы между кварками описываются матрицей Кабиббо-Кобаяши-Маскавы (CKM). Она определяет силу взаимодействия между кварками разных ароматов.

    Где:

  • — матрица смешивания кварков.
  • Элементы (например, , ) — комплексные числа, модуль которых определяет вероятность перехода кварка типа в кварк типа (или наоборот) при участии -бозона.
  • Для распада ключевую роль играют элементы (связь топ-кварка и странного кварка) и (связь топ-кварка и нижнего кварка), так как доминирующий вклад в процесс вносят петлевые диаграммы с участием тяжелого топ-кварка.

    Золотой канал:

    Этот канал распада называют «золотым» по двум причинам:

  • Он чрезвычайно редок.
  • Он теоретически «чист».
  • Почему он редкий? (FCNC и механизм GIM)

    На фундаментальном уровне распад представляет собой ток, меняющий аромат, но не меняющий электрический заряд (Flavor Changing Neutral Current — FCNC). В Стандартной модели такие процессы запрещены на древесном уровне (то есть в простейшем виде без петель).

    Они могут происходить только за счет квантовых поправок высших порядков — так называемых «пингвинных» диаграмм или диаграмм «ящик» (box diagrams), где участвуют виртуальные тяжелые кварки (, ) и бозоны (, ).

    !Пингвинная диаграмма Фейнмана, описывающая редкий распад каона через квантовую петлю.

    Кроме того, эти процессы сильно подавлены механизмом Глэшоу-Илиопулоса-Майани (GIM). Этот механизм обеспечивает сокращение вкладов от различных кварков в петле, делая итоговую вероятность события ничтожно малой.

    Теоретическое предсказание

    Вероятность распада принято описывать через коэффициент ветвления (Branching Ratio, BR). Для нашего процесса предсказание СМ составляет:

    Где:

  • — вероятность того, что каон распадется именно по этому каналу, а не по какому-либо другому.
  • — индекс, указывающий на предсказание Стандартной модели.
  • Это означает, что из 100 миллиардов распадов каонов, мы ожидаем увидеть всего около 8 событий такого типа. Это поиск иголки не в стоге сена, а в целом поле стогов.

    Поиск Новой физики (BSM)

    Если Стандартная модель так хороша, зачем мы ищем отклонения? Дело в том, что СМ не объясняет ряд фундаментальных явлений: * Темную материю. * Асимметрию материи и антиматерии (нарушение CP-инвариантности). * Массу нейтрино.

    Физика за пределами Стандартной модели (Beyond Standard Model — BSM) предлагает различные расширения теории. Многие из этих теорий предсказывают существование новых частиц, которые могут участвовать в петлевых процессах распада каона.

    Если существуют новые частицы (например, лептокварки, аксионы, темные фотоны или суперсимметричные партнеры), они могут:

  • Изменить частоту распада (увеличить или уменьшить ).
  • Имитировать этот сигнал, если новая частица рождается вместо пары нейтрино: .
  • Кинематика и недостающая масса

    Как мы вообще можем увидеть нейтрино? Ответ прост: никак. Нейтрино не взаимодействуют с детекторами NA62. Мы видим их по отсутствию энергии и импульса.

    Мы измеряем импульс входящего каона () и импульс исходящего пиона (). Затем мы вычисляем квадрат недостающей массы ():

    Где:

  • — квадрат недостающей массы (инвариантная масса системы невидимых частиц).
  • — 4-импульс каона (энергия и трехмерный импульс).
  • — 4-импульс пиона.
  • В системе покоя, если мы пренебрежем массой нейтрино, формула упрощается. Анализ распределения является главным инструментом анализа.

    * Для распада спектр недостающей массы непрерывен (так как улетают три частицы: пион и два нейтрино). * Для фоновых распадов (например, ) спектр имеет пики в конкретных значениях массы.

    > «Мы ищем то, чего нет, чтобы понять то, что есть». — Поговорка физиков-экспериментаторов.

    Основные фоновые процессы

    Главный враг эксперимента NA62 — это другие, гораздо более частые распады каонов, которые могут имитировать сигнал. Самые опасные из них:

  • (): Самый частый распад (BR ). Если мюон ошибочно идентифицирован как пион, это создает ложный сигнал.
  • (): Частый распад (BR ). Если фотоны от распада не зарегистрированы детекторами, событие выглядит как плюс недостающая энергия.
  • Борьба с этими фонами требует феноменальной работы детекторов: системы идентификации частиц (чтобы отличить от ) и системы вето фотонов (чтобы не пропустить ни одного ).

    Заключение

    Теоретическая база эксперимента NA62 строится на прецизионной проверке Стандартной модели через петлевые процессы FCNC. Изучая редчайший распад , мы получаем доступ к физике сверхвысоких энергий, недоступной для прямых наблюдений на коллайдерах. Любое отклонение от станет указанием на существование новых частиц или взаимодействий.

    В следующей статье мы разберем устройство детектора NA62 и то, как инженеры и физики воплотили эти теоретические требования в железе.

    2. Архитектура детектора NA62, триггерные системы и процесс сбора экспериментальных данных

    Архитектура детектора NA62, триггерные системы и процесс сбора экспериментальных данных

    В предыдущей статье мы выяснили, что поиск «Золотого канала» требует исключительной точности. Мы ищем событие с вероятностью на фоне миллиардов других распадов. Чтобы реализовать это на практике, физикам и инженерам пришлось построить уникальную установку.

    Сегодня мы разберем «железо» эксперимента NA62: как мы видим невидимое, зачем детектору вакуум и как электроника принимает решение о сохранении события за микросекунды.

    Общая концепция: Камера-обскура для частиц

    Эксперимент NA62 — это не классический коллайдерный детектор (как ATLAS или CMS), который окружает точку столкновения сферой. NA62 — это детектор с фиксированной мишенью. Он вытянут в длину почти на 270 метров.

    Главная задача установки — восстановить кинематику реакции, чтобы вычислить квадрат недостающей массы:

    Где:

  • — квадрат недостающей массы.
  • — 4-импульс входящего каона (энергия и импульс до распада).
  • — 4-импульс исходящего пиона (энергия и импульс после распада).
  • Следовательно, детектор функционально делится на две части:

  • Upstream (Вверх по потоку): Измеряет и определяет тип частицы.
  • Downstream (Вниз по потоку): Измеряет и идентифицирует продукты распада.
  • !Схема экспериментальной установки NA62, показывающая расположение основных детекторов вдоль оси пучка.

    Формирование пучка и идентификация каонов

    Всё начинается с ускорителя SPS (Super Proton Synchrotron) в ЦЕРН. Протоны с энергией 400 ГэВ (гигаэлектронвольт) ударяют в бериллиевую мишень. В результате столкновения рождается «зоопарк» вторичных частиц: пионы, протоны, каоны и другие.

    С помощью магнитов мы отбираем положительно заряженные частицы с импульсом . Однако в этом пучке каонов всего около 6%. Остальное — пионы и протоны. Нам нужно знать, какая именно частица влетела в установку.

    KTAG: Черенковский детектор

    Для этого используется детектор KTAG (Kaon Tagger). Он работает на основе эффекта Черенкова. Когда частица летит в среде быстрее скорости света в этой среде, она испускает световой конус (аналог звукового удара).

    Угол излучения зависит от скорости частицы:

    Где:

  • — угол излучения черенковского света.
  • — показатель преломления среды (газа внутри детектора).
  • — скорость частицы в единицах скорости света ().
  • Поскольку при одинаковом импульсе () каоны, пионы и протоны имеют разные массы, их скорости () различаются. KTAG настроен так, чтобы «видеть» свет только от каонов. Это позволяет нам поставить метку времени: «В этот момент пролетел каон».

    GTK: Гигатрекер

    Зная, что это каон, нам нужно точно измерить его импульс и направление. Для этого используется GTK (GigaTracker). Это три станции кремниевых пиксельных детекторов, стоящих на пути пучка.

    GTK — это технологическое чудо. Он должен выдерживать поток в 750 миллионов частиц в секунду, измерять время с точностью до 200 пикосекунд и при этом быть максимально тонким, чтобы не рассеивать пучок. Если каон столкнется с материалом детектора, он может распасться не так, как нам нужно, создав фон.

    Область распада (Decay Volume)

    После прохождения GTK каоны попадают в 65-метровую вакуумную трубу. Вакуум необходим критически. Если бы там был воздух, каоны сталкивались бы с молекулами газа, имитируя редкие распады.

    Давление в этой трубе составляет порядка миллибар (глубокий вакуум).

    Спектрометр и идентификация продуктов (Downstream)

    Если каон распался в трубе, продукты распада летят дальше. Нам нужно поймать пион () и доказать, что это именно пион, а не мюон или электрон.

    STRAW: Соломенный трекер

    Чтобы измерить импульс пиона (), используется магнитный спектрометр STRAW. Он состоит из тысяч тонких трубок («соломинок»), наполненных газом. Когда заряженная частица пролетает сквозь трубку, она ионизирует газ, и мы регистрируем электрический сигнал.

    Спектрометр находится внутри вакуумного объема (уникальная особенность NA62), чтобы минимизировать многократное рассеяние, которое ухудшает точность измерения импульса.

    RICH: Кольцевой черенковский детектор

    Мы измерили импульс. Но кто летит? Пион или мюон? При одном и том же импульсе мюон легче пиона, а значит, летит быстрее. Детектор RICH (Ring Imaging Cherenkov) измеряет радиус кольца черенковского света.

    Радиус кольца связан со скоростью частицы:

    Где:

  • — радиус кольца света на фотодетекторах.
  • — фокусное расстояние зеркала.
  • — черенковский угол (зависящий от скорости).
  • RICH позволяет отличить пион от мюона с вероятностью ошибки менее .

    Системы вето: Охота на фотоны и мюоны

    Вспомним главный фоновый процесс: . Нейтральный пион () мгновенно распадается на два фотона (). Чтобы отсеять этот фон, нам нужно детектировать эти фотоны. Если мы видим пион и хотя бы один фотон — это не наш сигнал.

  • LKr (Жидкокриптоновый калориметр): Огромный бак с жидким криптоном. Он поглощает фотоны и измеряет их энергию с высочайшей точностью. Эффективность регистрации фотонов здесь достигает .
  • LAV (Large Angle Veto): 12 кольцевых станций вдоль вакуумной трубы, перехватывающих фотоны, летящие под большими углами.
  • MUV (Muon Veto): Система детекторов за толстой железной стеной в конце установки. Пионы застревают в железе, а мюоны проходят сквозь него. Если MUV сработал — событие отбрасывается.
  • !Структура электромагнитного калориметра на жидком криптоне для регистрации фотонов.

    Триггерная система и TDAQ

    Детекторы генерируют огромный поток данных. Частота входных событий — около 10 МГц (10 миллионов событий в секунду). Записать всё это на диск невозможно технически и финансово.

    Здесь вступает в игру система триггеров (Trigger and Data Acquisition — TDAQ). Это фильтр, который решает: «Интересное это событие или мусор?».

    Уровень 0 (L0 Trigger)

    Это аппаратный уровень (FPGA — программируемые логические матрицы). Он принимает решения за доли микросекунды. * Логика: «Есть сигнал в RICH? Нет сигнала в MUV? Есть энергия в калориметре?» * Коэффициент подавления: Снижает поток с 10 МГц до 1 МГц.

    Уровень 1 (L1 Trigger)

    Это программный уровень. Данные, прошедшие L0, отправляются на ферму компьютеров. Здесь запускаются упрощенные алгоритмы реконструкции траекторий. * Логика: «Совпадает ли трек в GTK с треком в STRAW?» * Коэффициент подавления: Снижает поток до ~100 кГц.

    Только события, прошедшие оба уровня, записываются на ленточные накопители в компьютерном центре ЦЕРН для дальнейшего анализа.

    Заключение

    Архитектура NA62 — это компромисс между точностью измерения (для расчета ) и герметичностью (для вето фоновых частиц). Каждый детектор выполняет свою узкую задачу, но только вместе они позволяют увидеть редчайший распад .

    Теперь, когда мы понимаем, как установка собирает данные, в следующей части курса мы перейдем к самому интересному — программному анализу. Мы узнаем, как из сырых байтов восстановить физические величины и как отделить зерна от плевел с помощью статистических методов.

    3. Программный инструментарий: ROOT, Geant4 и фреймворк анализа данных эксперимента NA62

    Программный инструментарий: ROOT, Geant4 и фреймворк анализа данных эксперимента NA62

    В предыдущих частях нашего интенсивного курса мы изучили теоретическую физику редких распадов и разобрали аппаратную архитектуру детектора NA62. Теперь перед нами встает практическая задача: как превратить петабайты сырых данных, поступающих с детектора, в научный результат — график, таблицу или значение вероятности распада?

    Физика высоких энергий (HEP — High Energy Physics) неразрывно связана с программированием. В этой статье мы познакомимся с «большой тройкой» инструментов любого физика в ЦЕРН: библиотекой ROOT, симулятором Geant4 и специфическим программным обеспечением коллаборации NA62.

    ROOT: Фундамент анализа данных

    Если вы спросите физика-экспериментатора, на чем держится современная наука, он ответит: «На C++ и ROOT».

    ROOT — это объектно-ориентированный фреймворк, разработанный в ЦЕРН для обработки и анализа больших объемов данных. Это не просто библиотека для построения графиков, это полноценная экосистема, включающая в себя интерпретатор C++, средства ввода-вывода данных, математические библиотеки и инструменты визуализации.

    Почему ROOT?

    Эксперимент NA62 записывает миллиарды событий. Стандартные форматы данных (CSV, JSON, XML) здесь неприменимы из-за их огромного объема и медленной скорости чтения. ROOT предлагает свой формат файлов (.root) и структуру данных, называемую TTree (Дерево).

    TTree оптимизировано для колоночного доступа. Представьте себе таблицу, где строки — это события (столкновения частиц), а столбцы — параметры (энергия, импульс, время). Если вам нужно построить гистограмму энергии пиона, ROOT позволяет считать с диска только один столбец «Энергия», не загружая в память остальные терабайты информации. Это ускоряет анализ в тысячи раз.

    Основные объекты ROOT

  • TH1 (Histogram): Одномерная гистограмма. Основной способ визуализации распределений.
  • TF1 (Function): Математическая функция для аппроксимации (фиттинга) данных.
  • TLorentzVector: Класс для работы с релятивистской кинематикой.
  • В физике частиц мы работаем с 4-векторами импульса-энергии. Квадрат инвариантной массы частицы вычисляется по формуле:

    Где:

  • — инвариантная масса частицы.
  • — полная энергия частицы.
  • — модуль трехмерного импульса частицы.
  • В ROOT это делается одной строкой кода, так как класс TLorentzVector уже содержит методы для вычисления M(), Perp(), Eta() и других кинематических переменных.

    !Структура хранения данных в ROOT: Дерево, Ветви и Листья.

    Geant4: Виртуальная реальность для частиц

    Чтобы понять, что мы видим в реальном детекторе, нам нужно сравнить это с тем, что мы ожидаем увидеть. Для этого используется метод Монте-Карло (MC).

    Geant4 (GEometry ANd Tracking) — это инструментарий для симуляции прохождения частиц через вещество. С его помощью мы создаем точную цифровую копию детектора NA62.

    Как это работает?

  • Генератор событий: Сначала программа генерирует распад, например, , выбирая импульсы частиц согласно теоретическим распределениям.
  • Транспорт частиц: Geant4 берет каждую частицу и «ведет» ее через виртуальный детектор шаг за шагом (step by step).
  • Взаимодействие: На каждом шаге рассчитывается вероятность взаимодействия с материалом (ионизация газа, тормозное излучение, ядерные реакции).
  • Вероятность взаимодействия на длине пути описывается экспоненциальным законом:

    Где:

  • — вероятность того, что частица провзаимодействует на пути .
  • — пройденное расстояние в веществе.
  • — длина свободного пробега (параметр, зависящий от материала и типа частицы).
  • Если симуляция показывает, что пион оставил след в спектрометре STRAW, но застрял в железной стене мюонного вето (MUV), мы записываем это как виртуальное событие.

    Сравнивая реальные данные (Data) и симуляцию (MC), мы можем вычислить аксептанс (Acceptance) — долю событий, которые наш детектор способен зарегистрировать.

    !Визуализация взаимодействия частиц с веществом в Geant4.

    Фреймворк NA62 (NA62FW)

    ROOT и Geant4 — это общие инструменты. Но у каждого эксперимента есть своя специфика. Фреймворк NA62 — это программная надстройка, которая связывает всё воедино. Он написан на C++ и имеет модульную структуру.

    Процесс обработки данных делится на три этапа:

    1. Реконструкция (Reconstruction)

    С детектора приходят сырые байты (Raw Data): номера сработавших проволочек, время прихода сигнала в наносекундах, амплитуда напряжения. Физику это ни о чем не говорит. Задача реконструкции — превратить сигналы электроники в физические объекты.

    * Clustering (Кластеризация): Объединение соседних сработавших ячеек калориметра в один кластер энергии. * Tracking (Трекинг): Соединение точек в пространстве (hits) в одну линию — траекторию частицы.

    Например, для определения координаты в дрейфовой камере используется время дрейфа электронов :

    Где:

  • — координата прохождения частицы.
  • — координата сигнальной проволочки.
  • — скорость дрейфа электронов в газе.
  • — измеренное время дрейфа.
  • 2. Анализ (Analysis Level)

    На этом уровне работает большинство аспирантов. Вы получаете файлы, где уже есть готовые объекты: Ktrack (трек каона), PiTrack (трек пиона), Clusters (кластеры фотонов).

    Ваша задача — написать UserAnalyzer. Это класс C++, в котором вы реализуете логику отбора событий (Selection).

    Пример логики отбора:

    3. Пост-процессинг

    На этом этапе создаются финальные графики с использованием ROOT. Вы накладываете данные на симуляцию, вычисляете систематические ошибки и готовите картинки для публикации.

    Рабочий процесс (Workflow) аналитика

    Как будет выглядеть ваш типичный день работы над PhD?

  • Написание кода: Вы пишете алгоритм отбора событий на C++, используя классы NA62FW.
  • Компиляция: Сборка проекта с помощью системы CMake.
  • Тестовый запуск: Запуск анализа на небольшом куске данных (локально).
  • Batch Processing: Отправка задачи на компьютерную ферму (GRID или HTCondor), чтобы обработать все данные за год (это может занять дни).
  • Слияние (Hadd): Объединение тысяч выходных гистограмм в один файл.
  • Интерпретация: Открытие итогового файла в ROOT и поиск пика сигнала.
  • Заключение

    Программный инструментарий эксперимента NA62 — это сложный, но мощный механизм. ROOT дает нам математический аппарат и средства визуализации, Geant4 позволяет моделировать физические процессы, а фреймворк NA62 превращает сигналы электроники в понятные физические объекты.

    В следующей, заключительной части нашего курса мы объединим все знания: теорию, детектор и софт, чтобы провести полный анализ события и понять, как рассчитывается финальный результат эксперимента.

    4. Методы отбора событий, подавление фона и идентификация редкого распада заряженного каона

    Методы отбора событий, подавление фона и идентификация редкого распада заряженного каона

    Мы подошли к кульминации нашего курса. Мы изучили теорию, построили (виртуально) детектор и освоили программный инструментарий. Теперь перед нами стоит главная задача физика-аналитика: найти иголку в стоге сена. А точнее, найти несколько событий распада среди триллионов других распадов.

    В этой статье мы разберем стратегию «Слепого анализа», научимся определять сигнальные регионы и узнаем, как отличить пион от мюона с вероятностью ошибки меньше, чем один на десять миллионов.

    Философия «Слепого анализа» (Blind Analysis)

    Прежде чем писать код отбора, нужно принять важное методологическое решение. В физике редких распадов мы используем технику слепого анализа.

    Суть метода проста: мы закрываем (маскируем) ту область данных, где ожидаем увидеть сигнал, и не смотрим туда до самого конца исследования. Мы разрабатываем критерии отбора, калибруем детектор и оцениваем уровень фона, используя только контрольные образцы (control samples) и боковые полосы (sidebands) — области данных, где сигнала точно нет.

    Зачем это нужно? Чтобы избежать предвзятости экспериментатора (experimenter's bias). Если бы мы видели сигнальную область в процессе настройки, мы могли бы подсознательно «подкрутить» параметры отбора так, чтобы получить желаемый результат (например, предсказание Стандартной модели).

    > «Открытие коробки» (Unblinding) — это торжественный момент, когда алгоритм фиксируется окончательно, маска снимается, и мы видим, что на самом деле поймал детектор.

    Топология сигнала

    Что мы ищем? Процесс имеет очень простую сигнатуру в детекторе:

  • Один входящий трек: Каон, зарегистрированный в гигатрекере (GTK).
  • Один исходящий трек: Пион, зарегистрированный в соломенном спектрометре (STRAW).
  • Вершина распада: Точка соединения этих двух треков должна находиться внутри вакуумной трубы (Fiducial Volume).
  • Ничего больше: Никаких фотонов, мюонов или дополнительных заряженных частиц.
  • Кажется простым, но дьявол кроется в деталях. Основная борьба идет с фонами, которые имитируют эту топологию.

    Кинематический отбор:

    Главным дискриминатором является квадрат недостающей массы. Напомним формулу:

    Где:

  • — квадрат недостающей массы.
  • — 4-импульс каона (измерен GTK).
  • — 4-импульс пиона (измерен STRAW).
  • Поскольку нейтрино практически не имеют массы, для сигнала теоретическое значение должно быть положительным и распределенным непрерывно (так как это трехчастичный распад).

    Однако существуют фоновые процессы, которые имеют четкие пики: * (): (если считать мюон пионом). * (): .

    [VISUALIZATION: График распределения квадрата недостающей массы (m_miss^2) для эксперимента NA62. По оси X значения от 0 до 0.1 GeV^2/c^4. По оси Y количество событий (логарифмическая шкала). На графике видны три огромных пика фона: K_mu2 (около 0), K_pi2 (около 0.018) и K_3pi (в начале). Между пиками выделены две заштрихованные области

    5. Статистическая обработка данных, слепой анализ и оценка систематических погрешностей результата

    Статистическая обработка данных, слепой анализ и оценка систематических погрешностей результата

    Поздравляю, коллеги. Мы добрались до финальной стадии нашего интенсивного курса. Мы изучили теоретическую базу, разобрали «железо» детектора NA62, освоили программный фреймворк и научились отбирать события-кандидаты.

    Но в физике высоких энергий получить набор событий — это только половина дела. Как доказать, что эти события — действительно редкий распад , а не статистическая флуктуация фона? Как оценить точность нашего измерения? И что делать, если мы вообще не нашли ни одного события?

    Сегодня мы превратим наши «сырые» подсчеты в строгий научный результат, достойный публикации в Physical Review Letters.

    Стратегия слепого анализа: Математика доверия

    В прошлой лекции мы упоминали концепцию «слепого анализа» (Blind Analysis). Теперь давайте разберем её техническую реализацию.

    Главная проблема экспериментатора — предвзятость. Если вы знаете, где должен быть сигнал, вы подсознательно будете подбирать критерии отбора так, чтобы этот сигнал «проявился». Чтобы этого избежать, мы маскируем сигнальную область.

    Определение областей

    Мы работаем в пространстве двух переменных: импульс пиона () и квадрат недостающей массы ().

  • Сигнальная область (Signal Region): Область значений, где мы ожидаем увидеть согласно моделированию Монте-Карло (MC). Эта область закрыта маской. Мы не видим реальных данных внутри неё до самого конца.
  • Контрольные области (Control Regions): Области, густо населенные фоновыми процессами (например, пики от и ). Мы используем их для калибровки и проверки наших алгоритмов.
  • Боковые полосы (Sidebands): Области рядом с сигнальной, но где сигнала быть не должно. Если мы видим там события, значит, наши «хвосты» распределений фона шире, чем мы думали.
  • !Визуализация концепции слепого анализа с маскированной сигнальной областью и открытыми контрольными регионами.

    Оценка фона: Data-Driven методы

    Самая большая ошибка новичка — слепо верить симуляции Geant4. Симуляция идеальна, а реальный детектор «шумит», каналы электроники выгорают, а пучок может быть нестабильным. Поэтому количество фоновых событий в сигнальной области оценивается с помощью методов, основанных на данных (Data-Driven).

    Рассмотрим метод нормализации.

    Допустим, мы хотим оценить количество фоновых событий от распада (), которые «просочились» в нашу сигнальную область из-за ошибок реконструкции.

    Мы используем формулу:

    Где:

  • — ожидаемое количество фоновых событий в сигнальной области.
  • — количество реальных событий, измеренных в контрольной области (например, в пике массы ).
  • — количество симулированных событий, попавших в сигнальную область.
  • — количество симулированных событий, попавших в контрольную область.
  • Дробь называется коэффициентом подавления или экстраполяции. Мы берем форму распределения из Монте-Карло, но нормируем её высоту по реальным данным. Это позволяет компенсировать неточности в значении потока каонов или эффективности триггера.

    Single Event Sensitivity (SES)

    Прежде чем открывать «черный ящик», мы должны рассчитать чувствительность нашего эксперимента. В эксперименте NA62 используется величина SES (Single Event Sensitivity) — это значение вероятности распада (Branching Ratio), которому соответствовало бы наблюдение ровно одного сигнального события.

    Формула для SES:

    Где:

  • — чувствительность одного события.
  • — полное количество каонов, влетевших в детектор за время эксперимента (обычно порядка ).
  • — эффективность отбора событий (Selection Efficiency).
  • — эффективность триггера (Trigger Efficiency).
  • — геометрический аксептанс (доля распадов, которые геометрически попадают в объем детектора).
  • Если мы ожидаем, что Стандартная модель верна (), то ожидаемое количество сигнальных событий () будет:

    Где:

  • — ожидаемое число событий сигнала.
  • — вероятность распада согласно Стандартной модели.
  • — чувствительность одного события.
  • Если , мы ожидаем увидеть около 8 событий. Если , мы не увидим ничего, даже если Стандартная модель верна. Наша цель — сделать SES как можно меньше (увеличивая и эффективность).

    Систематические погрешности

    В любой научной работе результат записывается как:

    Где:

  • — измеренное значение.
  • — статистическая погрешность.
  • — систематическая погрешность.
  • Статистическая погрешность зависит только от количества набранных событий (). Для пуассоновского процесса она приблизительно равна . Чем дольше работает эксперимент, тем меньше эта ошибка.

    Систематическая погрешность — это наше незнание о несовершенстве прибора или метода. Она не уменьшается со временем.

    Источники систематики в NA62:

  • Неопределенность внешних параметров: Например, мы используем значение вероятности распада из таблиц PDG (Particle Data Group) для нормализации. Но это табличное значение тоже измерено с ошибкой.
  • Эффекты наложения (Pile-up): Когда две частицы влетают в детектор одновременно, электроника может неправильно измерить их энергию.
  • Стабильность энергетической шкалы: Если калибровка калориметра «поплыла» на 1% из-за изменения температуры в зале, это может сместить пик массы и изменить количество фона.
  • Как оценивают систематику?

    Мы проводим тесты на стабильность. Мы намеренно меняем параметры отбора в разумных пределах и смотрим, как меняется результат.

    Например, мы требуем, чтобы энергия фотона была меньше 2 ГэВ. Изменим порог на 2.1 ГэВ и 1.9 ГэВ. Если измеренный Branching Ratio скачет на 20%, значит, наш анализ нестабилен, и мы должны включить этот разброс в систематическую ошибку.

    Суммарная ошибка вычисляется как квадратичная сумма:

    Где:

  • — полная погрешность измерения.
  • — статистическая компонента.
  • — систематическая компонента.
  • Unblinding: Момент истины

    Когда все фоны оценены, систематика посчитана, и статья практически написана, происходит процедура Unblinding (снятие маски).

    На собрании коллаборации запускается скрипт без маски. Мы видим события в сигнальной области.

    Возможны три сценария:

  • Событий нет или их мало. Мы устанавливаем Верхний предел (Upper Limit). Мы говорим: «С вероятностью 95% частота распада не превышает ».
  • Событий столько, сколько предсказывает СМ. Мы подтверждаем Стандартную модель и уточняем параметры матрицы CKM.
  • Событий значительно больше. Это намек на Новую физику.
  • Статистическая значимость

    Чтобы заявить об открытии, отклонение от фона должно быть значительным. В физике частиц золотым стандартом является 5 сигма ().

    Вероятность того, что фон случайно сфлуктуирует на , составляет примерно 1 к 3.5 миллионам.

    !Иллюстрация статистической значимости 5 сигма, необходимой для заявления об открытии.

    Вычисление финального Branching Ratio

    Предположим, мы открыли ящик и увидели событий. Мы оценили фон как . Тогда измеренная вероятность распада:

    Примечание: В реальности формула сложнее, так как уже содержит , поэтому часто пишут просто , где — чувствительность нормированная.

    Давайте запишем упрощенно, чтобы понять суть:

    Где:

  • — искомый коэффициент ветвления.
  • — количество «чистых» сигнальных событий (наблюдаемые минус фон).
  • — полное число каонов.
  • — полная эффективность регистрации.
  • Заключение курса

    За эти четыре лекции мы прошли путь от абстрактных лагранжианов до конкретных чисел.

  • Мы поняли, зачем ищем этот распад (тест Стандартной модели).
  • Мы изучили, чем ищем (детектор NA62).
  • Мы узнали, как обрабатываем данные (ROOT, C++).
  • И сегодня мы выяснили, как доказываем свою правоту (статистика).
  • Анализ данных эксперимента NA62 — это марафон, требующий знаний в квантовой механике, инженерии, программировании и статистике. Теперь у вас есть карта этого маршрута. Осталось только пройти его самостоятельно.

    Удачи в защите вашей диссертации!