1. Таксономия и идентификация доминирующих групп архей
Таксономия и идентификация доминирующих групп архей
Почему при секвенировании образца из любой точки планеты — от глубоководных гидротермальных источников до садовой почвы — вы почти гарантированно обнаружите архей, но при этом классифицировать их будет сложнее, чем бактерий? Ответ кроется в уникальной таксономической истории домена Archaea, где пересмотры классификации происходят каждые несколько лет, а границы между группами постоянно уточняются.
Пять ключевых групп: кто они и почему именно они
В метагеномных исследованиях пять групп архей встречаются настолько часто, что их можно считать «базовым набором» для профилирования. Каждая из них занимает определённую ветвь в филогенетическом дереве и обладает характерными таксономическими маркерами.
Thaumarchaeota — самая многочисленная по числу описанных видов группа среди архей. Первоначально включалась в состав Crenarchaeota, но молекулярно-филогенетический анализ рибосомных белков и липидной мембраны показал, что это самостоятельная линия. В 2017 году предложено объединить Thaumarchaeota с Aigarchaeota, Crenarchaeota и Korarchaeota в надтип TACK, но в практике метагеномного профилирования термин Thaumarchaeota по-прежнему используется как оперативная таксономическая единица.
Euryarchaeota — крупнейший и наиболее разнообразный тип архей. Включает метаногены, галофилы, термоацидофилы и сульфатредукторы. Именно здесь находятся Methanobacteria, Halobacteria и Thermoplasmata — группы, которые обнаруживаются в метагеномных данных от кишечника млекопитающих до соляных озёр.
Asgardarchaeota — открыты в 2015 году при анализе метагеномных сборок из осадков. Эта группа произвела революцию в понимании эукариогенеза, поскольку содержит гены, ранее считавшиеся уникальными для эукариот. Включает подгруппы Loki-, Thor-, Heimdall- и Odinarchaeota.
Crenarchaeota — в узком смысле (после выделения Thaumarchaeota) объединяет преимущественно термофильные и гипертермофильные виды. Ключевые представители — Sulfolobus, Thermoproteus, Pyrobaculum.
Nanoarchaeota — крошечные облигатные симбионты, впервые описанные в 2002 году (Nanoarchaeum equitans). Их геном редуцирован до ~490 тыс. п.о., что делает их одним из самых маленьких свободноживущих клеточных организмов.
Методы таксономической идентификации
На практике идентификация архей в метагеномных данных опирается на несколько уровней анализа.
16S рРНК-анализ остаётся «золотым стандартом» для таксономической классификации. Архейные 16S рРНК-гены содержат консервативные и гипервариабельные области (V1–V9), причём для архей оптимальными считаются области V3–V4 и V4–V5. Базы данных SILVA и GTDB содержат более 500 000 архейных последовательностей 16S рРНК, что позволяет проводить классификацию с разрешением до рода.
Маркерные белки — альтернатива 16S рРНК для таксономии на уровне надтипов. Для архей наиболее информативны:
GTDB (Genome Taxonomy Database) — современная таксономическая система, основанная на филогении целых геномов, а не только 16S рРНК. В GTDB архейные таксоны определяются по средней нуклеотидной идентичности (ANI) и доле консервативных маркерных белков. Именно GTDB-таксономия рекомендуется для метагеномных исследований, поскольку она устраняет многие противоречия классической таксономии.
Практическая идентификация: пошаговый алгоритм
При работе с метагеномными данными таксономическая идентификация архей проходит через несколько этапов:
> Ключевая ловушка: архейные 16S рРНК-последовательности часто неправильно классифицируются пайплайнами, оптимизированными под бактерии. Инструменты типа QIIME2 с базой SILVA или Kraken2 с кастомной базой архей дают значительно лучшие результаты, чем универсальные классификаторы.
Таксономические границы в движении
Архейная таксономия — это живая система. Например, Thaumarchaeota формально были «поглощены» надтипом TACK в GTDB, но в литературе и базах данных термин продолжает использоваться. Аналогично, Asgardarchaeota в одних классификациях рассматриваются как самостоятельный тип, в других — как подгруппа Euryarchaeota. Для метагеномного профилирования это означает необходимость указывать версию таксономической базы и метод классификации в каждом исследовании.