Науки о жизни
0

Позднее приобретение митохондрий организмом-хозяином с химерной прокариотической родословной

by editorАпрель 7, 2016

Происхождение эукариот — один из важнейших вопросов в биологии. Текущие данные указывают на то, что последний общий предок эукариот уже обладал многими ключевыми признаками эукариот, в том числе и сложной внутриклеточной организацией. Кроме того, отсутствие промежуточных эволюционных форм усложняет выявление порядка возникновения характерных черт эукариот. Митохондрии — повсеместно встречающиеся органеллы, берущие свое начало от эндосимбиотических альфапротеобактерий. Существует множество противоречащих друг другу гипотез относительно того, в какой именно период эукариогенеза были приобретены митохондрии. Похожие разногласия также возникают относительно природы и сложности строения организма-хозяина: предполагается, что это мог быть как простой прокариот, так и уже достаточно сложный прото-эукариот. Большинство альтернативных гипотез можно условно разделить на “мито-ранние”, которые считают движущей силой эукариогенеза митохондриальный эндосимбиоз альфапротеобактерии с хозяином, имеющим простую организацию, и “мито-поздние”, в которых постулируется, что организм-хозяин был достаточно сложен ещё до начала митохондриального эндосимбиоза. В этой статье представлены доказательства позднего митохондриального эндосимбиоза. Авторы использовали методы филогеномики, чтобы напрямую проверить, были ли приобретены протомитохондриальные белки раньше или позже остальных белков последнего общего предка эукариот (LECA = last eucaryotic common ancestor). Ими было обнаружено, что филогенетическое расстояние между происходящими от альфапротеобактерий и локализующимися в митохондриях белковыми семействами LECA и белковыми семействами ближайших родственных LECA альфапротеобактерий организмов меньше, чем то же расстояние, рассчитанное для белков других прокариот или белков с иной локализацией. В целом, результаты авторов проливают новый свет на давний вопрос, предоставляя убедительные доказательства в пользу гипотезы позднего приобретения митохондрий организмом-хозяином, который к тому моменту уже имел филогенетически химерный протеом. Авторы статьи утверждают, что митохондриальный эндосимбиоз был одним из конечных этапов эукариогенеза и что он обеспечил окончательное селективное превосходство несущих митохондрии эукариот над менее сложными формами жизни.

В ходе предыдущих анализов был сделан вывод о том, что протеом последнего общего предка эукариот (LECA) имеет неоднородное филогенетическое происхождение. Следует отметить, что связь с альфапротеобактериями (той самой группой бактерий, от которой произошли митохондрии) можно проследить лишь для некоторых белков бактериального происхождения. Объяснить следы других бактерий в протеоме LECA пытались с помощью горизонтального переноса генов (HGT), филогенетическими помехами или дополнительными симбиотическими партнерами; не исключалась также возможность того, что частично эта разнородность уже могла присутствовать в предполагаемом архее-хозяине. Ключом к проверке взаимоисключающих гипотез эукариогенеза является разрешение вопроса о том, были ли белки бактериального происхождения приобретены LECA единовременно и в большом количестве, или нет. Целью этой работы является оценка и сравнение эволюционного расстояния между белками LECA альфапротеобактериального происхождения, их ближайшими родственными белками и белками LECA иного происхождения. Кроме того, необходимо определить, демонстрируют ли белки альфапротеобактериального происхождения определенные закономерности, связанные с их местоположением в клетке. Для этого авторы исследовали филогенетический сигнал из предполагаемых протеомов LECA (см. методы). Сначала были сделаны предположения относительно вероятного филогенетического происхождения каждого семейства LECA путем оценки таксономического распределения прокариотических последовательностей аминокислот в белках, обнаруживаемых у ближайших соседей по филогенетическому древу (см. методы и рис. 1а). Затем была установлена величина филогенетического расстояния для ветви, соответствующей семейству LECA и связывающей ее с последним общим прокариотическим предком, которого LECA разделяет с близкородственными ей прокариотами (приблизительная длина ветви, рисунок 1а). Длина ветви указывает на число предполагаемых замещений в определенных сайтах, которое отражает как время дивергенции, так и скорость эволюции. Чтобы оценить время независимо от скорости, которая может меняться от семейства к семейству, авторы нормализовали приблизительную длину ветви с учетом медианы длин ветвей в пределах семейства LECA (ebl). Они использовали эту величину (далее именуемую “длина ветви”, sl) как меру филогенетического расстояния между данным белковым семейством LECA и его последним общим с прокариотами предком. Конкурирующие мито-ранние и мито-поздние гипотезы, естественно, различаются прогнозируемыми результатами длин ветвей для белков прото-митохондриального происхождения в сравнении с белками, которые предположительно имеют иное происхождение. Так как в модели простого слияния прото-митохондрии являются основным источником белков бактериального происхождения в LECA, если она верна, длины ветвей всех белков бактериального происхождения должны быть приблизительно равны. Напротив, в моделях, которые опираются на существование в разное время нескольких “волн” приобретения генов, ожидаемы значительные различия в длинах ветвей. Авторы оценили различия в длинах ветвей, функциях белков и внутриклеточной локализации среди 1,078 семейств LECA различного происхождения.

Источник: журнал Nature

Источник: журнал Nature

Рисунок 1. Анализ длины ветви.
а. Схематическое представление заключения о филогенетическом происхождении групп белков LECA и измеренные филогенетические расстояния. Первые монофилетические группы эукариотических белков, которые прошли необходимые пороговые значения, были определены как присутствующие в LECA семейства белков (фиолетовый бокс). Таксономический ряд белков, представленных в ближайших соседних частях древа (сестринская группа, синий бокс), был использован для определения предполагаемого филогенетического происхождения семейств LECA. Расстояние до ближайшего общего с соседней группой прокариот предка было измерено (приблизительная длина ветви, rsl) и нормализовано (длина ветви, sl) делением rsl на медиану дистанций от конечных колен эукариот до последнего общего предка всех эукариотических последовательностей (длина эукариотической ветви, ebl).

b. Распределение субпопуляций в пределах общего распределения длины ветвей (внутренний график), определенное с помощью комплексной модели и алгоритма максимизации ожиданий. Четыре субпопуляции/компонента обширно представлены в прокариотических филогенетических группах различных по происхождению, онтологии генов (ОГ) и кластерам ортологических групп (КОГ) поясняющим функциональные категории (см. текст, Таблица 1 и дополнительные таблицы 1 и 2). Помимо этих компонентов мы представляем клеточные локализации, типичные для того или иного семейства. FECA = первый общий предок эукариот.

Сначала был использован метод неконтролируемого машинного обучения для оценки гомогенности распределения длин ветвей различных семейств белков LECA. Используя алгоритм максимизации ожиданий для корректировки полученных данных и использовав модель гауссовой смеси, авторы выделили четыре различных исходных распределения (рис. 1б), каждое из которых содержало часть белковых семейств LECA. Далее встал вопрос о том, какие распределения содержат области, богатые белковыми семействами с: 1) определенным таксономическим происхождением, 2) определенной внутриклеточной локализацией или 3) определенной функциональной категорией. Были получены следующие данные: в первом распределении (в нем были собраны семейства с наименьшей длиной ветвей) преобладали белковые семейства с 1) бактериальным (в основном альфапротеобактериальным) происхождением, 2) митохондриальной локализацией, 3) несущие энергетические функции (см. таблицу 1). Напротив, два распределения, объединявшие семейства с наибольшей длиной ветвей (третье и четвертое) были богаты белками архейного и актинобактериального происхождения, связанными с рибосомами и ядром (рис. 1б и таблица 1). Во втором распределении не было обнаружено областей, богатых белками определенного происхождения, однако многие белки в этом распределении были связаны с функциями эндомембранного аппарата. Эти результаты согласуются только с мито-поздними моделями. В этих моделях вклад различных предков эукариот в эукариогенез определяется таким образом: наиболее древние белки происходят от архей и выполняют информационные функции (репликацию, транскрипцию, трансляцию), связанные с ядерными структурами; позже протоэукариотами были получены белки прокариот, функционально и структурно связанные с эндомембранной системой; и лишь в последнюю очередь свой вклад: белки, связанные с митохондриями и получением энергии, — осуществили альфапротеобактерии.

Таблица 1

Таблица 1

Авторы провели более конкретную проверку этой гипотезы путем группировки белковых семейств LECA в зависимости от их предполагаемого филогенетического происхождения, а также от характерных для них функциональности и внутриклеточной локализации, и затем проверили, имеются ли существенные различия в длине ветвей (рис. 2а и расширенные данные рис. 1а-с). В целом семейства LECA бактериального происхождения имеют значительно более короткую длину ветви, чем семейства архейного происхождения (P=1.38×10−25, U-критерий Манна-Уитни). Важно отметить, что кратчайшая длина ветвей была обнаружена у семейств белков эукариот альфапротеобактериального происхождения, а также семейств, отнесенных к группе Verrucomicrobia/Chlamydiales. Эти длины были значительно меньше, чем измеренные в семействах LECA не-альфапротеобактериального происхождения (P=4.4×10−2). При группировке семейств LECA в соответствии с их функциональными характеристиками было обнаружено, что те из них, которые участвуют в информационных процессах, имеют наиболее длинные ветви, за ними следуют семейства, участвующие в клеточных и сигнальных процессах, а семейства, участвующие в процессах метаболизма, обладают кратчайшими ветвями (рис. 2с и дополнительные данные рис 1с). Затем авторы задались вопросом, демонстрируют ли семейства LECA, преимущественно представленные в определенных внутриклеточных компартментах, различия в сроках филогенетического происхождения и длинах ветвей. В соответствии с приведенными выше результатами, семейства ядерных белков имеют наиболее длинные ветви, за ними следуют те, которые включены в эндомембранную систему, и, наконец, митохондриальные белки, как правило, имеют наикратчайшие ветви (рис. 2d и расширенные данные рис. 1d). Корреляция с длиной ветви наблюдается как для функции, так и для эволюционного происхождения, что вызывает необходимость оценить каждый из этих факторов по отдельности. Применённая авторами методика нормализации предполагает пропорциональные (необязательно постоянные) эволюционные темпы в ветвях-предшественницах и более поздних, чем LECA, ветвях, которые соответствуют временным промежуткам, в которых определенный белок был получен организмом-хозяином. Большое изменение эволюционного темпа в промежутке между предшествующей ветвью и следующими за LECA этапами могло оказать различный эффект на разные семейства в зависимости от их функций, что, в свою очередь, могло привести к выявлению упомянутых выше различий. Тем не менее, наши результаты не зависят от нормализации, как показано в сравнении, использующем приблизительные длины ветвей (рис 2e, f). Кроме того, при сравнении сопоставимых групп семейства с аналогичными функцией, давлением отбора, числом белок-белковых взаимодействий или уровнями экспрессии, но разным происхождением, демонстрируют различные длины ветвей (дополнительные данные рис. 2). Таким образом, основной движущей силой наблюдаемых различий в длинах ветвей является не функция белков, а их филогенетическое происхождение. Для независимой проверки подхода с его помощью авторами была проведена оценка относительного времени приобретения пластид, разновидности органелл, происхождение которых из цианобактерий, произошедшее позже митохондриального эндосимбиоза, неоспоримо. Как правило, происходящие от цианобактерий семейства белков имели значительно более короткие длины ветвей, чем семейства, происходящие от альфапротеобактерий, что дополнительно поддерживает наш подход (дополнительные данные рис. 3).

 

Источник: журнал Nature

Источник: журнал Nature

Рисунок 2. Профили филогенетических расстояний.

a-d, профили различных прокариотических источников (a, b), клеточных функций (с) и клеточных компонентов (d). Нижний и верхний пределы бокса в а, с и d соответствуют первой и третьей квартилям (25й и 75й процентилей). а, Блочная диаграмма сравнения распределения длин ветви семейств LECA с архейной, не-альфапротеобактериальной и альфа-протеобактериальной сестринскими группами. Числа на оси х указывают число включенных в каждый класс семейств. Символы указывают значения Р, полученные с помощью U-критерия Манна-Уитни, для указанных сравнений следующим образом: *P≤5×10−2; **P≤1×10−2; ***P≤1×10−3; ******P <1×10−6. b, Среднее значение альфапротеобактериальных длин ветвей по сравнению со случайным выборочным распределением средних значений, при нулевой гипотезе, что семейства различных бактериальных происхождений не показывают различий в длине ветвей. Величина Р указывает на вероятность того, что среднее значение будет больше или равно наблюдаемому, если нулевая гипотеза верна. Затемненная область под графиком плотности распределения, отграниченная пунктирной линией, соответствует одностороннему тестовому значению Р (показано рядом с изображением). c, d, Блочные диаграммы распределения длин ветвей в семействах LECA различных COG функциональных категорий (с) и локализаций GO (d), при рассмотрении всех семейств LECA(All) или только имеющих бактериальное происхождение (Bacterial). Обозначения соответствуют графику a. е и f, Полученные в а и b результаты при использовании приблизительной длины ветви (rsl) согласуются с полученными при использовании нормализованной длины ветви (sl), доказывая, что относительные различия в длинах ветвей не вызваны различиями в темпах эволюции дошедших до нас эукариот (ebl).

Затем авторы проверили надежность полученных результатов с различными наборами данных LECA, последовательностями проб и филогенетическими методами (дополнительные данные рис. 4-6). Дополнительный контроль (дополнительные данные рис. 6) показал, что изолированное влияние HGT не может объяснить обнаруженные в протеоме следы не-альфапротеобактериальных бактерий, а также опроверг возможность того, что кратчайшая длина ветвей для белковых семейств, произошедших от альфапротеобактерий, наблюдалась благодаря определенным белкам со специфической функцией или белкам бактерий порядка Rickettsiales, чья специфическая кластеризация митохондриальных белков признана артефактной. Наконец, они включили в свой анализ данные недавно идентифицированной клады Lokiarchaeota. Несмотря на то, что авторы обнаружили, что семейства LECA предположительно локиархейного происхождения имеют длины ветвей большие, чем семейства бактериального происхождения, они показывают кратчайшие ветви среди белков архейного происхождения. Эти данные говорят в пользу близкой взаимосвязи клады Lokiarchaeota с эукариотами (дополнительные данные рис. 7).

Для того, чтобы получить дальнейшее представление о локализации и функциональности семейств LECA различного филогенетического происхождения, авторы использовали анализ соответствий для визуализации ассоциаций между этими переменными, а также критерии перестановки для оценки статистической значимости (развернутые данные рис. 8). Они обнаружили, что гены альфапротеобактериального происхождения, как правило, ассоциированы с митохондриями (P≤10−6, критерий перестановки с 106 рандомизациями), в то время как происходящие от архей ассоциированы с ядром. Пожалуй, более неожиданным оказалась следующая находка: было обнаружено, что все белковые семейства LECA бактериального происхождения, за исключением тех, что были получены от альфапротеобактерий, демонстрируют явные отличия от других белков, будучи преимущественно ассоциированными с эндомемебранными компартментами (рис. 3b и расширенные данные рис. 8b, d). При анализе корреляции между эволюционным происхождением и функцией белков также были получены результаты, согласующиеся с вышеприведенными (рис. 3а и расширенные данные рис. 8а, с). В частности, альфапротеобактериальный компонент показал уникальную корреляцию с производством энергии (P <10−6). Этот результат не согласуется со сценариями, в которых большинство бактериальных компонентов в LECA, предположительно, берут свое начало от альфапротеобактериального эндосимбионта, потому что в этом случае среди них можно было бы ожидать более высокую функциональную согласованность. Эти результаты также подкрепляют идею того, что несмотря на значительные внутриклеточные повторные нацеливания и функциональную диверсификацию, фракция прото-митохондриального происхождения эукариотического протеома сохраняет тенденцию к митохондриальной локализации. Интересно, что локализующиеся в митохондриях семейства альфапротеобактериального происхождения имеют более короткие длины ветвей, чем митохондриальные семейства иного происхождения (P=6×10−3), что указывает на перенос ранее приобретенных белков во вновь сформированную органеллу.

В целом, результаты данного обзора представляют убедительные доказательства позднего приобретения митохондрий, как это и предлагалось в рамках нескольких моделей эукариогенеза. В частности, данные свидетельствуют о том, что большая часть бактериального компонента LECA, имеющего не-альфапротеобактериальное происхождение, была приобретена раньше, в основном способствовала формированию не митохондрии или ядра, а других органелл, а также не участвовала в процессах получения энергии. Авторы показали, что эти наблюдения не могут быть полностью объяснены массивным HGT в прото-митохондриального предка. Это означает, что эти белки были приобретены геномом хозяина до приобретения митохондрий. Таким образом, на момент приобретения митохондрий организм-хозяин уже представлял собой достаточно сложную клетку, в геноме которой уже присутствовали гены метаболических путей и процессов, полученные от различных бактерий. Учитывая гетерогенность происхождения белков в протеоме LECA, простая модель не может объяснить присутствие этого компонента. В то же время подобный химеризм может быть объяснен сериями симбиотических ассоциаций с различными партнерами, существованием прокариотического консорциума или постепенных волн HGT в геном хозяина до возникновения митохондриального эндосимбиоза. И, наконец, компонент архейного происхождения имеет наиболее длинные ветви и наиболее сильную ассоциацию с ядром, согласуясь с идеей о том, что эукариоты произошли от архей, а ядро является их “изобретением”. Результаты авторов совместимы как с концепцией сложного прото-эукариотического хозяина, так и с концепцией архейного хозяина, уже содержащего многие метаболические пути бактериального происхождения. В любом случае, митохондриальным поглощением отмечен конец массивного бактериального HGT в LECA и начало разделения существующих эукариотических линий. Они полагают, что митохондриальный эндосимбиоз оказался критическим последним этапом эукариогенеза, приведшим к установлению окончательного селективного преимущества, которое способствовало доминированию и расселению групп эукариот, сохранившихся до наших дней.

Источник: журнал Nature

Источник: журнал Nature

Рисунок 3. Соответствие различных структур LECA различным клеточным локализациям и функциям.

a, b, Анализ соответствий симметричных двойных наблюдений показал различия между локализациями (а) и функциями (b) семейств с различным филогенетическим происхождением. В обоих случаях, первичные основные структуры, на которые приходится наибольший процент объясняемых колебаний, четко разделились на те, которые произошли из архей и те, которые произошли от бактерий (коричневый эллипс), в то время как вторичные компоненты разделились на имеющие альфапротеобактериальное и иное бактериальное происхождение (светло-голубой эллипс. Числа рядом с главными осями (РС1, РС2) показывают процент общих объясняемых для каждого компонента колебаний. И колонки (функции и локализации) и строки (филогенетическое происхождение) находятся в главных координатах. Цвета стрелок, клеточная локализация (слева) и функциональные категории (справа) соответствуют категориям и локализациям на рисунках 2с, d. Если термин не может быть классифицирован так, как описано выше — цвет серый. Точки окрашены в соответствии с филогенетическим происхождением группы так же, как в расширенных данных рис. 1а.

Расширенные данные
Источник: журнал Nature

Источник: журнал Nature

Mitochondrion5

Расширенные данные, рисунок 1. Распределение сестринских групп и расширенные профили филогенетических расстояний.

а, Круговая диаграмма показывает распределение белков, предположительно происходящих от бактериальных. Во внутреннем слое представлены наиболее высокие таксономические ранги Число семейств LECA, закрепленных за каждой группой, указано в скобках рядом с соответствующими уровнями в круговой диаграмме или в нижней части бокса.

b, Блочная диаграмма показывает распределение длин ветвей в различных бактериальных компонентах. Измерения длин ветвей (sl), приблизительных длин ветвей (rsl) и медианы длины от LECA до конечных точек ветвей внутри эукариотических семейств (ebl), как они определены на рис. 1а. Для оценки статистической значимости между распределениями были проведены тесты с критериями перестановки. В общей сложности было выполнено 106 перестановок со случайным порядком значений в каждой перестановке. Стрелки и символы выше боксов означают статистическую значимость наблюдаемых различий в сравнении со случайно перемешанными распределениями (более низкие значения, направленная вниз красная стрелка; более высокие значения, направленная вверх зеленая стрелка). Соответствие между символами и значениями Р выглядит следующим образом: ~P≤1×10−1; *P≤5×10−2; **P≤1×10−2; ***P≤1×10−3; ******P <1×10−6. Нижние и верхние пределы бокса соответствуют первому и третьему квартилям (25 и 75 процентили).

c, d,  Показаны профили длин ветвей различных функциональных категорий (с) и GO тонких структур клетки. Как и на рис. 2с, длины ветвей также оценивались только на основании бактериальных структур, с целью исключить возможность того, что наблюдаемые различия обусловлены исключительно архейно-бактериальными различиями. Значение оценивалось с помощью критериев перестановок (106 перестановок) и обозначалось стрелками как в b.

Mitochondrion6

Mitochondrion7

Источник: журнал Nature

Источник: журнал Nature

Расширенные данные, Рисунок 2.

Семейства архейного происхождения имеют значительно более длинные ветви, чем семейства бактериального происхождения в различных функциональных категориях, с аналогичным давлением отбора и связями/уровнями экспрессии.

а, Авторы сравнили длины ветвей, приблизительные длины ветвей и длины ветвей эукариот семейств предположительно архейного и бактериального происхождения в пределах трех различных функциональных категорий. В то время как эукариотические длины ветвей между группами не показывают существенных различий, различия обнаруживаются в их соответствующих ветвях (приблизительные длины ветвей и длины ветвей).

b, Архейные и бактериальные семейства LECA со сходным давлением отбора (при измерении значений dN/dS среди членов семейств) существенно различаются их приблизительными длинами ветвей. Выборки семейств из обеих групп были сопоставлены по значениям dN/dS в указанных эталонных видах. Данные dN/dS для членов семейств Homo sapiens (Metazoa), Aspergillus nidulans (грибы) и Zea mays (растения) были загружены из Ensembl. Сравнение приблизительных длин ветвей двух выборок показало, что архейные семейства, как правило, имеют значительно более длинные стебли (верхние участки), а также функцию “хранения и переработки информации” (нижние участки) независимо от давления отбора.

с, Архейные и бактериальные семейства LECA с аналогичными уровнями связей/экспрессии показывают значительные различия в приблизительных длинах ветвей. В а-с, различия между архейным и бактериальным компонентами были оценены с помощью U-критерия Манна-Уитни и значения Р, указанного в каждом конкретном случае (*P≤5×10−2; ~ P≤1×10−1; #P>1).

Mitochondrion9

Mitochondrion10

Источник: журнал Nature

Источник: журнал Nature

Расширенные данные, рисунок 3. Анализ цианобактериального сигнала первичных, имеющих пластиды эукариот.

а, Круговая диаграмма показывает распределение белков с предположительно прокариотическим происхождением в распространенных белковых семействах растений, как на рис. 1а расширенных данных. Предполагаемый профиль происхождений эукариот, которые приобрели пластиды через первичный эндосимбиоз несет сильный сигнал от цианобактериального эндосимбионта.

b, c, Семейства предположительного цианобактериального происхождения имеют значительно более короткие длины ветвей и приблизительные длины ветвей чем альфа-протеобактериальные семейства (b) и чем случайно распределенные длины ветвей от предположительного бактериального компонента (с), что указывает на относительно недавнее приобретение пластид (пост-LECA).

d, В целом, как и с белками митохондриальной локализации, эти белки, локализованные в пластидах, имеют более короткие длины ветвей чем белки ядерной и эндомембранной систем.

е, Схематическое представление ожидаемой разницы в ветвях, учитывает что цианобактериальный эндосимбиоз произошел после диверсификации основных эукариотических линий. Как было подтверждено, приблизительные длины ветвей, измеренные от растительных белковых семейств до их общего предка с цианобактерией, короче, чем те, которые можно было отследить до альфа-протеобактерии и других бактериальных групп. Значения символов Р в двустороннем U-критерии Манна-Уитни в b и d такие же, как в расширенных данных рис. 1; дополнительно ****P≤1×10−4; *****P≤1×10−5

Mitochondrion12

Mitochondrion13

Mitochondrion14

Расширенные данные, рисунок 4.

а, Четыре эукариотические группы, включающие 37 выбранных эукариотических образцов используемые в анализе приведены рядом с таксономической структурой NCBI в соответствии с Tree of Life Project (http://tolweb.org/Eukaryotes/3). b, Использование в расчетах более строгих определений LECA значительно сильнее влияло на структуру бактериального компонента, чем архейного, который более распространен среди эукариот. с, Эффект различных определений LECA с точки зрения таксономических распределений и различий в длинах ветвей между белками альфапротеобактериального происхождения и полученных от других бактерий. Числа в скобках указывают общее количество семейств LECA, которые прошли порог. Графики плотности распределения, как в 2б, показывают, что наблюдаемые средние значения длин ветвей альфа-протеобактерий в сравнении со 106 случайными выборками среди значений в белковых семействах бактериального происхождения. Наблюдаемые средние значения (μobs) показаны пунктирной красной линией, значение Р для каждого теста так же указано рядом с графиком.

Mitochondrion15

Mitochondrion16

Mitochondrion17

Mitochondrion-table-2

Расширенные данные, рисунок 5

Белки, производные альфа-протеобактерий имеют последовательно укорачивающиеся ветви, независимо от методов, наборов данных и пределов поддержки. Представлены графики плотности случайных распределений средних значений длин ветвей для различных используемых методов, наборов данных и пределов поддержки. Наблюдаемые альфа-протеобактериальные средние значения (μobs) как на рис. 2б. b, Результаты после использования различных филогенетических ветвей представленных авторами в работе 8 (слева вверху), стандартные филогенетические цепочки применяются к выборке из их последовательностей (справа вверху) или альтернативных филогенетических цепочек или выборки из EggNOG (снизу). b, Основным результатом является устойчивость к прогрессивно более жестким порогам поддержки до тех пор, пока размер выборки становится слишком мал (предел поддержки > 0,9). Числа в скобках указывают на число семейств LECA в которых был сделан вывод о бактериальном происхождении для каждого порога.

Mitochondrion18

Mitochondrion23

Mitochondrion19

Mitochondrion20

Mitochondrion22

Mitochondrion21

Расширенные данные, Рисунок 6. Оценка альтернативных сценариев HGT и других потенциальных систематических ошибок.

а, Эффект выборки был смоделирован путем искусственного удаления части или всех альфа-протеобактериальных последовательностей в конечных наборах данных. Для того, чтобы смоделировать потенциальную ошибку, вызванную обогащением выборки альфа-протеобактериями, к набору данных было применено искусственное снижение альфа-протеобактериальных последовательностей на 50% (“половинная” альфа-выборка). Снижение альфа-протеобактериальных последовательностей на 50% не приводит к существенным изменениям для того чтобы сделать вывод о длинах ветвей внутри семейств альфа-протеобактериального происхождения. #Случаи где разница не была статистически достоверной.

b, Различные сценарии HGT прото-митохондрий не могут объяснить наблюдаемый сигнал в семействах, отнесенных к не-альфабактериальным. Перенос гена от альфапротеобактерии к другим бактериальным линиям после митохондриального эндосимбиоза и параллельная потеря из рода митохондриального предка (пост-мито HGT из альфа) не изменили длины ветвей. Потеря гена из клады альфа-протеобактериальных сестер привела к увеличению длин определяемых ветвей (вертикальная трансмиссия/пре-мито HGT из альфа). Трансфер гена из протоэукариотической линии от других бактериальных клад приведёт к более коротким длинам ветвей в сравнении с альфа-протеобактериальными графиками (пост-мито HGT из протоэукариот).

с, При полном исключении альфа-протеобактериальных последовательностей (не-альфа выборки), эукариотические семейства отнесены к другим бактериальным группам, ко с длинами ветвей выше, чем, как правило, наблюдается. То же самое наблюдается при сравнении длин ветвей семейств отнесенных к протеобактериальным группам в отсутствие альфа-протеобактерии с теми, которые обычно отнесены к другим, а не протеобактериальным группам.

d, Блочная диаграмма показывает что нет никаких существенных различий в длинах ветвей между альфа-протеобактериальными семействами с митохондриальной локализацией в сравнении с теми, которые имеют внутриклеточную локализацию (слева) или между семействами, участвующими в энергетически-связующих функциях в сравнении с участниками других функциональных категорий (справа).

е, Блочная диаграмма не показывает никаких существенных различий между распределением длин ветвей семейств установленного риккетсиозного происхождения с другими альфа-протеобактериальными.

f, Альфапротеобактериальные семейства в различных функциональных категориях не показывают различий в длинах ветвей. Во всех случаях было проведено сравнение распределения с использованием двустороннего U-критерия Манна-Уитни.

Mitochondrion24

Расширенные данные, рисунок 7. Заключение о LECA и локиархеях.

Результаты после включения локиархей в наш анализ. а, Заключение о распределении сестринских групп в прокариотической систематике показано в круговой диаграмме вместе с количеством семейств в каждой группе, в скобках (как в расширенных данных рис. 1а). b, Блочная диаграмма показывает профили длин ветвей различных прокариотических групп. Локиархеи показывают самые низкие значения среди всех архейных групп, но наиболее высокие значения, чем другие бактериальные группы. Символы соответствуют значениям, приведенным в рис. 1 расширенных данных после применения критерия перестановки (106 перестановок) для архейного и бактериального компонентов, независимо друг от друга. с, Блочная диаграмма сравнения между профилями не-локиархей, локиархей и бактериальных длин ветвей. Значения Р получены теми же методами, что и раньше (двусторонний U-критерий Манна-Уитни для предотвращения ложных результатов). d, Схематичное представление эффекта на длины ветвей отсутствия последовательностей Lokiarchaeum. Вывод о происхождении 30 семейств эукариот, которые ранее были нанесены на карту в других, в основном архейных группах, в базе данных eggNOG версии 4, оно является локиархейным, так как последовательности гомологичны включенным из этого генома. Уменьшение наблюдаемых длин ветвей установленного локиархейного происхождения, ожидаемо в сценарии, когда локиархеи являются наиболее близкими известными архейными родственниками эукариот.

Mitochondrion25

Mitochondrion26

Источник: журнал Nature

Источник: журнал Nature

 

Расширенные данные, рисунок 8. Соответствие различных компонентов LECA различным клеточным локализациям и функциям (расширенная версия рис.3).

a-d, различные компоненты LECA имеют клеточные компоненты различных GO (а, с) и функциональных профилей (b, d). Гены различного происхождения, как правило, имеют различные функции и внутриклеточные локализации.

а, b, Такой же анализ соответствия симметричных двойных графиков, как в рис. 3 в высоком разрешении, с именами таксономической группы, функции и тонких условиях GO указаны рядом с координатами. Процент несоответствий объясняется тем, что каждый основной компонент указан рядом с каждой осью в скобках.

с, d, Таблицы сопряженности, также используемые в анализе соответствий показаны в виде тепловой карты. Звездочки в различных клетках отражают значимости между данными происхождения и локализации (с) или функции (d), вычисленные с помощью тестов перестановок (106 перестановок), где были перемешаны аннотации между каждым эукариотическим семейством. Соответствие между символами и значениями Р как в расширенных данных рис. 1 и 3. е, Функциональные категории COG, как организованные в трех основных группах “хранение и обработка информации”, “клеточные процесс и сигнализации” и “метаболизм”.

Оригинал

Перевод: Елена Лисицына

Изображения: Елена Лисицына

Редакция: Deepest Depths, Михаил Гусев, Азат Муртазин, Полина Тиканова, Алексей Дорохов.

 

About The Author
editor