Cpf1 – эндонуклеаза системы CRISPR/Cas 2 класса, управляемая одноцепочечной РНК.

Автор: old.medach.pro

Публикация: 18.02.2018

Cpf1 – эндонуклеаза системы CRISPR/Cas 2 класса, управляемая одноцепочечной РНК. Bernd Zetsche, Jonathan S. Gootenberg.

КРАТКОЕ ОПИСАНИЕ Cpf1 - РНК-управляемая ДНК-нуклеаза, обеспечивающая иммунную защиту бактерий и подходящая к использованию для редактирования генома клеток млекопитающих.

КЛЮЧЕВЫЕ МОМЕНТЫ · CRISPR/Cpf1 – это CRISPR система второго класса; · Cfp1 является CRISPR-ассоциированной двухкомпонентной РНК-программируемой ДНК-нуклеазой; · В таргетной ДНК образуется ступенчатый разрыв длиной в 5 нуклеотидов, расположенный дистально от 5’ тимин-богатого мотива, примыкающего к протоспейсеру (далее в тексте ПАМ - протоспейсер-ассоциированный мотив); · 2 ортолога белка Cpf1 проявляют сильную нуклеазную активность в клетках человека.

АБСТРАКТ Прокариотная адаптивная иммунная система CRISPR служит защитой от чужеродных генетических элементов благодаря двум классам РНК-направляемых нуклеазных эффекторов. Первый класс эффекторов использует мультипротеиновые комплексы, тогда как эффекторы второго класса основываются на однокомпонентных эффекторных белках, таких как уже широко известный Cas9. Мы представляем характеристики Cpf1 – предполагаемого эффекторного белка системы CRISPR класса 2. Мы продемонстрировали, что Cpf1 опосредует сильную ДНК-интерференцию, но с характерными отличиями от работы Cas9. Cpf1 – эндонуклеаза, направляемая одноцепочечной РНК и не нуждающаяся в tracrРНК, также она использует тимин-богатый мотив, примыкающий к протоспейсеру. Cpf1 вносит ступенчатый двуцепочечный разрыв в ДНК. Помимо 16 белков семейства Сpf1 мы идентифицировали 2 фермента-претендента из Acidominococcus и Lachnospiraceae с высокой геном-редактирующей активностью в клетках человека. Выявление механизма интерференции улучшает наше понимание систем CRISPR/Cas, а также позволяет усовершенствовать их применение в редактировании генома.

ВСТУПЛЕНИЕ CRISPR/Cas (короткие палиндромные повторы, регулярно расположенные группами, а также белки, ассоциированные с этими повторами) – система адаптивного иммунитета, которой обладают многие бактерии и почти все археи. Система CRISPR/Cas представляет собой комбинацию Cas-эффекторных белков и CRISPR РНК (crРНК). В реализации защитной активности системы CRISPR/Cas выделяют 3 стадии: (1) адаптация, когда комплекс Cas-белков вырезает сегмент таргетной ДНК (так называемый протоспейсер) и вставляет его в CRISPR кассету (здесь вырезанная последовательность становится спейсером); (2) экспрессия и процессинг предшественника CRISPR РНК (пре-crРНК), из которого затем формируется зрелая crРНК; (3) интерференция, когда эффекторная единица, будь то комплекс Cas-белков или большой одиночный белок, руководствуясь crРНК, распознает и разрезает таргетную ДНК (или, в некоторых случаях, РНК). Стадия адаптации контролируется комплексом из белков Cas1 и Cas2, которые входят в основу всем известных систем CRISPR/Cas, иногда в комплекс включаются дополнительные белки Cas. Процессинг пре-crРНК с образованием зрелой гид-crРНК может происходить посредством связывания специфичной рибонуклеазы, родственной Cas6 или стандартной РНКазы III; эти ферменты специфично разрезают двуцепочечные РНК гибриды пре-crРНК и tracrРНК. Кроме того, эффекторные комплексы CRISPR/Cas сильно отличаются от системы к системе. В последней классификации все разнообразие CRISPR/Cas систем разделено на 2 класса, в соответствии с конфигурацией эффекторных комплексов: первый класс образует эффекторный комплекс из нескольких Cas белков и crРНК, в то время как комплекс второго класса состоит из единственного большого Cas-белка и crРНК. Функции обширного первого класса систем CRISPR/Cas, включающего в себя системы типа I и типа III, детально описаны, включая архитектуру и динамику эффекторных комплексов. Некоторые идентифицированные системы CRISPR/Cas 2 класса тоже были экспериментально охарактеризованы: так, все они относятся к типу II и используют в роли эффекторов управляемые при помощи РНК-гидов нуклеазы семейства Cas9. Совсем недавно ещё одна система CRISPR, предположительно, второго класса, была обнаружена в нескольких бактериальных геномах, и, в порядке рабочей гипотезы, была отнесена к типу V. В состав систем CRISPR/Cas предполагаемого пятого типа входит большой, состоящий из примерно 1300 аминокислотных остатков, белок, названный Cpf1 (CRISPR из Prevotella и Francisella 1). Однако остается неизвестным, действительно ли Cpf1-содержащие CRISPR локусы представляют из себя функциональную CRISPR систему. Принимая во внимание обширную область применения Cas9 в роли инструмента геномной инженерии, мы стремимся исследовать функции предполагаемых CRISPR систем, основывающихся на работе Cpf1. Мы показали, что Cpf1-содержащие CRISPR/Cas локусы Francisella novicida U112 кодируют функциональные системы защиты, способные в бактериальных клетках участвовать в плазмидной интерференции, управляемой спейсерами CRISPR. Cpf1-содержащая CRISPR система имеет 3 основных отличия от систем с белком Cas9. Во-первых, Cpf1-ассоциированные CRISPR кассеты процессируются в зрелую crРНК без участия добавочных транс-активирующих crРНК (tracrРНК). Во-вторых, комплексы Cpf1-crРНК эффективно расщепляют таргетную ДНК, следующую за коротким тимин-богатым мотивом, примыкающим к протоспейсеру (далее в тексте ПАМ - протоспейсер-ассоциированный мотив), в то время как Cas9 необходимо наличие G-богатого ПАМ после таргетной последовательности. В-третьих, Cpf1 делает ступенчатый разрыв двуцепочечной ДНК, который приводит к образованию 4- или 5-нуклеотидного 5’-выступающего участка. Для исследования пригодности применения белка Cpf1 для редактирования генома, мы охарактеризовали необходимые условия РНК-направляемого ДНК-таргетинга для 16 белков семейства Cpf1 из разных бактерий; мы обнаружили 2 фермента Cpf1 из Acidaminococcus sp. BV3L6 и Lachnospiraceae bacterium ND2006, которые способны редактировать геном клеток человека. В целом, полученные результаты позволяют отнести Cpf1 к системам CRISPR/Cas 2 класса, которые включает весьма эффективную эндонуклеазу, управляемую одноцепочечной гид-РНК; эта эндонуклеаза обладает характерными особенностями, которые потенциально способны поднять на новый уровень нашу способность манипулировать геномом эукариот.

РЕЗУЛЬТАТЫ Содержащие Cpf1 локусы CRISPR являются активной бактериальной иммунной системой Впервые Cpf1 был аннотирован в базе данных TIGRFAM как CRISPR-ассоциированный ген, и было предположено, что он является эффектором CRISPR-локуса, отличающегося от Cas9-содержащих CRISPR/Cas локусов типа II, которые также встречаются в геномах некоторых разновидностей бактерий Francisella и Prevotella (Рисунок 1А). Как и предполагалось, белок Cpf1 содержит RuvC-подобный эндонуклеазный домен, который состоит в дальнем родстве с соответствующим нуклеазным доменом белка Cas9. Тем не менее, Cpf1 отличается от Cas9 тем, что он не имеет второго HNH эндонуклеазного домена, который встроен в RuvC-подобный домен белка Cas9. Более того, N-терминальная часть Cpf1, предположительно, обладает смешанной α/β структурой, и на N-конце у Cpf1 нет ничего схожего с α-спиральным регионом узнавания Cas9 (Рисунок 1А). Было показано, что нуклеазные мотивы белков Cas9 и Cpf1 гомологичны разным группам TnpB белков, кодируемых транспозонами, причем Cas9 содержит оба нуклеазных домена RuvC и HNH, а Cpf1 содержит только RuvC-подобный домен. Кроме этих различий между эффекторными белками Cpf1-несущие локусы кодируют Cas1, Cas2, Cas4 белки, которые наиболее близки к ортологам, относящимся к I и III типу CRISPR систем, а не к типу II. В совокупности все эти отличия от типа II вынуждают отнести Cpf1-кодирующие CRISPR/Cas локусы к предполагаемому типу V класса 2. Характерные особенности локусов предполагаемого типа V - главным образом, доменная архитектура Cpf1 - позволяют предположить, что системы II и V типа независимо развивались за счет объединения разных адаптационных модулей (генов cas1, cas2, и cas4) с разными TnpB генами, но также что системы V типа обладают уникальными функциями. Мнение о том, что Cpf1 содержащие локусы являются самыми настоящими CRISPR-системами, поддерживается поиском последовательностей прокариотного генома, сходных со спейсерами типа V, которые направлены на гены профагов - такая последовательность была обнаружена у бактерий рода Francisella. Принимая во внимания эти наблюдения и распространенность белков семейства Cpf1 среди бактерий разных видов, мы попытались проверить гипотезу о том, что Cpf1-кодирующие CRISPR/Cas локусы биологически активны и могут участвовать в таргетной ДНК-интерференции – одной из основных функций системы CRISPR. Для упрощения работы мы клонировали Francisella novicida U112 Cpf1 (FnCpf1) локус (Рисунок 1А) в низкокопийную плазмиду (pFnCpf1), чтобы затем провести гетерологичное воспроизведение этой плазмиды в E. coli. В уже охарактеризованных системах CRISPR/Cas для успешной ДНК-интерференции, как правило, необходимо соблюдение двух требований: (1) таргетная последовательность должна соответствовать одному из спейсеров, представленных в соответсвующей CRISPR кассете, и (2) таргетная последовательность, комплементарная спейсеру (далее в тексте протоспейсер) должна быть фланкирована подходящим мотивом, примыкающим к протоспейсеру (ПАМ). Принимая во внимание, что функционирование FnCpf1 CRISPR локуса совсем не описано, мы адаптировали уже описанный протокол элиминации плазмид, чтобы установить активность Cpf1, требования к ПАМ последовательности и расположение ПАМ относительно протоспейсера (5’ или 3’) (Рисунок 1В). Мы сделали 2 библиотеки плазмид, несущих протоспейсер, соответствующий первому спейсеру в локусе FnCpf1 CRISPR кассеты. Библиотеки отличались положением рандомной 7-нуклеотидной последовательности (ПАМ): с 5’ или 3’ конца протоспейсера. Каждая плазмидная библиотека была трансформирована в линию E. coli, гетерологично экспрессирующую FnCpf1 локус, и в контрольную линию E. coli, несущую пустой вектор. Благодаря этому анализу мы определили последовательность и месторасположение ПАМ, идентифицировав нуклеотидные последовательности, которые отстутсвуют в клетках, гетерологично экспрессирующих локус FnCpf1. Мы обнаружили, что ПАМ для FnCpf1 расположен у 5’ конца замещенной цепи протоспейсера и имеет последовательность 5'-TTN (Рисунок 1C, 1D, S1). В системах CRISPR I типа ПАМ также расположены в 5’ положении, однако у систем второго типа Cas9 использует ПАМ, который располагается на 3’ конце протоспейсера. Не считая идентификации ПАМ, результаты теста элиминации отчетливо указывают на то, что гетерологически экспрессируемые Cpf1 локусы способны к эффективной интерференции плазмидной ДНК. Для последующего анализа особенностей работы ПАМ, мы изучили плазмидную активности интерференции с помощью трансформации клеток, экспрессирующих cpf1-локус, плазмидами, несущими протоспейсер 1, фланкированный 5'-TTN ПАМ. Мы обнаружили, что Cpf1 эффективно работал со всеми протоспейсерами с 5’-TTN ПАМ (Рисунок 1Е). Кроме того, он также эффективно работал с ПАМ 5’-CTA, но не с ПАМ 5'-TCA (Рисунок 1Е), что свидетельствует о том, что тимин в середине важнее для опознавания ПАМ, чем первый тимин и, в соответствии с данными о последовательности ПАМ (Рисунок S1D), представленными выше, сам ПАМ может быть менее консервативен, чем 5’-TTN.

Источник: журнал Cell (А) Организация двух локусов CRISPR, найденных в Francisella novicida U112 (NC_008601). Сравнение доменной структуры FnCas9 и FnCpf1. (B) Схематичное изображение эксперимента по элиминации плазмид для обнаружения расположения и идентификации ПАМ. Компетенты E. coli, несущие плазмиду с гетерологичным локусом FnCpf1 (pFnCpf1) или пустой контрольный вектор, были трансформированы библиотекой плазмид, содержащих соответствующий протоспейсер, фланкированный рандомными 5’ или 3’-ПАМ последовательностями. Бактерии, получившие плазмиду с успешно таргетированным ПАМ, не обладали устойчивостью к антибиотику. Плазмиды из выживших колоний были выделены и секвенированы для узнавания ПАМ последовательности. (C и D) Графическое изображение последовательности ПАМ FnCpf1, полученные в ходе анализа эксперимента по элиминации плазмид. Высота букв в каждой позиции рассчитывалась исходя из смысловой нагрузки (C) или частоты (D); планки погрешностей показывают 95% Байесов доверительный интервал. (E) E. coli, содержащая pFnCpf1, показывает сильную интерференцию против плазмиды, несущей 5’-TTN ПАМ (n = 3; планки погрешностей показывают среднее значение ± стандартная ошибка среднего). Смотри рисунок S1. Cpf1-ассоциированная CRISPR-кассета процессируется независимо от tracrРНК После того как было показано, что CRISPR локус с cpf1 способен вызывать полноценную интерференцию ДНК, мы провели секвенирование малых РНК, чтобы точно соотнести этот локус с полученными crРНК. С помощью секвенирования малых РНК, полученных из культуры Francisella novicida U112, мы обнаружили, что CRISPR кассета процессируется в короткие зрелые crРНК длиной 42-44 нуклеотида. Каждая зрелая crРНК начинается с прямого повтора длиной в 19 нуклеотидов, за которым следует спейсер длиной 23-25 нуклеотидов (Рисунок 2А). Это расположение участков в crРНК контрастирует с тем, что есть в типе II CRISPR/Cas систем, в которых зрелая crРНК начинается со спейсера длиной 20-24 нуклеотида, за которым следует прямой повтор длиной 22 нуклеотида. Неожиданно, но рядом с локусом cpf1 у Francisella, помимо crРНК, мы не наблюдали иных экспрессируемых транскриптов, тогда как в системах, завязанных на Cas9, присутствуют tracrРНК. Для того чтобы подтвердить, что никаких добавочных РНК для созревания crРНК и интерференции ДНК не требуется, мы сконструировали плазмиду, использующую искусственные промоторы, чтобы включить экспрессию Francisella cpf1 (FnCpf1) и CRISPR кассету (pFnCpf1_min). Секвенирование малых РНК E. coli, экспрессирующих эту плазмиду, все еще показывало процессинг CRISPR кассеты в зрелую crРНК (Рисунок 2В), что говорит о том, что FnCpf1 и его CRISPR кассета - единственные элементы локуса FnCpf1, необходимые для процессинга crРНК. Более того, E. coli, экспрессирующие pFnCpf1_min, или pFnCpf1_DCas (плазмида, в которой убраны все cas гены, но есть нативные промоторы, экспрессируется FnCpf1 и CRISPR кассета) проявляют стойкую ДНК-интерференцию, демонстрируя тем самым, что FnCpf1 и crРНК важны как посредники для ДНК-таргетинга (Рисунок 2С). В отличие от этого, Cas9 требует и crРНК и tracrРНК для направленной ДНК-интерференции.

Источник: журнал Cell (А) Секвенирование малых РНК Francisella novicida U112 выявило транскрипцию и процессинг FnCpf1 CRISPR кассет. Зрелая crРНК начинается с 19-нуклеотидного прямого повтора, за которым следует 23-25 – нуклеотидный спейсер. (В) Секвенирование малых РНК E. coli, трансформированных плазмидой, несущей FnCpf1 и CRISPR кассету под искусственным промотором. Процессинг crРНК происходит вне зависимости от Cas генов и других элементов последовательности FnCpf1 локуса. (C) E. coli, несущая разные усечения локуса FnCpf1 системы CRISPR показала, что для интерференции плазмидной ДНК требуется только FnCpf1 и CRISPR кассета (n = 3; планки погрешностей показывают среднее значение ± стандартная ошибка среднего). Cpf1 – эндонуклеаза, управляемая одноцепочечной crРНК Открытие того, что FnCpf1 может участвовать в ДНК-интерференции с помощью только лишь crРНК, само по себе весьма удивительно, ведь Сas9 распознает crРНК через гетеродуплекс crРНК и tracrРНК, а также по вторичной структуре 3’-конца tracrРНК. Чтобы удостовериться в том, что для формирования активного комплекса с FnCpf1 и осуществления РНК-направленного расщепления ДНК достаточно только лишь crРНК, мы изучили, может ли FnCpf1 белок, снабженный только crРНК, расщепить таргетную ДНК in vitro. Мы очистили FnCpf1 (Рисунок S2) и проверили его способность разрезать ту же самую протоспейсер-1-содержащую плазмиду, использованную в экспериментах по бактериальной ДНК-интерференции (Рисунок 3А). Мы обнаружили, что FnCpf1 совсместно с транскрибированной in vitro зрелой crРНК, нацеленной на протоспейсер 1, был способен эффективно разрезать таргетную плазмиду в присутствии Mg2+ и crРНК (Рисунок 3В). Кроме того, FnCpf1 способен разрезать как суперскрученную, так и линейную таргетную ДНК (Рисунок 3С). Эти результаты свидетельствуют о достаточности белка FnCpf1 и crРНК для РНК-зависимого расщепления ДНК. Мы секвенировали по Сэнгеру разрезанные концы ДНК с целью картировать сайт расщепления FnCpf1. Мы обнаружили, что FnCpf1-зависимый разрыв ведет к образованию 5’-липкого конца длиной в 5 нуклеотидов (Рисунок 3А, 3D и S3A-S3D), что отличается от конечного продукта с тупыми концами, получаемого после работы нуклеазы Cas9. Cайт рестрикции FnCpf1 далек от ПАМ: разрезание происходит после 18-го основания нетаргетной (+) цепи и после 23-го основания таргетной (-) цепи (Рисунок 3А, 3D и S3A-S3D). Используя двухцепочечные олигонуклеотидные субстраты с разными ПАМ-последовательностями, мы обнаружили, что FnCpf1 нуждается в 5’-TTN ПАМ, чтобы в форме дуплекса разрезать таргетную ДНК (Рисунок 3Е).

Источник: журнал Cell (А) Схематическое изображение FnCpf1 crРНК – ДНК-таргетного комплекса. Сайты расщепления отмечены красными стрелочками. (В) РНК-управляемое разрезание таргетной ДНК зависит от crРНК и Mg2+. (С) FnCpf1 разрезает как линейную, так и суперспирализованную ДНК. (D) Секвенирование по Сэнегеру таргетной ДНК для FnCpf1 показывает наличие ступенчатого разрыва. Необычное добавление аденина, обозначенного N, является артефактом полимеразы, используемой для секвенирования. Для удобства визуализации рид обратного праймера представлен как обратный комплементарному. Смотри рисунок S3. (E) Зависимость разрезания от спаренности нуклеотидов с 5’-концом ПАМ. FnCpf1 может распознать ПАМ только в случае правильного (Уотсон-Криковского) спаривания нуклеотидов ДНК. Смотри рисунок S2 и S3. RuvC-подобный домен Cfp1 контролирует РНК-управляемое расщепление ДНК RuvC-подобный домен Cfp1 сохранил в себе все катилитические остатки этого семейства эндонуклеаз (Рисунок 4А и S4) и, по предварительным оценкам, является активной нуклеазой. Исходя из этих соображений, мы создали трех мутантов: FnCpf1(D917A), FnCpf1(E1006A), и FnCpf1(D1225A) (Рисунок 4А), чтобы проверить, насколько эти каталитические остатки необходимы для нуклеазной активности FnCpf1. Мы обнаружили, что мутации D917A и E1006A полностью инактивируют способность FnCpf1 к расщеплению ДНК, а D1255A значительно уменьшает нуклеазную активность (Рисунок 4В). Эти результаты противоречат результатам мутагенеза для Streptococcus pyogenes Cas9 (SpCas9), где мутации в RuvC (D10A) и HNH (N863A) нуклеазных доменах превращают SpCas9 в ДНК-никазу (т.е., инактивация любого из двух нуклеазных доменов прекращает разрезание одной из цепей ДНК) (Рисунок 4В). Эти исследования наталкивают на мысль о том, что FnCpf1 разрезает обе цепи таргетной ДНК посредством RuvC-подобного домена, находясь в форме димера. Что интересно, анализ FnCpf1 методом эксклюзионной хроматографии показал, что белок элюируется приблизительно на 300кД, что соответсвтует удвоенному молекулярному весу мономера FnCpf1 (Рисунок S2B).

Каталитические остатки C-конца RuvC домена необходимы для расщепления ДНК.

Источник: журнал Cell (A) Обозначена структура FnCpf1 с каталитическими остатками доменов RuvC. Каталитические остатки идентифицированы по анализу гомологии сиквенсов с RuvC Thermus thermophilus (PDB: 4EP5). (B) Гель с нативным TBE PAGE показывают мутацию каталитических остатков RuvC в FnCpf1 (D917A и E1006A) и мутацию RuvC (D10A) каталитического остатка SpCas9 препятствует двуцепочечному разрезанию ДНК. Гель TBE PAGE с мочевиной показывает, что мутации каталитических остатков RuvC в FnCpf1 (D917A и E1006A) препятствуют никазной активности, в то время как мутации в RuvC (D10A) белка SpCas9 не препятствуют никазной активности в отношении таргетного сайта. Смотри рисунок S4. Особенности структуры и сиквенса Cpf1 crРНК ГидРНК для Cas9 обладает особенной вторичной структурой, благодаря которой происходит взаимодействие с белком; в сравнении с этим, гидРНК для FnCpf1 заметно проще устроена: РНК обладает одиночной шпилькой в последовательности прямого повтора (Рисунок 3A). Мы исследовали последовательность и структурные особенности crРНК, необходимые для участия в разрезании ДНК белком FnCpf1. Для начала мы выяснили оптимальную длину гид-последовательности: FnCpf1 требуется по меньшей мере 16 нуклеотидов гид-последовательности для получения различимого разрезания ДНК и минимум 18-нуклеотидная последовательность для достижения эффективного разрезания ДНК in vitro (Рисунок 5A). Продемонстрировано, что эти критерии аналогичны и для SpCas9: минимум 16-17 нуклеотидов спейсерной последовательности требуется для разрезания ДНК. Также мы обнаружили, что затравочный регион (seed-регион) FnCpf1 гидРНК находится приблизительно за первыми 5 нуклеотидами на 5’ конце спейсерной последовательности (Рисунок 5B и S3E). Затем мы исследовали влияние мутаций в прямом повторе на РНК-зависимое расщепление ДНК. Прямой повтор составляет 19 нуклеотидов в зрелой crРНК (Рисунок 2A). Укорочение прямого повтора показало, что для эффективного разрезания необходимо по меньшей мере 16, но, оптимально, больше 17 нуклеотидов повтора. Мутации в шпильке, при которых сохранялся РНК-дуплекс, не влияли на активность разрезания, в то время как мутации, разрушающие структуру дуплекса шпильки, вызывают полную утрату способности к разрезанию (Рисунок 5D). Наконец, замена оснований в петле шпильки не влияет на нуклеазную активность, в то время как урацил, идущий сразу за спейсерной последовательностью, не может быть заменен (Рисунок 5E). В целом, эти результаты говорят нам о том, что FnCpf1 узнает crРНК благодаря комбинации специфической последовательности и структуры шпильки.

Источник: журнал Cell (А) Влияние длины спейсера на активность разрезания ДНК белком FnCpf1. (B) Влияние замены нуклеотидов сrРНК на активность разрезания ДНК белком FnCpf1. Смотри рисунок S3E. (C) Влияние длины прямого повтора на активность разрезания ДНК белком FnCpf1. (D) Активность разрезания ДНК белком FnCpf1 зависит от особенности вторичной структуры (шпильки) прямого повтора РНК. (E) Активность разрезания ДНК белком FnCpf1 не изменяется при мутациях в петле, но чувствительна к мутациям 3’-конца прямого повтора. Смотри рисунок S4. Белки семейства Cpf1 из разных бактерий обладают сходной структурой crРНК и ПАМ Основываясь на нашем предыдущем опыте приспособления Cas9 для редактирования генома клеток млекопитающих, можно сказать, что лишь малая часть бактериальных нуклеаз может эффективно функционировать при гетерологической экспрессии в клетках млекопитающих. Поэтому, с целью достичь возможности применения Cpf1 в редактировании генома, мы изучили разнообразие белков семейства Cpf1 по их сиквенсам, взятым из общедоступных баз данных. Поиск BLAST в базе WGS в NCBI выявил 46 недублирующихся белков семейства Cpf1 (Рисунок S5A), из которых мы выбрали 16 кандидатов, которые на основе реконструкции филогении (Рисунок S5A) представляют всё разнообразие Cpf1 (Рисунок 6A и S5). Длина белков этого семейства находится в диапазоне между ~1200 и ~1500 аминокислотными остатками. Последовательность прямого повтора каждого белка семейства Cpf1 обладает строгой консервативностью 19го нуклеотида на 3’-конце прямого повтора – этот участок включается в процессирующуюся crРНК (Рисунок 6В). 5’ последовательность прямого повтора куда более разнообразна. Из 16 белков семейства Cpf1, выбранных для анализа, 3 (2, Lachnospiraceae bacterium MC2017, Lb3Cpf1; 3, Butyrivibrio proteoclasticus, BpCpf1; и 6, Smithella sp. SC_K08D17, SsCpf1) были ассоциированы с последовательностью прямого повтора, которая заметно отличалась от последовательности FnCpf1 (Рисунок 6В). Как бы то ни было, эти последовательности сохраняли такую же или почти такую же шпильку, характерную для прямого повтора FnCpf1 (Рисунок 6С). Принимая во внимание высокую консервативность прямого повтора, встречающуюся у большинства белков семейства Cpf1, мы в первую очередь протестировали способность ортологичной последовательности прямого повтора поддержать нуклеазную активность FnCpf1 in vitro. Как и ожидалось, прямой повтор, содержащий основную консервативную последовательность, позволяет белку быть эквивалентным FnCpf1 в работе. В то же время, прямые повторы от кандидатов 2 (Lb3Cpf1) и 6 (SsCpf1) были неспособны поддерживать разрезающую активность FnCpf1 (Рисунок 6D). Прямой повтор от кандидата 3 (BpCpf1) поддерживал только низкий уровень нуклеазной активности FnCpf1 (Рисунок 6D), возможно, в связи с консервативностью расположения урацилов на 3’конце. Затем мы провели анализ распознавания ПАМ in vitro (Рисунок S6A), чтобы определить ПАМ-последовательность для каждого белка семейства Cpf1. Мы смогли установить последовательность для семи новых белков семейства Cpf1 (Рисунок 6E, S6B, S6C), также этот скрининг подтвердил последовательность ПАМ для FnCpf1: 5’-TTN. У 8 оставшихся тестируемых Cpf1 белков не была выявлена способность к расщеплению в условиях реконструкции in vitro. ПАМ последовательность для белков семейства Cpf1 преимущественно богата тимином, а различается лишь по числу тиминов в составе каждого ПАМ (Рисунок 6E, S6B, S6C).

Источник: журнал Cell (A) Филогенетическое дерево 16 ортологов Cpf1, выбранных для функционального анализа. Консервативные последовательности обозначены темно-серым. Выделены RuvC домен, спиральный регион и цинковые пальцы. (B) Выравнивание прямых повторов 16 белков семейства Cpf1. Последовательности, удаляемые после созревание crРНК, выделены серым. Неконсервативные основания выделены красным. Дуплекс шпильки выделен темно-серым. (C) Предсказание укладки РНК в прямом повторе зрелой crРНК. Предполагаемая структура FnCpf1 и белков с других локусов типа V. (D) crРНК типа V из разных бактерий с похожими прямыми повторами способны вместе с FnCpf1 разрезать ДНК. (E) Последовательности ПАМ для 8 белков семейства Cpf1 были определены благодаря расщеплению in vitro плазмидных библиотек, в которых протоспейсер был фланкирован рандомными ПАМ. Смотри рисунок S5 и S6. Cpf1 может быть использован для редактирования генома в клетках человека Мы протестировали каждый белок семейства Cpf1, для которого было возможно определить ПАМ, на наличие нуклеазной активности в клетках млекопитающих. Мы провели оптимизацию кодонов каждого из этих генов и прикрепили на C-конец полученных белков последовательность ядерной локализации для оптимальной экспрессии и прямой доставки в ядро человеческих клеток (Рисунок 7A). Для проверки активности каждого белка семейства Cpf1 мы выбрали таргетный сайт для гидРНК внутри гена DNMT1 (Рисунок 7B). Сначала мы обнаружили, что все белки семейства Cpf1 наряду с соответствующей crRNA, нацеленной на DNMT1, были способны разрезать in vitro ампликон DNMT1 региона, полученный в ходе ПЦР (Рисунок 7C). В то же время, в тесте на клетках почки эмбриона человека линии 293FT (HEK293FT) только 2 из 8 белков семейства Cpf1 (7, AsCpf1 и 13, LbCpf1) показали детектируемый уровень инсерционно-делеционных мутаций, возникших после работы нуклеаз (Рисунок 7C и 7D). Этот результат согласуется с предыдущими экспериментами для Cas9, в которых лишь небольшое число ортологов Cas9 оказались пригодными для редактирования генома в клетках млекопитающих. Затем мы протестировали каждый белок семейства Cpf1 с дополнительными геномными мишенями и обнаружили, что AsCpf1 и LbCpf1 всякий раз участвуют в редактировании генома в клетках HEK293FT, тогда как оставшиеся Cpf1 белки не проявляют детектируемой активности или проявляют лишь спорадическую активность (Рисунок 7E и S7) вместо постоянной экспрессии (Рисунок S6D). Единственный Cpf1 кандидат, который почти не экспрессировал, - это PdCpf1 (Рисунок S6D). Нуклеазы AsCpf1 и LbCpf1 обеспечивают сравнимый с Cas9 уровень формирования инсерционно-делеционных мутаций (Рисунок 7E). В добавок ко всему, мы использовали разрезание in vitro с последующим секвенированием разрезанных концов ДНК по Сэнгеру и обнаружили, что 7 (AsCpf1) и 13 (LbCpf1) тоже образуют ступенчатые разрывы (Рисунок S6E и S6F, соответственно).

Источник: журнал Cell (A) Благодаря использованию векторов на основе цитомегаловируса клетки линии HEK293FT экспрессировали 1 из 8 белков семейства Cpf1. С помощью ПЦР фрагментов, содержащих промотор U6, стоящий перед последовательностью crРНК, в этих клетках экспрессировались и соответствующие белкам crРНК. Трансфецированные клетки были проанализированы с помощью нуклеазы Surveyor или направленного глубокого секвенирования. (B) На схеме представлена последовательность crРНК3 с таргетом DNMT1. На полученных сиквенсах видны инсерционно-делеционные мутации. (C) Сравнение нуклеазной активности in vitro и in vivо. Таргетный участок DNMT1 амплифицировали с помощью ПЦР, полученный геномный фрагмент использовали для теста на Cpf1-зависимое расщепление. Все 8 белков семейства Cpf1 разрезали ДНК in vitro (сверху), но лишь 7 белок, AsCpf1 и 13, Lb3Cpf1 формировали инсерционно-делеционные мутации в клетках человека. (D) Таргетные последовательности (участки) для Cpf1 и SpCas9 в человеческих локусах DNMT1 и EMX1. (E) Сравнение эффективности редактирования генома для Cpf1 и SpCas9. Таргетные сайты соотносятся с последовательностями, представленными на Рисунке 7D. Смотри рисунок S7.

ОБСУЖДЕНИЕ В этой работе мы охарактеризовали Cpf1-содержащие CRISPR системы второго класса, которые относятся к типу V и показали, что эффекторный белок этих систем - Cpf1 - является эндонуклеазой, направляемой одноцепочечной РНК. Cpf1 значительно отличается от Cas9 - единственного описанного эффектора второго класса на сегодняшний день. Структура и функции Cpf1 обладают важными преимуществами для применения этого белка с целью редактирования генома. Так Cpf1 содержит единственный идентифицированный нуклеазный домен в сравнении с двумя нуклеазными доменами Cas9. Результаты, представленные здесь, показывают, что инактивация RuvC-подобного домена белка FnCpf1 прекращает разрезание обеих цепей ДНК. Предположительно, FnCpf1 формирует гомодимер (Рисунок S2В), а RuvC-подобный домен каждой субъединицы разрезает одну цепь ДНК. Мы все еще мы не можем исключить вероятность того, что FnCpf1 содержит второй, еще не идентифицированный нуклеазный домен. Описание структуры комплексов Cpf1-РНК-ДНК позволит проверить эту гипотезу и выяснить механизм разрезания. Возможно, самая заметная особенность Cpf1 в том, что это эндонуклеаза, управляемая одноцепочечной crРНК, в то время как для Cas9 требуется tracrРНК для процессинга crРНК кассет, а для интерференции требуется crРНК и tracrРНК. Cpf1 работает с crРНК вне зависимости от tracrРНК, а комплекс Cpf1-crРНК сам по себе разрезает таргетную молекулу ДНК, без нужды в каких-либо добавочных видах РНК. Эта особенность может упростить дизайн и доставку инструментов редактирования генома. Например, короткая (~42 нуклеотида) crРНК, необходимая для Cpf1, имеет практические преимущества над длинной (~100 нуклеотидов) гидРНК в системах с Cas9, потому что более короткие РНК-олигонуклеотиды значительно легче и дешевле синтезировать. В добавок ко всему, эта находка увеличивает число фундаментальных вопросов, касающихся механизма процессинга гидов в системах CRISPR/Cas типа V. В случае типа II процессинг пре-crРНК катализируется бактериальной РНКазой III, которая распознает длинный дуплекс, сформированный tracrРНК и комплементарным участком прямого повтора. Такие длинные дуплексы не возникают с пре-crРНК в системах типа V, делая маловероятным тот факт, что РНКаза III ответственна за процессинг. Дальнейшие эксперименты, нацеленные на выяснение механизмов работы системы типа V, прольют свет на функциональное разнообразие систем CRISPR/Cas. Cpf1 делает ступенчатый разрыв с 5’ выступающим концом, в отличие от тупых концов, образующихся после работы Cas9. Структура продукта, полученного после разрезания, может быть чрезвычайно удобной и облегчит генные вставки в геном млекопитающих при помощи негомологичного соединения концов. Способность программировать точную последовательность липкого конца позволит исследователям так встраивать ДНК, чтобы она интегрировала в геном в правильной ориентации. Особенно в неделящихся клетках, в которых редактирование генома с помощью гомологической репарации является весьма сложной задачей, использование Сpf1 может послужить эффективным способом точно вставлять ДНК в геном независимым от гомологии механизмом. Другая потенциально полезная особенность Cpf1 заключается в том, что Cpf1 разрезает таргетную ДНК с дистального конца протоспейсера, вдали от затравочного региона (seed-регион), что может способствовать внесению новых последовательностей ДНК: Cpf1-индуцируемые инсерционно-делеционные мутации будут расположены далеко от таргетного сайта, который таким образом сохранится для последующих этапов Cpf1 разрезания. С Cas9 любые инсерционно-делеционные мутации, возникающие вследствие доминантного пути репарации с помощью негомологичного соединения концов, будут разрушать таргетный сайт, эффективно устраняя возможность вставки новой ДНК в конкретном сайте в этой конкретной клетке. В случае Cpf1 кажется возможной такая ситуация: если первый цикл таргетинга заканчивается инсерционно-делеционной мутацией, то следующий уровень таргетинга может быть исправлен с помощью гомологической репарации. Ожидается, что дальнейшие исследования этой и других стратегий использования Cpf1, и других эффекторов класса 2, помогут найти решения для некоторых трудностей редактирования генома. Для семейства Cpf1 характерны тимин-богатые ПАМ, они пригодны для редактирования АТ-богатой ДНК, такой как у Plasmodium falciparum, или для АТ-богатых зон, таких как скэффолд/матрикс ассоциированные участки. На сегодняшний день все охарактеризованные белки редактирования генома млекопитающих требуют присутствия по меньшей мере одного гуанина, поэтому тимин и тимин/цитозин-зависимые ПАМ белков семейства Cpf1 расширяют таргетное пространство для РНК-зависимых нуклеаз, редактирующих геном. Естественное разнообразие систем CRISPR открывает массу возможностей для понимания происхождения и эволюции приобретенного иммунитета прокариот, а также для использования биотехнологических инструментов, способных изменяться. Нет никакого сомнения, что вне уже классифицированного и охарактеризованного разнообразия типов CRISPR/Cas есть другие системы со своими особенностями; эти системы ждут своего открытия и в дальнейшем помогут наращивать темпы редактирования генома, развивать иные области биотехнологии, а также прольют свет на эволюцию этих защитных систем.

ПРОТОКОЛЫ Создание плазмид для гетерологической экспрессии Для создания FnCpf1 локуса для гетерологической экспрессии геномная ДНК из Francisella novicida (любезно предоставлена Wayne Conlan) была амплифицирована с помощью ПЦР с использованием Herculase II полимеразы (Agilent Technologies) и клонирована в pACYC-184 (использовался кит от Gibson cloning, New England Biolabs). Клетки были приведены в компетентное состояние с использованием набора Z-competent kit (Zymo). Последовательности всех плазмид можно посмотреть в Таблице S1. Секвенирование бактериальной РНК РНК была выделена из бактерий, находящихся в стационарной фазе. Сначала F. novicida (любезно предоставлена Wayne Conlan) и E. coli ресуспендировали в TRIzol’е, затем гомогенизировали бактерии с бусинами из циркония или кремния (BioSpec Products) на приборе BeadBeater (BioSpec Products) 3 цикла по 1 минуте. Тотальная РНК была выделена из гомогенизированных образцов по Direct-Zol RNA miniprep протоколу (Zymo), очищение от ДНК проводилось с помощью ДНКазы TURBO (Life Technologies), а 3’-дефосфорилирование проводилось с помощью T4 полинуклеотид-киназы (New England Biolabs). рРНК была удалена с помощью набора bacterial Ribo-Zero rRNA removal kit (Illumina). РНК библиотеки были приготовлены из очищенной от рРНК РНК с использованием NEBNext Small RNA Library Prep Set for Illumina (New England Biolabs), а селекция по размеру проводилась с использованием Pippin Prep (Sage Science). Для гетерологической экспрессии локуса FnCpf1 в E.coli были приготовлены библиотеки сиквенсов РНК из РНК, очищенной от рРНК, в работе использовалась модификация протокола секвенирования CRISPR РНК. Сначала транскрипты были полиаденилированы с помощью полимеразы PolyA E.coli (New England Biolabs), затем лигированы с 5’-РНК адапторами с использованием Т4 РНК-лигазы 1 (лигаза одноцепочечной РНК) высокой концентрации (New England Biolabs), после чего была проведена обратная транскрипция с помощью обратной транскриптазы AffinityScript Multiple Temperature Reverse Transcriptase (Agilent Technologies). кДНК была амплифицирована с помощью ПЦР с мечеными праймерами, опять использовалась полимераза Herculase II (Agilent Technologies). Анализ РНК-сиквенсов Приготовленные кДНК библиотеки были секвенированы на MiSeq (Illumina). Риды из каждого образца были идентифицированы на основе меток, полученных от праймеров и выровнены по соответствующим референсным геномам базы RefSeq с использованием софта BWA. Выравнивания парных концов были использованы для поиска последовательностей полных транскриптов с использованием софта Picard tools , затем последовательности анализировали в программе Geneious 8.1.5 (Biomatters). In vivo скрининг ПАМ FnCpf1 Библиотека плазмид с рандомными ПАМ была сконструирована с использованием синтезированных олигонуклеотидов (IDT), состоящих из 8 или 7 рандомных нуклеотидов, находящихся соответственно слева или справа от FnCpf1 спейсера-1. Рандомные одноцепочечные ДНК-олигонуклеотиды после отжига короткого праймера с использованием фрагмента Кленова (New England Biolabs) формировали двойную спираль. Двуцепочечный ДНК продукт был внесен в линейную плазмиду pUC19 (обычно эта плазмида в кольцевой форме) с использованием набора Gibson cloning (New England Biolabs). Компетенты Stbl3 E. coli (Invitrogen) были трансформированы продуктами клонирования и больше 10^7 клеток были собраны. Плазмидная ДНК была собрана набором Maxi-prep kit (QIAGEN). Мы трансформировали 30 нг собранной библиотеки в клетки E. coli, несущие FnCpf1 локус, или в контрольные pACYC184. После трансформации клетки были высажены на среду с ампициллином. После 16 часов культивации больше 4E6 клеток были собраны, плазмидную ДНК выделили с помощью набора Maxi-prep kit (QIAGEN). Таргетный ПАМ участок был амплифицирован и секвенирован на MiSeq (Illumina) с использованием набора single-end 150 cycle kit. In vivo скрининг ПАМ FnCpf1 Участки ПАМ были выделены, подсчитаны и нормализованы к общему количеству ридов в каждом образце. Для данного ПАМ, обогащение обозначается как логарифмическое отношение к контролю pACYC184, с внесением корректировки в виде псевдоотсчета равного 0.01. ПАМ выше пороговой величины 3,5 используются для создания лигатуры последовательностей. Проверка работоспособности ПАМ Последовательности, соответствующие ПАМ и не-ПАМ были клонированы в плазмиду pUC19 и сшиты лигазой Т4 (Enzymatics). Компетенты E. coli с плазмидой содержащей FnCpf1 локус или с контрольной плазмидой pACYC184 были трансформированы 20 нг ПАМ плазмид и высажены на чашки со средой LB с ампициллином и хлорамфениколом. Колонии были собраны через 18 часов. Синтез crРНК и одноцепочечных гидРНК Все crРНК и одноцепочечные гидРНК, используемые в биохимических превращениях были синтезированы с использованием набора HiScribe T7 High Yield RNA Synthesis Kit (NEB). Одноцепочечные ДНК олигонуклеотиды (Таблица S2), комплементарные таргетной последовательности РНК, были синтезированы IDT (Integrated DNA Technologies) и соединены с короткой праймирующей последовательностью Т7. Транскрипция T7 проводилась в течение 4 часов, затем РНК была выделена с использованием набора MEGAclear Transcription Clean-Up Kit (Ambion). Очистка белка Cpf1 Белок FnCpf1 был клонирован в бактериальный вектор экспрессии (6-His-MBP-TEV-Cpf1,вектор на основе pEТ, предоставленный Дугом Дэниелсом). В 2 литра культуральной среды Terrific Broth с ампициллином в концентрации 100 мкг/мл было внесено 10 мл ночной культуры Rosetta (DE3) pLyseS (EMD Millipore) с клетками, содержащими конструкцию, экспрессирующую Cpf1. Бактерии в культуральной среде росли при 37С, по достижении плотности клеток 0,2 OD600, температуру понизили до 21С. Рост продолжался до достижения 0,6 OD600, после чего добавлялось 500 мМ IPTG для индуцирования MBP-Cpf1 экспрессии. Культура была простимулирована за 14-18 часов до сбора клеток и заморожена на -80С до выделения. Клеточную массу ресуспендировали в 200 мл буфера для лизиса (50 мM HEPES , 2M NaCl, 5 мM MgCl2, 20 мM имидазол) с добавлением протеазных ингибиторов (Roche cOmplete, без EDTA) и лизоцима (Sigma). Клеточный гомогенат разрушали ультразвуком (Branson Sonifier 450) и центрифугировали на 10000g 1 час для очистки лизата, затем лизат пропускали через фильтр с размером пор 0,22 микрона (Millipore, Stericup) и переносили в колонку для хроматографии (HisTrap FF, 5 ml), промывали и элюировали градиентом имидазола. Фракции, содержащие белок ожидаемого размера, объединяли, добавляли TEV протеазу (Sigma), после чего на протяжении ночи проводили диализ в TEV буфере (500 mM NaCl, 50 mM HEPES , 5 мM MgCl2, 2 mM DTT). После диализа деградацию TEV подтверждали с помощью электрофореза белков в ПААГ (SDS-PAGE), образец концентрировали до 500 мкл перед загрузкой в колонку для гель-фильтрации (HiLoad 16/600 Superdex 200) методом быстрой жидкостной белковой хроматографии (AKTA Pure). Фракции после гель-фильтрации были проанализированы с помощью электрофореза белков в ПААГ (SDS-PAGE); фракции, содержащии Cpf1 были объединены и концентрированы до 200 мкл, часть в итоге была заморожена на -80С для хранения, а другая часть использована в дальнейшем исследовании. Для рассчета примерного размера FnCpf1 стандарты для гель фильтрации пропускали в той же колонке (колонка была предварительно уравновешена раствором 2M NaCl, HEPES (pH 7.0)). Сбор лизата белка Cpf1 Оптимизация кодонов была применена для генов Cpf1, так же был добавлен сигнал ядерной локализации (на С-конец), гены клонировали в плазмиду pcDNA3.1 Genscript (Table S1). По достижении конфлюентности клетки линии HEK293FT, высаженные на 6-луночный планшет, были трансфецированы 2 нг плазмид, экспрессирующих Cpf1, с ипользованием реагента Lipofectamine 2000 (Life Technologies). Через 48 часов клетки были отмыты DPBS (Life Technologies) и обработаны лизирующим буфером (20 mM HEPES , 100 mM KCl, 5mM MgCl2, 1 mM DTT, 5% glycerol, 0.1% Triton X-100, 1X cOmplete Protease Inhibitor Cocktail Tablets ), после чего были обработаны скребком и собраны. Лизат обрабатывали 10 минут в соникаторе (Diagenode), а затем центрифугировали. Супернатант был заморожен для последующего использования в in vitro анализе разрезания. Анализ разрезания in vitro Разрезание in vitro проводилось как с очищенным белком (25 нМ), так и с лизатом клеток млекопитающих, содержащих белок. Разрезание проводилось при температуре 37С в буфере для разрезания (NEBuffer 3, 5 mM DTT) в течение 20 минут. В реакции расщепления использовали 500 нг синтезированной crРНК или одноцепочечной гидРНК и 200 нг таргетной ДНК. Таргентая ДНК включала в себя либо протоспейсеры, клонированные в плазмиду pUC19, либо ПЦР ампликоны геномной ДНК изолированной из клеток HEK293. Продукты реакции были очищены в колонках PCR purification columns (QIAGEN) и разгонялись в 2% агарозном геле E-gels (Life Technologies). Для последующего анализа расщепления нуклеазами с мутациями (анализ с помощью нативного или денатурирующего электрофореза) проводилась очистка в TBE 6% ПААГ или TBE-мочевина 6% ПААГ (Life Technologies). In vitro скрининг ПАМ последовательностей для белков Cpf1-семейства Реакции разрезания с белками семейства Cpf1 in vitro проводились в Е-гелях из 2% агарозы (Life Technologies). Бэнды, соответствующие неразрезанной мишени, были экстрагированы из геля с использованием кита QIAquick Gel Extraction (QIAGEN), таргетная ПАМ область была амплифицирована и секвенирована на MiSeq (Illumina) с помощью набора single-end 150 cycle kit. Секвенирование результатов подробнее описано в разделе “Последовательная программная обработка для обнаружения ПАМ”. Вестерн-блот анализ Клетки лизировали в однократном буфере RIPA (Cell Signaling Technology) с добавлением протеазных ингибиторов (Roche). Равные объемы клеточного лизата разгоняли в гелях BOLT с градиентом Bis-Tris в концентрации 4-12% (Invitrogen), после чего переносили на ПВДФ мембраны (Millipore). Неспецифическое связывание антигенов блокировалось в течение 1 часа в растворе TBST (50 mM Tris, 150 mM NaCl and 0.05% Tween-20) с блокирующим реагентом 5% BLOT-QuickBlocker Reagent (Millipore). Мембраны инкубировали с первыми антителами (анти-HA-tag или анти-GAPDH, конъюгированные с пероксидазой хрена ) в течение 1 часа, антитела были разведены на 1% блокирующем растворе (TBST с 1% BLOT-QuickBlocker). Мембраны отмывали трижды по 10 минут, а мембраны с анти-HA-tag далее инкубировали со вторыми антителами (антитела против кроличьих антител ) в течение 1 часа, после чего проводили 6 отмывок по 10 минут в TBST. Белки детектировали с помощью West Pico Chemiluminescent Substrate (Life Technology) на приборе ChemiDoc MP Imaging System (Bio-Rad), изображения обрабатывали в программе ImageLab (Bio-Rad). Использование нуклеазы Surveyor для модификации генома С помощью фермента Herculase II (Agilent Technologies) и подходящих обратных праймеров для U6 (Таблица S2) были созданы ПЦР ампликоны, содержащие U6 промотор, который запускал экспрессию crРНК. 400 нг плазмид, экспрессирующих Cpf1 и 100 нг U6::crRNA кассеты экспрессии трансфецировали в клетки HEK293FT, находящиеся в 24-луночном планшете по достижению ими 75%–90% конфлюентности (трансфецирующий агент Lipofectamine 2000 (Life Technologies)). Перед экстракцией геномной ДНК клетки инкубировали при 37С в течение 72 часов после трансфекции. ДНК выделяли с помощью раствора QuickExtract DNA Extraction Solution, руководствуясь протоколом производителя (Epicenter). Геномный участок, фланкирующий таргетный сайт для CRISPR в каждом гене, был амплифицирован с помощью ПЦР, продукты были очищены на колонке QiaQuick Spin Column (QIAGEN), следуя протоколу производителя. К 200–500 нг очищенных ПЦР продуктов добавили 1 мл 10х ПЦР буфера для Taq ДНК полимеразы (Enzymatics) и довели до 10 мл сверхчистой водой; затем, для того чтобы ок избежать образования гетеродуплексов, применили следующую программу: 95C - 10 мин, с 95C до 85C (-2C/сек), с 85C до 25C (-0.25C/сек) и 25C 1 мин. После этого продукты реакции обработали нуклеазой SURVEYOR и энхансером SURVEYOR enhancer S (Integrated DNA Technologies), следуя протоколам производителя. Полученные пробы анализировали в полиакриламидном геле с 4%–20% Novex TBE (Life Technologies). Гели с ДНК окрашивались SYBR Gold DNA stain (Life Technologies) в течение 10 мин, изображения получали на Gel Doc gel imaging system (Bio-rad). Количественный подсчет был основн на сравнении относительной интенсивности бэндов. Процент инсерционно-делеционных мутаций высчитывался по формуле 100*(1-sqrt(1-(b+с)/(a + b + c))), где а – суммарная интенсивность незадействованного ПЦР продукта, b и c – суммарные интенсивности для каждого из продуктов разрезания. Характеристика паттернов инсерционно-делеционных мутаций, возникших после работы Cpf1 эндонулеазы в клетках 293FT с помощью метода глубокого секвенирования Клетки HEK293FT трансфецировали и собирали как было описано в протоколе оценки активности разрезания белком Cpf1. Геномные участки, фланкирующие DNMT1, были амплифицированы двухраундной ПЦР для того, чтобы добавить Р5 адаптеры для Illumina и специфичные для каждого таргетного ампликона метки. Продукты ПЦР разгоняли в 2% E-gel (Invitrogen), из геля экстрагировали с использованием QiaQuick Spin Column (QIAGEN), следуя рекомендациям производителя. Количественный анализ образцов проводился в флуориметре Qubit 2.0 Fluorometer (Life Technologies). Приготовленные библиотки кДНК секвенировали на MiSeq, используя набор single-end 300 cycle kit (Illumina). Картирование инсерционно-делеционных мутаций проведено с использованием Python и Geneious 6.0.3 Read Mapper. Компьютерный анализ локусов Cpf1 Программа PSI-BLAST использовалась для идентификации гомологов Cpf1 в базе данных NCBI NR, в качестве входных данных использовали несколько уже известных сиквенсов Cpf1 с порогом 0,01 для E-value и выключенным фильтром для последовательностей с высокой вырожденностью аминокислот, статистическая обработка состава так же была выключена. Программа TBLASTN с порогом 0,01 для E-value и выключенным фильтром для последовательностей с высокой вырожденностью аминокислот использовалась для поиска в базе данных NCBI WGS, в качестве выходных данных использовали несколько известных сиквенсов Cpf1. Результаты всех поисков были объединены (Таблица S3). Программа HHpred использовалась без изменения исходных параметров для того, чтобы идентифицировать сходство малых сиквенсов с использованием в виде входных данных подмножества репрезентативных сиквенсов Cpf1. Парные выравнивания были получены в программах PSI-BLAST и HHpred, руководствуясь ими, была настроена программа MUSCLE, в которой затем были сделаны множественные выравнивания. Филогенетический анализ проведен в программе FastTree с эволюционной моделью WAG и дискретной гамма моделью с 20 категориями. Вторичная структура белка предсказана в программе Jpred 4. CRISPR повторы были идентифицированы с помощью программы PILER-CR и CRISPRfinder.

ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ

Источник: журнал Cell (A) Трансформация E. coli с pFnCpf1 библиотекой плазмид с рандомными 5’-ПАМ последовательностями. Некоторые плазмиды были элиминированы. Графики элиминирования ранжированы. Элиминация измеряется как логарифмическое (–log2) отношение нормализованной частоты элиминации к количеству контрольных плазмид pACYC184 E. coli; ПАМ выше пороговой величины 3,5 используются для создания лигатуры последовательностей. (B) Трансформация E. coli с pFnCpf1 библиотекой плазмид с рандомными 3’-ПАМ последовательностями. Некоторые плазмиды были элиминированы. Графики элиминирования ранжированы. Элиминация измеряется как логарифмическое (–log2) отношение нормализованной частоты элиминации к количеству контрольных плазмид pACYC184 E. coli; ПАМ выше пороговой величины 3,5 используются для создания лигатуры последовательностей. (C) Библиотека плазмид с рандомными 5’-ПАМ. Графики элиминирования ранжированы. Элиминация измеряется как логарифмическое (–log2) отношение нормализованной частоты элиминации к количеству контрольных плазмид pACYC184 E. coli; ПАМ выше пороговой величины 3,5 используются для создания лигатуры последовательностей. (D) Число уникальных последовательностей, преодолевших порог значимости для парных комбинаций оснований во втором и третьем положении 5’-ПАМ

Источник: журнал Cell (A) Акриламидный гель, окрашенный Кумасси показывает пошаговую очистку FnCpf1. Бэнд над 160 кДа элюирован из Ni-NTA колонки в соответствии с размером комплекса мальтоза-связывающего белка (MBP) и FnCpf1 (189,7 кДа). После добавления TEV протеазы появляется самый низкий по молекулярной массе бэнд, он соответствует размеру свободного белка FnCpf1 (147 кДа). (B) Эксклюзионная хроматография FnCpf1. FnCpf1 элюируется примерно на 300 кДа (62.65 мл) – это может говорить о том, что Cpf1 в растворе имеет форму димера. (C) Белковые стандарты, используемые для калибровки колонки Superdex 200. BDex = Голубой Декстран (свободный объем), Ald = Альдолаза (158 кДа), Ov = Овальбумин (44 кДа), RibA = Рибонуклеаза A (13.7 кДа), Apr = Апротинин (6.5 кДа). (D) Калибровочная кривая колонки Superdex 200. Ka = (элюирующий объем – свободный объем)/(геометрический объем колонки – свободный обеъем). Стандарты отложены на графике и совпадают с логарифмической кривой.

Источник: журнал Cell Секвенирование по Сэнгеру кусочков ДНК, оставшихся после расщепления белком FnCpf1, выявило наличие ступенчатого разрыва. Наличие дополнительного аденина, отмеченного как N – артефакт полимеразы, используемой в секвенировании. Представлены прочтения для разных TTN ПАМ с протоспейсером 1 (A), протоспейсером 2 (B), протоспейсером 3 (C), и таргетами DNMT1 и EMX1 (D). Сайты разрезания отмечены красными треугольниками. Маленькие треугольники указывают места предполагаемых альтернативных сайтов разрезания. (E) Влияние некомплементарности в crРНК на активность разрезания белком FnCpf1

Источник: журнал Cell Множественное выравнивание аминокислотных последовательностей FnCpf1, AsCpf1 и LbCpf1 выявило множество высоко консервативных участков. Эти участки выделены красным фоном, консервативные мутации отмечены красным текстом. Предполагаемая вторичная структура отмечена выше (FnCpf1) и ниже (LbCpf1) выравниваний. А-спирали показаны волнистой линией, а b-слои – пунктирной линией. Предполагаемые каталитические участки отмечены желтым. Белковые домены, идентифицированные на Рискунке 1А так же выделены.

Источник: журнал Cell (A) Эволюционные взаимоотношения между белками Cpf1 разных бактериальных штаммов. Пронумерованные цепочки относятся к претендентам, которые были синтезированы для функциональных экспериментов (отмечено красным). (B) Карта локусов бактериального генома, соответствующих 16 белкам семейства Cpf1, отобранных для экспериментов на млекопитающих.

Источник: журнал Cell (A)Схема скрининга ПАМ in vitro с использованием белков семейства Cpf1. Библиотеки плазмид, несущих рандомные 5’-ПАМ были по отдельности обработаны несколькими белками семейства Cpf1 и соответствующими им crРНК. Плазмидная ДНК, которая не была разрезана после этой обработки была выделена и секвенирована для идентификации специфичных мотивов ПАМ, которые были элиминированы. (B) Число уникальных последовательностей, преодолевших порог значимости для парных комбинаций оснований во втором и третьем положении 5’-ПАМ для 7 - AsCpf1. (C) Число уникальных последовательностей, преодолевших порог значимости для тройных комбинаций оснований во втором, третьем и четвертом положении 5’-ПАМ для 13 – LbCpf1. (D) Вестерн блот ортологов Cpf1 свидетельствует о стабильной экспрессии всех тестируемых ортологов. (E и F) Секвенирование по Сэнгеру таргетной последовательности белка 7 – AsCpf1 (E) и 13 – LbCpf1 (F) говорит о наличии ступенчатого разрыва. Наличие дополнительного аденина, отмеченного как N – артефакт полимеразы, используемой в секвенировании. Сайты разрезания отмечены красными треугольниками. Маленькими треугольниками отмечены предполагаемые альтернативные сайты разрезания.

Источник: журнал Cell На гелях с Surveyor проведен количественный анализ эффективности инсерционно-делеционных мутаций, достигнутых каждым белком семейства Cpf1 на DNMT1 таргетных сайтах 1, 2 и 4 и на участках 1 и 2 для EMX1, соответственно. (F) Распределение инсерционно-делеционных мутаций для AsCpf1 и LbCpf1 и DNMT1 таргетных участков 2, 3 и 4. Голубые столбцы отражают полное покрытие инсерционно-делеционными мутациями; синие представляют распределение 3’-концов инсерционно-делеционных мутаций. Для каждого образца последовательность ПАМ отмечена красным, а таргентная последовательность – синим. Дополнительная информация также включает в себя три таблицы, которые можно загрузить для презентаций и можно найти вместе с этой статьей в онлайн-доступе на doi:10.1016/j.cell.2015.09.038

БЛАГОДАРНОСТИ Нам хотелось бы поблагодарить R. Macrae за критический взгляд на рукопись. Нам хотелось бы поблагодарить Wayne Conlan и David S. Weiss за то, что они любезно предоставили соответственно геномную ДНК и клеточную массу F. novicida, Doug Daniels за предоставление бактериального вектора экспрессии, а также Сергея Шмакова и Yuri Wolf за помощь в анализе сиквенсов. Внутренняя программа Департамента здоровья и социального обеспечения (в Национальной библиотеке медицины) осуществляла поддержку E.V.K. и K.S.M. D.O.E. Товарищество выпускников вычислительных наук осуществляло поддержку J.S.G. NIMH (5DP1-MH100706), Центр Poitras, Vallee, Simons, Paul G. Allen, David R. Cheng, Tom Harriman, Bob Metcalfe и Нью-Йоркский фонд стволовых клеток осуществляли поддержку F.Z. Была подана заявка на патент, связанный с этой работой – авторы планируют сделать реагенты широко доступными для научного сообщества с помощью Addgene и обеспечивать программными инструментами через сайт лаборатории Zhang (www.genome-engineering.org). F.Z. является основателем компании Editas Medicine и научным консультантом в Editas Medicine и Horizon Discovery. Получена: 28 августа 2015 Проверена: 15 сентября 2015 Принята: 17 сентября 2015 Опубликована: 25 сентября 2015 Оригинал статьи Перевод: Полина Тиканова Картинки: Полина Тиканова Редакция: Deepest Dephts, Test Page, Азат Муртазин, Даня Ряскина, Зенфира Махмудова, Михаил Гусев, Полина Тиканова