Искусственная эволюция и редактирование генома
Существование всего живого на Земле построено на механизме деления клеток. Драйвер этого процесса ДНК — макромолекула, хранящая в себе информацию о строении и организации живых организмов и инструкции по передаче и реализации этой информации в следующих поколениях. Язык ДНК состоит из четырех букв — азотистых оснований: А (аденина), Т (тимина), Г (гуанина) и Ц (цитозина), повторяющихся в последовательности ДНК много-много раз. Такой четырехбуквенный алфавит особым образом организуется в уникальный текст длиной приблизительно в 3 млрд букв, описывающий каждого из нас. Структура ДНК определяет, как клетки могут делиться и передавать информацию друг другу, а потом — и следующим поколениям. Клетка, в данном случае, — это некая машина, которая позволяет ДНК существовать и делиться. Однако при копировании столь длинных текстов неизбежны ошибки. Именно за счет этих ошибок вся существующая жизнь на планете столь разнообразна.
Первичную работу над ошибками ДНК проводят сами клетки. Они делают это посредством особых белков (белков репарации), которые находят ошибки в ДНК-тексте и исправляют их. Именно исследования в области репарации клеток послужили толчком к поиску и разработке методов редактирования ДНК. Путем искусственной эволюции были синтезированы нуклеазы — ферменты, позволяющие расщеплять связи между азотистыми основаниями ДНК.
Нуклеазы цинковых пальцев (ZFN, Zink Finger Nucleases)
Первыми среди искусственно синтезированных нуклеаз стали zinc-finger нуклеазы (нуклеазы «цинковых пальцев», ZFN), которые были получены путем слияния белков цинкового пальца и эндонуклеазы FokI. В этой системе цинковые пальцы являются белковыми модулями, которые связываются со специфическими участками молекулы ДНК (каждый белковый модуль связывается с тремя нуклеотидами целевой молекулы ДНК). Для распознавания длинных последовательностей ДНК, белки цинкового пальца связывают последовательно друг с другом в цепочку [1].
Следующей составной частью системы является бактериальная рестриктаза (относится к классу эндонуклеаз) FokI, каталитический домен которой состоит из двух субъединиц. Поэтому чтобы расщепить определенный участок генома, ZFN конструируют в виде пары, которая распознает две последовательности вблизи целевого участка: одну на прямой цепи, а другую на обратной цепи двухцепочечной молекулы ДНК. При связывании ZFN с обеих сторон целевого участка пара доменов FokI димеризуется и расщепляет ДНК, создавая двухцепочечный разрыв [2]. Такая структура гарантирует, что двухцепочечный разрыв ДНК будет осуществляться только тогда, когда две ZFN одновременно свяжутся с противоположными цепями ДНК [1].
Однако у этого метода обнаружились значительные ограничения. Во-первых, низкая точность распознавания тринуклеотидных повторов, послужившая причиной частого разрезания ДНК в «нецелевых» участках [3]. Во-вторых, сборка структуры «цинкового пальца» для связывания протяженного участка нуклеотидов ДНК с высокой специфичностью оказалась очень трудоемкой и дорогостоящей. Чтобы решить эту проблему была даже разработана специальная библиотека компонентов и протоколов для подбора нуклеаз, которые бы имели высокую степень сродства с желаемой последовательностью ДНК. Тем не менее, у исследователя, который не является специалистом в этой области, могут уйти долгие месяцы, прежде чем ему удастся создать нуклеазу, удовлетворяющую всем параметрам [4]. Все эти недостатки стимулировали поиск более совершенных систем для редактирования генома.
TALEN (Transcription Activator-Like Effector Nucleases; эффекторные нуклеазы, подобные активаторам транскрипции)
Похожий принцип был использован и в системе TALEN. Эта нуклеаза также состоит из двух функциональных модулей, которые мы уже наблюдали ранее в системе ZFN: ДНК-связывающего и FokI-нуклеазного. Однако в отличие от ZFN, ДНК-связывающая структура TALEN состоит из повторяющейся аминокислотных модулей в TALE, каждый из которых связывает только один нуклеотид, а не триплет нуклеотидов как было в системе ZFN.
Эту систему ученые обнаружили у бактерий рода Xanthomonas. Эти бактерии секретируют специальные белки TALE, которые способны активировать процесс транскрипции (синтез молекул РНК на ДНК-матрице) в цитоплазме растений. Связывание этих белков со специфическими промоторными областями ДНК клетки-хозяина растения приводит к увеличению экспрессии генов, а значит — к увеличению восприимчивости растений к патогену [5].
Успешные результаты исследований по определению специфических механизмов связывания TALE с ДНК положили начало разработке химерных нуклеаз TALEN. Как упоминалось ранее, эти нуклеазы состоят из ДНК-связывающего модуля и каталитического модуля эндонуклеазы рестрикции FokI. Для обеспечения правильной работы TALEN, сайты связывания выбирают таким образом, чтобы они находились на разных цепях ДНК и были разделены последовательностью-спейсером. После связывания с целевыми сайтами домены FokI димеризуются и осуществляют двуцепочечный разрыв в необходимом положении. Принцип работы очень похож на описанный ранее для ZFN. В отличие от ZFN, модифицировать TALEN под выполнение различных задач довольно просто, помимо этого тандемные повторы TALE могут быть легко расширены до желаемой длины в то время как длина сайт-специфической последовательности ZFN ограничивается 9 или 18 нуклеотидами.
Однако и у данного метода есть свои ограничения: дело в том, что перед 5'-концом целевой последовательности, с которой связываются мономеры TALE, всегда должен находиться один и тот же нуклеотид — тимидин, поскольку это влияет на эффективность связывания [6].
CRISPR/Cas9
Научный прогресс не стоит на месте, ученые ведут непрерывные поиски более точных и совершенных систем геномного редактирования, что послужило фундаментом для открытия новой революционной технологии геномного редактирования CRISPR/Cas9. Систему CRISPR/Cas мы подсмотрели у бактерий. Природа задумала CRISPR/Cas как иммунную систему бактерий и архей, чтобы своевременно выявлять патогенную или чужеродную ДНК внутри бактериальной клетки [3, 4]. В основе системы лежат специфические участки бактериальной ДНК — короткие палиндромные кластерные повторы, или по-другому CRISPR. В отличие от предыдущих методов редактирования самонаведение на целевой участок ДНК в этой системе осуществляет одноцепочечная направляющая РНК (она же — единая гидовая РНК, егРНК, sgRNA, single guide RNA): она «узнает» целевую последовательность в молекуле ДНК и «указывает» нуклеазе Cas9, где нужно произвести разрез [5].
Впервые CRISPR-локусы были обнаружены у бактерий E. Coli еще 1987 году. Тогда ученые заметили в геноме кишечной палочки повторяющиеся элементы, разделенные неповторяющимися уникальными последовательностями, названными впоследствии спейсерами (от англ. space — пробел) [7]. Каждый спейсер уникален, т. к. содержит в себе информацию о предыдущей атаке патогена. Эти так называемые CRISPR-кассеты находятся в непосредственной близости от Сas-генов — именно эти гены ответственны за синтез уже известных нам ферментов, нуклеаз Сas [3]. Во время вторжения чужеродной ДНК внутрь клетки повышается синтез Cas-белков, а также повышается число прочтений участка CRISPR-кассеты, нуклеотидная последовательность которой больше всего совпадает с последовательной чужеродной ДНК, атакующей клетку [4]. Синтезированный участок называется CRISPR RNA (крРНК). Затем образуется комплекс CRISPR/Cas, который связывается с чужеродной ДНК и разрезает ее. Однако это связывание возможно только при наличии специфического нуклеотидного сегмента (protospacer adjacent motif, PAM). PAM — это компонент вируса, атакующего клетку бактерии. Белок Cas не сможет успешно связаться с целевой нуклеотидной последовательностью «ДНК-агрессора», если за ней не следует PAM-последовательность. Роль PAM-участка заключается в том, чтобы препятствовать разрезанию собственных спейсерных участков CRISPR-кассеты, таким образом предотвращая аутоиммунный ответ [8].
Годы научных исследований помогли найти наиболее подходящую CRISPR/Cas систему, которая более всего подходила бы для целей геномного редактирования. Эта система была обнаружена у бактерии Streptococcus pyogenes [4]. На ее основе была сконструирована система редактирования генома CRISPR/Cas9. В состав системы помимо нуклеазы Cas9 входят кодирующая крРНК и трансактивирующая РНК (тракрРНК). Позже комплекс из этих двух РНК был заменен химерной одноцепочечной молекулой егРНК , которая объединила в себе качества крРНК и тракрРНК.
Благодаря простоте модификации системы CRISPR/Cas у исследователей появилась возможность осуществлять всевозможные манипуляции с ДНК: вносить точечные мутации, встраивать необходимые гены, исправлять или заменять отдельные генетические элементы и фрагменты генов [5].
В отличие от ZFN и TALEN систем, которые требуют перекодирования нуклеаз с использованием больших сегментов ДНК (500–1500 нуклеотидов) для каждой новой целевой последовательности, CRISPR/Cas9 может быть легко адаптирован для связывания с любой геномной последовательностью, путем изменения последовательности направляющей РНК. Такая простота в модифицировании CRISPR/Cas9 является значительным преимуществом по сравнению с ZFN и TALEN, особенно при создании большого набора векторов для нацеливания на многочисленные области внутри ДНК [4].
Разумеется, технология пока не лишена недостатков. Эндонуклеаза Cas9, например, может проявлять нецелевую активность, упуская из виду небольшие несоответствия между направляющей РНК и мишенью. Кроме того, сценарий, по которому пойдет репарация двухцепочечной ДНК после разрезания Cas9, не всегда соответствует ожидаемому, поэтому одно из направлений современных исследований в области CRISPR/Cas геномного редактирования — поиск факторов, обусловливающих выбор того или иного сценария репарации клеткой. В попытке оптимизировать CRISPR/Cas систему и сделать ее более точной и многозадачной были развернуты активные действия на поле искусственной биологической эволюции.
Биологическая эволюция ферментов существует со времен возникновения жизни на Земле. За период эволюционной истории гены изменялись, как менялись и их продукты — белковые молекулы, — чтобы приспособить организм к новым условиям среды. Тысячелетиями люди скрещивали животных и растения, отбирая организмы с необходимыми человеку признаками. В 21 веке накопленные за многие десятилетия знания молекулярной биологии позволили проводить отбор необходимых качеств на невидимом невооруженному глазу уровне — молекулярном. Так возникла искусственная, или направленная, эволюция белков, которая позволяет управлять эволюционным процессом в лабораторных условиях и, что не менее важно, значительно его ускорить. Искусственная эволюция сходна с естественной биологической эволюцией, которая происходит в нашем мире довольно медленными темпами, но если подключить опыт биотехнологии, можно заставить ее проходить во много раз быстрее.
Направленная эволюция ферментов получила широкое распространение как в научных академических исследованиях, так и в химической и фармацевтической промышленности. Путем искусственной эволюции ферментов можно получить белковые молекулы, которые способны работать в новых реакционных условиях, возможно оптимизировать их ферментативную активность в отношении новых субстратов, и более того, создавать ферменты, способные катализировать новые, прежде не известные в живой природе химические реакции. Реакция элиминирования Кемпа (отщепление протона от кольца бензизоксазола, ароматического соединения, применяемого для производства лекарств) одна из первых работ в этой области. Природные ферменты, способные катализировать эту реакцию, науке не известны. С помощью компьютерного моделирования и направленного мутагенеза ученым удалось успешно синтезировать восемь новых ферментов, способных быть хорошими катализаторами [9].
Особое внимание получило создание так называемых биокатализаторов — искусственных ферментов — безопасной для окружающей среды альтернативы металлам и органическим катализаторам, используемым на химическом и биотехнологическом производствах. Антитела, получаемые методом искусственной эволюции, — ключ к новым эффективным методам терапии.
Идея направленной эволюции была предложена Фрэнсис Арнольд, которой в 2018 году была присуждена Нобелевская Премия по химии за направленную эволюцию ферментов. Арнольд разработала [10] целую систему направленной эволюции ферментов, методологию, которая состоит из нескольких шагов: 1) поиск подходящего для поставленных задач фермента, 2) создание библиотеки ДНК/РНК-последовательностей, 3) определение критерия отбора, который приведет к улучшению функций фермента или появлению новых, а также 4) создание методов отбора оптимальных по биологической активности ферментов. Искусственная эволюция достигается последовательным повторением этих шагов, чтобы в конечном итоге получить фермент с заданной биологической активностью.
В основе направленной эволюции лежит намеренное изменение нуклеотидной последовательности гена, кодирующего белок. Конечно, такая процедура не может осуществляться без методов компьютерного моделирования, предсказания белковых структур на основе их аминокислотной последовательности; без генетических инженерных конструкций, нацеленных на модификацию конкретного гена (в котором закодирован целевой белок); без тщательно продуманных стратегий отбора наиболее удачных белков-кандидатов.
Важный этап на пути к искусственной эволюции фермента — создание компьютерной модели. Компьютерное моделирование позволяет выявить оптимальную конструкцию и качества будущего белка или фермента. На сегодняшний день в вычислительной биологии применяют комбинации различных подходов белкового дизайна. Сюда относятся дизайн на основе гомологии (биологической схожести) белковых структур [11]. Гомологичные белки имеют схожие свойства за счет схожести в функционально значимых участках белка и структурах, которые они образуют. Соответственно, если требуется сконструировать белковую молекулу с определенными биологически активными свойствами, можно воспользоваться методом гомологии и найти уже существующие в природе белки с похожей биологической активностью и взять их аминокислотную/нуклеотидную последовательность за основу. К другим подходом относятся методы моделирования на основе филогении (эволюционного родства) [12], а также дизайн совмещенный с симуляциями молекулярной динамики (моделирование детальной микроскопической картины внутренней подвижности молекулы) [13]. На основе результатов компьютерного моделирования можно предсказать мутации в каких участках аминокислотной последовательности белка помогут исследователям получить фермент с необходимой биологической активностью.
Следующий этап: внесение мутационных изменений в нуклеотидную последовательность фермента. Для этого используется несколько подходов. Первый: направленный мутагенез целевого участка. В этом случае направленно меняется нуклеотидная последовательность гена путем внесения одной или нескольких специфических мутаций. Белки помимо функционально значимых участков содержат участки, не играющие роли в осуществлении биологической функции фермента. Поэтому в направленном мутагенезе часто применяют метод вырезания целого участка нуклеотидной последовательности. Результаты многих работ показали, что активность белка часто заметно возрастает после его урезания [14, 15]. Методом направленного мутагенеза можно довольно быстро отобрать белок с улучшенной биологической активностью. Однако результат сильно зависит от аккуратности предсказаний компьютерного моделирования, т. к. библиотека ДНК-вариантов (список модификаций исходного белка) составляется на основе набора модификаций в аминокислотной/нуклеотидной последовательности, которые претерпел фермент в процессе дизайна. Второй часто применяемый подход — случайный мутагенез. С помощью различных техник молекулярной биологии вносятся случайные мутации в различных участках нуклеотидной последовательности ДНК. Метод случайного мутагенеза довольно эффективен при создании новых ферментов с заранее неизвестной биологической активностью [16].
В статье, недавно вышедшей в журнале Science [17], описывался способ направленной замены основания цитозина (Ц) на урацил (У) в молекуле РНК, модифицирующий широко известную систему геномного редактирования CRISPR путем направленной эволюции. На момент работы ученых уже были известны природные ферменты, способные катализировать превращение Ц в У, более того — эти ферменты применялись для редактирования нуклеотидов в ДНК [18]. Однако эти биокатализаторы обладали рядом недостатков: были способны к редактированию только одноцепочные молекул нуклеиновых кислот [19], часто заменяли нуклеотиды в нецелевых последовательностях [20] и, более того, дезамировали (отщепляли аминогруппу) множество оснований внутри целевого участка. Используя метод направленной эволюции им удалось модифицировать структуру фермента адениндезаминазы, который взаимодействует с двухцепочечной РНК и удаляет аминогруппу аденина, образовавшего связи с цитидином — таким образом, чтобы получить цитидиндезаминазу. Затем «эволюционировавшую» цитидиндезаминазу сшили с каталитически инактивированной эндонуклеазой Cas13 (dCas13), получив инструмент для программируемого редактирования Ц на У в молекуле РНК (система получила название RESCUE, RNA Editing for Specific C to U Exchange). На этом ученые не остановились и после серии экспериментов разработали алгоритм направленного мутагенеза, который позволил увеличить специфичность RESCUE более чем в 10 раз и получить высокоспецифичный и точный инструмент для редактирования оснований в РНК.
В одной из недавних работ [21] Гарвардские ученые пошли дальше и разработали направленную эволюционную систему на основе фагов, которую они использовали для улучшения CRISPR/Cas9 системы редактирования нуклеотидных оснований. Несмотря на множество достоинств системы редактирования оснований с помощью CRISPR/Cas9, метод имеет свои ограничения: предпочтение окружения одних нуклеотидных последовательностей над другими. Так, например, одна из наиболее распространенных цитидиновых дезаминаз APOBEC1 будет менее эффективно редактировать цитозин если перед ним в нуклеотидной последовательности стоит гуанин (ГЦ), чем цитозин, которому предшествует тимин (ТЦ) [22]; другой недостаток — большой размер конструкций, используемых для редактирования. С помощью бактериофаг-опосредованной непрерывной эволюции редакторов оснований (BE-PACE, Phage-Assisted Continuous Evolution of Base Editors) исследователям удалось преодолеть эти ограничения. Ученые использовали BE-PACE систему для направленной эволюции цитозиновых дезаминаз, эффективность редактирования оснований в которых не зависит от нуклеотидного контекста, в котором находится целевое основание. Дезаминазы, полученные таким способом, в 26 раз более эффективно редактировали цитозин в ГЦ-микроокружении, чем их естественные предшественники.
Даже самым эффективным и точным современным методам геномного редактирования пока еще далеко до стопроцентной эффективности и абсолютной точности. Однако исследования по изучению и адаптации естественных систем для редактирования геномов обширного спектра живых организмов за последние несколько лет достигли колоссальных успехов. Используя методы искусственной эволюции ученые смогут устранить недостатки существующих систем геномного редактирования, сделать их более точными и адаптировать их под любые научные задачи, а при достижении достаточной надежности, в будущем геномное редактирование можно будет использовать для лечения наследственных заболеваний.
Источники:
- Ashmore-Harris, C. & Fruhwirth, G. O. The clinical potential of gene editing as a tool to engineer cell-based therapeutics. Clinical and translational medicine 9, 15, doi:10.1186/s40169-020-0268-z (2020).
- Urnov, F. D., Rebar, E. J., Holmes, M. C., Zhang, H. S. & Gregory, P. D. Genome editing with engineered zinc finger nucleases. Nature reviews. Genetics 11, 636-646, doi:10.1038/nrg2842 (2010).
- Nemudryi, A. A., Valetdinova, K. R., Medvedev, S. P. & Zakian, S. M. TALEN and CRISPR/Cas Genome Editing Systems: Tools of Discovery. Acta naturae 6, 19-40 (2014).
- Gupta, R. M. & Musunuru, K. Expanding the genetic editing tool kit: ZFNs, TALENs, and CRISPR-Cas9. The Journal of clinical investigation 124, 4154-4161, doi:10.1172/JCI72992 (2014).
- Pattanayak, V., Guilinger, J. P. & Liu, D. R. Determining the specificities of TALENs, Cas9, and other genome-editing enzymes. Methods in enzymology 546, 47-78,
doi:10.1016/B978-0-12-801185-0.00003-9 (2014). - Lamb, B. M., Mercer, A. C. & Barbas, C. F., 3rd. Directed evolution of the TALE N-terminal domain for recognition of all 5' bases. Nucleic acids research 41, 9779-9785, doi:10.1093/nar/gkt754 (2013).
- Ishino, Y., Shinagawa, H., Makino, K., Amemura, M. & Nakata, A. Nucleotide sequence of the iap gene, responsible for alkaline phosphatase isozyme conversion in Escherichia coli, and identification of the gene product. Journal of bacteriology 169, 5429-5433,
doi:10.1128/jb.169.12.5429-5433.1987 (1987). - Makarova, K. S. et al. An updated evolutionary classification of CRISPR-Cas systems. Nature reviews. Microbiology 13, 722-736, doi:10.1038/nrmicro3569 (2015).
- Rothlisberger, D. et al. Kemp elimination catalysts by computational enzyme design. Nature 453, 190-195, doi:10.1038/nature06879 (2008).
- Arnold, F. H. Directed Evolution: Bringing New Chemistry to Life. Angewandte Chemie 57, 4143-4148, doi:10.1002/anie.201708408 (2018). 11. Porebski, B. T. & Buckle, A. M.
- Porebski, B. T. & Buckle, A. M. Consensus protein design. Protein engineering, design & selection : PEDS 29, 245-251, doi:10.1093/protein/gzw015 (2016).
- Akanuma, S. et al. Phylogeny-based design of a B-subunit of DNA gyrase and its ATPase domain using a small set of homologous amino acid sequences. Journal of molecular biology 412, 212-225, doi:10.1016/j.jmb.2011.07.042 (2011).
- Wijma, H. J. et al. Enantioselective enzymes by computational design and in silico screening. Angewandte Chemie 54, 3726-3730, doi:10.1002/anie.201411415 (2015).
- Kim, Y. M. et al. Truncation of N- and C-terminal regions of Streptococcus mutans dextranase enhances catalytic activity. Applied microbiology and biotechnology 91, 329-339, doi:10.1007/s00253-011-3201-y (2011).
- Wang, Y., Yuan, H., Wang, J. & Yu, Z. Truncation of the cellulose binding domain improved thermal stability of endo-beta-1,4-glucanase from Bacillus subtilis JA18. Bioresource technology 100, 345-349, doi:10.1016/j.biortech.2008.06.001 (2009).
- Yang, H. et al. Structure-based engineering of histidine residues in the catalytic domain of alpha-amylase from Bacillus subtilis for improved protein stability and catalytic efficiency under acidic conditions. Journal of biotechnology 164, 59-66, doi:10.1016/j.jbiotec.2012.12.007 (2013).
- Abudayyeh, O. O. et al. A cytosine deaminase for programmable single-base RNA editing. Science 365, 382-386, doi:10.1126/science.aax7063 (2019).
- Komor, A. C., Kim, Y. B., Packer, M. S., Zuris, J. A. & Liu, D. R. Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533, 420-424, doi:10.1038/nature17946 (2016).
- Salter, J. D., Bennett, R. P. & Smith, H. C. The APOBEC Protein Family: United by Structure, Divergent in Function. Trends in biochemical sciences 41, 578-594, doi:10.1016/j.tibs.2016.05.001 (2016).
- Zuo, E. et al. Cytosine base editor generates substantial off-target single-nucleotide variants in mouse embryos. Science 364, 289-292, doi:10.1126/science.aav9973 (2019).
- Thuronyi, B. W. et al. Continuous evolution of base editors with expanded target compatibility and improved activity. Nature biotechnology 37, 1070-1079,
doi:10.1038/s41587-019-0193-0 (2019). - Beale, R. C. et al. Comparison of the differential context-dependence of DNA deamination by APOBEC enzymes: correlation with mutation spectra in vivo. Journal of molecular biology 337, 585-596, doi:10.1016/j.jmb.2004.01.046 (2004).