Синтетическая геномика: в полушаге от «элемента жизни. Геномика служит генетике

Кафедра медицинской биологии и генетики

Геном. Геномика.

Казань, 2005

Рассматриваемые вопросы

1. Введение в геномику.

1.2. Разделы геномики

1.3. Этапы развития геномики.

2. Организация генома человека. Явление полиморфизма.

2.1. Уникальные гены.

2.2. Семейство генов.

2.3. Регуляторные зоны.

2.4. Повторы.

2.5. Транспозоны.

2.5.1. Биологическое значение транспозируемых элементов.

3. Явление полиморфизма.

1. Введение в геномику.

1.1. Определение генома и геномики.

Прежде всего, определим понятие «геном». Существует несколько определений генома. В энциклопедическом словаре «Генетика» Н.А.Картель и др. даётся два определения генома. Во-первых, под геномом понимают совокупность гаплоидного набора хромосом данного вида организмов. И, во-вторых, - это весь генетический материал отдельного вируса, клетки или организма не являющегося аллоплоидным. В нашем изложении мы будем исходить из того, что геном клетки это вся совокупность ДНК, находящаяся в ядре и митохондриях (пластидах) этой клетки или организма. Такое определение часто используется в работах связанных с изучением генома.

Строение и функцию генома изучает специальная наука – геномика .

Успехи в изучении генома человека стали наиболее ощутимы в связи с разработкой и последующем выполнением международного проекта «Геном человека». Этот международный проект объединил усилия сотен учёных из разных стран и осуществлялся с 1989 г по 2005 г. Главные направления проекта – картирование генов (определение локализации генов в хромосомах) и секвенирование ДНК или РНК (порядок расположения в ДНК или РНК нуклеотидов). Инициатором этого движения с самого начала стал лауреат Нобелевской премии учёный Дж. Уотсон. В России таким энтузиастом стал академик Баев А.А. На проект было затрачено свыше 6 млрд долларов. Материальные затраты России были настолько скромными, что их не учитывают при общем подсчёте издержек. Несмотря на это российские учёные проводили исследования по картированию 3,4,13 и 19 хромосоме. Проект позволил полностью расшифровать последовательность нуклеотидов в геноме человека. Фактически это был первый этап – структурный. Второй этап, который назвали функциональный, будет связан с расшифровкой функции гена. Полученные результаты в области исследования генома легли в основы выпущенного в США Ч. Кэнтором и К. Смит в 2000 году первого учебника для ВУЗов «Геномика».

1.2. Разделы геномики

Геномика подразделяется на пять самостоятельных разделов.

Структурная геномика изучает последовательность нуклеотидов в геноме, определяет границы и строение генов, межгенных участков, промоторов, энхансеров и др., т.е. фактически принимает участие в составлениигенетических карты организма. Подсчитано, что геном человека состоит из3,2 млрд нуклеотидов.

Функциональная геномика идентифицирует функцию каждого гена и участка генома, их взаимодействие в клеточной системе. Одна из важнейших задач геномики создать, так называемую«генную сеть» - взаимосвязанную работу генов. Например, генная сеть системы кроветворения включает в себя работу не менее 500 генов. Они не только взаимосвязаны между собой, но связаны и с другими генами.

Сравнительная геномика изучает сходства и различия в организации геномов разных организмов.

Эволюционная геномика объясняет пути эволюции геномов, происхождение генетического полиморфизма и биоразнообразия, роль горизонтального переноса генов. В применении к человеку, также как и к любому организму, можно сказать, что эволюция человека – это эволюция генома.

Медицинская геномика решает прикладные вопросы клинической и профилактической медицины на основе знания геномов человека и патогенных организмов.

Геномика человека является основой молекулярной медицины и её достижения используются при разработке эффективных методов диагностики, лечения и профилактики наследственных и не наследственных заболеваний. Если раньше предполагали, что наследственная патология, связана с определёнными генами или регуляторными зонами, то сейчас, всё большее внимание привлекают нуклеотидные последовательности, располагающиеся в межгенных промежутках. Они долгое время считались «молчащими». В настоящее время накапливается всё больше сведений об их влиянии на экспрессию генов.

Исследования в области генома ещё раз подтвердили необходимость индивидуального подхода к профилактике и лечению заболеваний. Значительный интерес представляют для медицины исследования связанные с составлением «генной сети» - схем взаимодействия генов между собой на уровне белковых продуктов. Эти исследования способствовали созданию в рамках геномики новой науки – протеомики , которая изучает белковый пейзаж клетки в различных режимах функционирования генов. Полученные результаты однозначно показывают целесообразность индивидуального подхода к лечению заболевания. Сейчас протеомика – самостоятельная наука, тесно связанная с геномикой.

В этой связи следует подчеркнуть, что тезис «лечить не болезнь, а больного» получил существенное подтверждение в многочисленных исследованиях генома и белков. Основываясь на них приоритетность этого положения в медицинской практике перестала вызывать сомнения.


В конце ХХ векамолекулярные технологии развивались настолько интенсивно, что были созданы предпосылки для планомерного изучения структуры геномов разных видов живых существ, включая человека. Одной из наиболее значимых целей этих проектов является определение полной нуклеотидной последовательности геномных ДНК. Таким образом, родилась новая наука - геномика .

Начало нового тысячелетия ознаменовалось крупнейшим открытием в области геномики – расшифрована структура генома человека. Новость оказалась настолько значимой, что стала предметом обсуждения между президентами ведущих стран мира. Однако на многих людей это сообщение не произвело впечатления. В первую очередь это связано с недостаточным пониманием того, что такое геном, какова его структура и что значит ее расшифровка? Имеет ли эта новость отношение к медицине и может ли коснуться каждого из нас? Что такое молекулярная медицина и связана ли ее развитие с расшифровкой структуры генома? Более того, у некоторых людей возникли опасения, не грозит ли в очередной раз новое открытие ученых человечеству? Не будут ли использованы эти данные в военных целях? Не последует ли за этим всеобщее принудительное генетическое обследование - своеобразная генетическая паспортизация населения? Не явится ли наш геном предметом анализа и насколько конфиденциальна будет полученная информация? Все эти вопросы в настоящее время активно обсуждаются в научном сообществе.

Конечно, геномика начиналась не с человека, а с гораздо более просто организованных живых существ. В настоящее время расшифрована нуклеотидная последовательность геномной ДНК многих сотен видов микроорганизмов, большинство из которых являются болезнетворными. Для прокариот полнота анализа оказалась абсолютной, то есть не остается не расшифрованным ни одного нуклеотида! В результате идентифицируются не только все гены этих микроорганизмов, но и определяются аминокислотные последовательности кодируемых ими белков. Мы уже неоднократно отмечали, что знание аминокислотной последовательности белка позволяет довольно точно прогнозировать его структуру и функции. Открывается возможность получения антител к этому прогнозируемому белку, его изоляции из микроорганизма и прямого биохимического анализа. Давайте задумаемся, что это означает для разработки принципиально новых методов борьбы с инфекциями, если врач не только знает, как устроены гены инфицирующего микроорганизма, но и какова структура и функции всех его белков? Сейчас в микробиологии происходят грандиозные изменения в связи с появлением огромного количества новых знаний, значение которых в настоящее время мы не до конца понимаем. По-видимому, понадобятся еще десятилетия, для того чтобы приспособить эту новую информацию к нуждам человечества, в первую очередь, в области медицины и сельского хозяйства.

Переход от прокариот к эукариотам в плане расшифровки структуры генома сопровождается большими трудностями и не только потому, что длина ДНК высших в тысячи, а иногда в сотни тысяч раз больше, но и структура ее становится более сложной. Вспомним, что в геноме высших появляется большое количество некодирующих ДНК, значительную часть которых составляют повторяющиеся последовательности. Они вносят значительную путаницу в правильную стыковку уже расшифрованных фрагментов ДНК. А, кроме того, тандемные повторы сами трудно поддаются подобной расшифровке. В области локализации таких повторов ДНК может иметь необычную конфигурацию, что затрудняет ее анализ. Поэтому в геноме одного из видов микроскопического круглого червя (нематоды) - первого многоклеточного организма, для которого удалось определить нуклеотидную последовательность ДНК, - уже осталось некоторое число неясных мест. Правда, их удельный вес составляет менее сотой процента от общей длины ДНК, и эти неясности не касаются генов или регуляторных элементов. Нуклеотидная же последовательность всех 19 099 генов этого червя, распределенных на площади в 97 миллионов пар оснований, была определена полностью. Поэтому работу по расшифровке генома нематоды следует признать весьма успешной.

Еще больший успех связан с расшифровкой генома дрозофилы, лишь в 2 раза уступающего по размеру ДНК человека и в 20 раз превосходящего ДНК нематоды. Несмотря на высокую степень генетической изученности дрозофилы, около 10% ее генов были до этого момента неизвестны. Но самым парадоксальным является тот факт, что у гораздо более высоко организованной по сравнению с нематодой дрозофилы количество генов оказалось меньше, чем у микроскопического круглого червя! С современных биологических позиций это трудно объяснить. Больше генов, чем у дрозофилы, присутствует и в расшифрованном геноме растения из семейства крестоцветных - арабидопсиса, широко используемого генетиками в качестве классического экспериментального объекта.

Разработка геномных проектов сопровождалась интенсивным развитием многих областей науки и техники. Так, мощный импульс для своего развития получила биоинформатика . Был создан новый математический аппарат для хранения и обработки огромных массивов информации; сконструированы системы суперкомпьютеров, обладающие невиданной мощностью; написаны тысячи программ, позволяющих в считанные минуты проводить сопоставительный анализ различных блоков информации, ежедневно вводить в компьютерные базы новые данные, получаемые в различных лабораториях мира, и адаптировать новую информацию к той, которая была накоплена ранее. Одновременно были разработаны системы для эффективной изоляции различных элементов генома и автоматического секвенирования, то есть определения нуклеотидных последовательностей ДНК. На этой базе были сконструированы мощные роботы, значительно ускоряющие секвенирование и делающие его менее дорогостоящим.

Развитие геномики, в свою очередь, привило к открытию огромного количества новых фактов. Значение многих из них еще предстоит оценить в будущем. Но и сейчас очевидно, что эти открытия приведут к переосмыслению многих теоретических положений, касающихся возникновения и эволюции различных форм жизни на Земле. Они будут способствовать лучшему пониманию молекулярных механизмов, лежащих в основе работы отдельных клеток и их взаимодействий; детальной расшифровке многих до сих пор неизвестных биохимических циклов; анализу их связи с фундаментальными физиологическими процессами. Таким образом, происходит переход от структурной геномики к функциональной, которая в свою очередь создает предпосылки для исследования молекулярных основ работы клетки и организма в целом. Накопленная уже сейчас информация будет предметом анализа в течение нескольких ближайших десятилетий. Но каждый следующий шаг в направлении расшифровки структуры геномов разных видов, порождает новые технологии, облегчающие процесс получения информации. Так, использование данных о структуре и функции генов более низко организованных видов живых существ может значительно ускорить поиск специфических генов высших. И уже сейчас методы компьютерного анализа, используемые для идентификации новых генов, зачастую вытесняют достаточно трудоемкие молекулярные методы поиска генов.

Наиболее важным следствием расшифровки структуры генома определенного вида является возможность идентификации всех его генов и, соответственно, идентификации и определения молекулярной природы транскрибируемых молекул РНК и всех его белков. По аналогии с геномом родились понятия транскриптома , объединяющего пул образовавшихся в результате транскрипции молекул РНК, и протеома , включающего множество кодируемых генами белков. Таким образом, геномика создает фундамент для интенсивного развития новых наук – протеомики и транскриптомики . Протеомика занимается изучением структуры и функции каждого белка; анализом белкового состава клетки; определением молекулярных основ функционирования отдельной клетки, являющегося результатом координированной работы многих сотен белков, и исследованием формирования фенотипического признака организма, являющегося результатом координированной работы миллиардов клеток. Очень важные биологические процессы происходят и на уровне РНК. Их анализ является предметом транскриптомики.

Наибольшие усилия ученых многих стран мира, работающих в области геномики, были направлены на решение международного проекта «Геном человека». Значительный прогресс в этой области связан с реализацией идеи, предложенной Дж. С. Вентером, заняться поиском и анализом экспрессирующихся последовательностей ДНК, которые в дальнейшем могут быть использованы в качестве своеобразных «ярлыков» или маркеров определенных участков генома. Другой независимый и не менее плодотворный подход, был использован в работе группы, возглавляемой Фр. Коллинзом. Он основан на первоочередной идентификации генов наследственных болезней человека.

Расшифровка структуры генома человека привела к сенсационному открытию. Оказалось, что в геноме человека только 32 000 генов, что в несколько раз меньше количества белков. При этом белок-кодирующих генов только 24 000, продуктами остальных генов являются молекулы РНК. Процент сходства по нуклеотидным последовательностям ДНК между разными индивидуумами, этническими группами и расами составляет 99,9%. Это сходство и делает нас людьми – Homo sapiens! Вся наша изменчивость на нуклеотидном уровне укладывается в очень скромную цифру – 0,1%. Таким образом, генетика не оставляет места для идей национального или расового превосходства.

Но, посмотрим друг на друга – мы все разные. Еще более заметны национальные, а тем более, расовые различия. Так какое же количество мутаций определяют изменчивость человека не в процентном, а в абсолютном выражении? Для того чтобы получить эту оценку, нужно вспомнить, каков размер генома. Длина молекулы ДНК человека составляет 3,2х10 9 пар оснований. 0,1% от этого – 3,2 миллиона нуклеотидов. Но вспомним, что кодирующая часть генома занимает менее 3% от общей длины молекулы ДНК, а мутации вне этой области, чаще всего, не оказывают никакого влияния на фенотипическую изменчивость. Таким образом, для получения интегральной оценки числа мутаций, оказывающих влияние на фенотип, нужно взять 3% от 3,2 миллионов нуклеотидов, что и даст нам цифру порядка 100 000. То есть, около 100 тысяч мутаций формируют нашу фенотипическую изменчивость. Если мы сопоставим эту цифру с общим числом генов, то получится, что в среднем на ген приходится 3-4 мутации.

Что это за мутации? Их подавляющее большинство (не менее 70%) определяет нашу индивидуальную непатологическую изменчивость, то, что нас отличает, но не делает хуже по отношению друг к другу. Сюда входят такие признаки, как цвет глаз, волос, кожи, характер телосложения, рост, вес, тип поведения, который тоже в значительной степени генетически детерминирован, и многое другое. Около 5% мутаций ассоциированы с моногенными заболевания. Около четверти оставшихся мутаций относятся к классу функциональных полиморфизмов. Они участвуют в формировании наследственной предрасположенности к широко распространенной мультифакториальной патологии. Конечно, эти оценки достаточно грубые, но они позволяют судить о структуре наследственной изменчивости человека.



Кандидат химических наук Ольга Белоконева.

Американские исследователи впервые сконструировали «в пробирке» полный геном бактерии и внедрили его в оболочку бактерии другого вида, получив при этом полноценную живую клетку, способную к размножению. Теперь на очереди - создание жизнеспособного организма с минимальным набором генов.

Технология создания бактерии со встроенным искусственным геномом.

Международная команда исследователей, создавших синтетическую жизнь.

Руководители работы Крейг Вентер (слева) и Гамильтон Смит.

Электронная микрофотография синтетической бактерии Mycoplasma mycoides.

То, что я не могу создать,
Я не в силах понять
.
Ричард Фейнман, лауреат Нобелевской премии по физике

Обычно химики, изучающие природные соединения, в своей деятельности руководствуются следующей логикой: сначала находят новое вещество в природе, затем определяют его функции и структуру и в конце концов пытаются синтезировать это соединение в лаборатории, чтобы сравнить свойства природного соединения и его синтетического аналога. Только так можно доказать, что вещество данной химической структуры обладает определёнными свойствами. Но в генетических манипуляциях такой подход долгое время не работал - структура ДНК была уже известна, но обратную задачу не удавалось решить никому.

Бизнес, творящий науку

Ветеран вьетнамской кампании американец Крейг Вентер занимался биохимией, получил учёную степень, но надолго в лабораторных стенах не задержался. Молодого исследователя привлекал бизнес. В 1998 году он принял участие в создании биотехнологической компании Celera Genomics. На момент создания компании уже вовсю шла работа по расшифровке генома живых существ, в том числе и человека. Но прогресс был невелик из-за несовершенства технологии секвенирования (определения нуклеотидной последовательности) ДНК. В составе команды исследователей Вентер принял участие в разработке новейшего метода секвенирования - метода «дробовика» (shotgun). С помощью этого метода уже через два года геном человека был расшифрован полностью. Вентер хотел продавать результаты исследования компании, но научное сообщество выразило недовольство, и ему пришлось уступить. Он выложил все результаты расшифровки генома в интернете и ушёл из Celera Genomics, создав новый институт имени самого себя.

Одним из пионерских начинаний института Крейга Вентера в 2000-е годы стали так называемые метагеномные проекты. Экспедиции, организованные институтом, проводили популяционный анализ генома различных организмов, живущих в Саргассовом и других морях. Используя геномные технологии, сотрудникам удалось описать генетическое разнообразие подводного царства, открыв при этом тысячи новых генов и новых видов живых существ.

Теперь, когда химическая структура многих сложных геномов была известна, по логике, надо было заняться синтезом искусственного генома, что и сделал Вентер. Другой идеей Вентера стало создание жизнеспособного организма с минимальным набором генов. Такую генетическую единицу вполне можно было бы назвать «элементом жизни» - «минимальной» клеткой. По аналогии в химии такой же простейшей единицей является атом водорода.

«Минимальной» клетки пока не существует, а организм с синтетическим геномом уже живёт и размножается в лаборатории Института Крейга Вентера. Это обыкновенная бактерия, которая отличается от прочих только тем, что её ДНК синтезирована «в пробирке».

От начала работ до исторической публикации в мае 2010 года в журнале «Science» под названием «Создание бактериальной клетки, которая контролируется химически синтезированным геномом» прошло долгих 15 лет, и обошёлся проект в 40 миллионов долларов. Этому крупному научному достижению предшествовал другой успех - в 2003 году команде Вентера удалось создать вирус с искусственным геномом.

Международной командой успешных исследователей двух отделений института - в Роквилле (штат Мериленд) и в Ла Йолла (штат Калифорния) - помимо Вентера руководят два других выдающихся учёных. Один из них - нобелевский лауреат 1978 года Гамильтон Смит. Нобелевскую премию он получил за открытие, которое положило начало эпохе химических манипуляций с геномом: он выделил рестриктазы - ферменты, разрезающие молекулу ДНК на отдельные фрагменты. Другой руководитель работ - выдающийся микробиолог, представитель известной научной династии Клайд Хатчисон III.

Синтетическая ДНК, состоящая из 1,08 миллиона нуклеотидов, стала самой длинной молекулой, синтезированной когда-либо в лабораторных условиях. Первая в истории синтетическая клетка содержит полностью искусственную хромосому, синтезированную из химических компонентов по компьютерной программе. Это уже не технологии генетической инженерии, когда учёным удавалось изменить или дополнить геном живых существ несколькими генами или набором генов, это - полная пересадка всего генома.

Трансплантация геномов

Эксперимент по созданию искусственной жизни заключался в следующем: учёные синтезировали геном одной бактерии и внедрили его в клетку бактерии другого вида. Полученный организм с оболочкой бактерии-реципиента Mycoplasma capricolum оказался идентичным бактерии-донору - Mycoplasma mycoides. Так впервые достоверно было показано, что ДНК действительно содержит полную информацию о работе всей живой клетки.

Полученные гибриды выглядели, росли и размножались так же, как Mycoplasma mycoides. Ещё один немаловажный признак того, что это была именно Mycoplasma mycoides, - сконструированная бактерия синтезировала белки, свойственные именно этому виду. Правда, от природной синтетическая бактерия всё-таки отличается. Жить и размножаться она может пока только в лаборатории, в специальной питательной среде, в природных условиях бактерия нежизнеспособна.

Часто спрашивают, почему нельзя было поместить искусственный геном внутрь собственной клетки? Потому что внутри этой клетки оставались характерные для неё белки, а значит, результаты эксперимента можно было бы объяснить их наличием. То есть появилась бы неопределённость в интерпретации результата.

Зачем нужны синтетические бактерии?

Реакция на исследования в научном сообществе неоднозначна. Многие считают, что о практическом применении технологии говорить преждевременно: одно дело - программировать безъядерные бактерии-прокариоты, а совсем другое - создавать искусственные хромосомы ядерных клеток эукариотов, то есть клеток всех растений, животных и человека. При адаптации технологии к ядерным клеткам возникает слишком много вопросов: как перенести ДНК в ядро, как создать и трансплантировать неядерную генетическую информацию и т.д.

Тем не менее Вентер считает, что выполненные исследования важны для фундаментальной науки, поскольку открывают новые перспективы в изучении происхождения жизни и поиске ответа на вопрос, какие гены отвечают за жизнь и размножение живого существа.

Работа Вентера сулит перспективы создания организмов с полностью заданными свойствами и функциями. Правда, это дело довольно отдалённого будущего. Пока учёным удалось «лишь» реализовать генетическую программу, уже существующую в природе. Но всё же перспективы синтетической геномики огромны. Ведь так заманчиво - меняя генетическую программу по своему усмотрению, создавать синтетические бактерии-фабрики, способные производить лекарства, питательные белковые вещества, биотопливо, очищать воду от загрязняющих веществ и многое-многое другое.

После успешного создания первого искусственного организма команда Вентера, да и не только она, сконцентрировала усилия на осуществлении другого проекта, логически вытекающего из этого достижения. Речь идёт о создании клетки, содержащей только гены, необходимые для поддержания жизни в её простейшей форме, то есть «минимальный» геном.

Элемент жизни

Определение «минимального» генома, обеспечивающего все необходимые функции, которые позволяют одноклеточному организму существовать в определённой среде, - не праздный вопрос. Решение этой проблемы необходимо для понимания происхождения жизни на Земле, что включает в себя изучение путей генетической эволюции и механизма происхождения геномов как таковых. Кроме того, «минимальная» клетка станет базисом для изучения всех генов, необходимых для жизнедеятельности.

Работы в этом направлении ведутся в основном с бактериями рода Mycoplasma. Геномы микоплазм, как уже говорилось, очень малы (от 580 до 1400 тысяч пар оснований) и хорошо изучены. Самый-самый короткий геном у Mycoplasma genitalium. Его длина - около 580 тысяч пар оснований, которые составляют 485 генов.

Изучая геномы микоплазм, Крейг Вентер и его коллеги очень близко подошли к пониманию того, что должен представлять собой «минимальный» геном будущих искусственных микробов. Как заявлено в уже поданном ими патенте, «минимальный» геном - основной строительный блок или, точнее, основное «шасси» для создания искусственных организмов - состоит менее чем из 400 генов. Внедряя «минимальный» геном в клетку и добавляя к ней другие гены, исследователи намереваются создавать простейшие организмы с новыми, заданными наперёд свойствами.

Фотографии с сайта Института Крейга Вентера (J. Craig Venter Institute) www.jcvi.org.

Геномика Геномика – комплексная наука, изучающая геномы. Разделы геномики: структурная геномика – содержание и организация геномной информации; функциональная геномика – реализация информации, записанной в геноме, от гена – к признаку; сравнительная геномика – сравнительные исследования содержания и организации геномов разных организмов; Все эти разделы геномики вносят вклад в фундаментальную биологию (индивидуальное развитие, эволюция), здравоохранение, сельское хозяйство и биотехнологию. Итог структурной геномики – получение последовательности нуклеотидов (сиквенс от англ. sequence), которая представляла бы полностью каждую из хромосом с первого нуклеотида до последнего. 2

Для того, чтобы получить такой сиквенс, сегодня приходится определять последовательность нуклеотидов в достаточно коротких отрезках ДНК, длиной примерно 1000 позиций. В геноме человека 3 миллиарда позиций, значит, его надо разбить на куски, которые и будут «читаться» . Затем нужно восстановить единую последовательность нуклеотидов из сравнения отдельных прочтенных отрезков текста. Восстановление основано на сравнении определенных последовательностей и выявлении в них перекрывающихся (идентичных) участков текста. Длина участка перекрывания должна превышать длину последовательности, которая может встретиться в данном геноме по причинам случайного характера. Например, в геноме человека 3 х109 п. н. случайно может встретится последовательность длиной 15 нуклеотидов – поскольку в каждой позиции может находится один из четырех нуклеотидов, то вероятность того, что заданные нуклеотиды окажутся в 15 позициях подряд 415 =230 что примерно равно 109. То есть в отрезке длиной 109 позиций заданная 15 -нуклеотидная последовательность может встретиться 1 раз по причинам случайного характера. 3

Но дело в том, что в ДНК нуклеотиды расположены не случайно и это является проблемой для восстановления последовательности из перекрывания отрезков. Если две последовательности из 1000 нуклеотидов перекрываются на 20 нуклеотидов или сто – это еще ничего не значит, так как весь этот фрагмент из 1000 нуклеотидов может быть несколько раз повторен в геноме. Поэтому нужно было сначала расставить вдоль генома фрагменты, а уже потом выявлять их перекрывание на основе сиквенса. Таков был путь мирового сообщества при секвенировании генома человека. (секвенированием в русскоязычной литературе называют процесс определения последовательности нуклеотидов. Этот термин также является калькой с английского названия). Как это можно было сделать? Нужно было поставить какие-нибудь «буйки» в геноме человека, какой участок стоит за каким. Последовательность таких участков и составляет карту генома. Первой такой картой стала карта генетическая. Она показана на рисунке слева. 4

Рядом показана окрашенная хромосома, на которой видны поперечные полоски. Поперечная окрашенность индивидуальна для каждой хромосомы, каждая полоска имеет собственный номер, который представляет собой "адрес" данного участка на хромосоме. В каждом таком участке миллионы пар нуклеотидов, последовательность которых должна быть определена. Получены полиморфные маркеры, то есть найдены такие участки хромосомы, которые у разных людей (или на разных хромосомах одного человека) содержат неидентичные последовательности нуклеотидов. Заметим, что для генетической карты с интервалом в 10% рекомбинации нужно 300 равноудаленных маркеров, чтобы отличить одну хромосому от другой в данном локусе. 5

В основе детекции ДНК маркеров лежит метод амплификации (размножения) фрагментов ДНК in vitro с точностью до нуклеотида методом полимеразной цепной реакции (ПЦР). Методом ПЦР можно синтезировать фрагмент ДНК in vitro (в пробирке) и получить его как химически чистое вещество. Для синтеза используются короткие синтетические отрезки ДНК, называемые праймерами (затравка для синтеза). С 3’-конца праймера начинается синтез фрагмента ДНК по матричной нити, на которую он отжигается (прилипает при комплементарном взаимодействии между нуклеотидами праймера и матрицы). За один цикл достройки ДНК из двух нитей ДНК получили 4. В следующем цикле из 4 нитей получится уже 8 и т. д. Каждый цикл занимает несколько минут. За 30 циклов ПЦР целевой фрагмент размножится в 1 миллиард раз, что позволяет наблюдать фрагмент (после окраски). Время проведения каждого этапа ПЦР в будущем сократится на 2 -3 порядка, таким образом, что каждый цикл будет проводиться за секунды. 6

Для различения папиной и маминой хромосом использовали так называемые STR-маркеры (Short Tandem Repeat), состоящие из одинаковых звеньев, чаще всего звено состояло из пары нуклеотидов ЦА. То есть нашли места в геноме, где повторялись эти вкрапленные звенья. Допустим в папиной хромосоме в фрагменте из 100 пар нуклеотидов была вставка из 20 звеньев, а в таком же месте маминой хромосомы было вставлено 22 звена. Этот фрагмент ДНК размножили in vitro, с точностью до нуклеотида методом полимеразной цепной реакции (ПЦР). Длина этих фрагментов будет у папы 100+20 х2=140, а у мамы – 100+22 х2=144. При фракционировании образованных фрагментов в геле под действием постоянного тока (электрофорез) мы можем провести разделение фрагментов по размеру. Чем тяжелее фрагмент, тем меньше его электрофоретическая подвижность и тем ближе к старту он будет находиться. Если у родителей ребенка длины фрагментов составляли (как указано в примере выше) 140 и 144 п. н. , то и у ребенка будут эти полоски присутствовать. 7

Описанный подход применяется не только в фундаментальных исследованиях, но и в практике идентификации личности при судебномедицинской экспертизе. Допустим данный локус в хромосоме может находиться в одном из 10 альтернативных состояний. (Эти состояния, аллели, различимы по их электрофоретической подвижности). Эти состояния различают 10 хромосом или людей с такими хромосомами. Если мы возьмем в анализ еще один локус (на другой хромосоме) с такими же характеристиками, то по этому локусу мы тоже различим 10 хромосом или людей. А по сочетанию состояний в этих двух локусах различимы 10 х10=102 хромосом. Пять таких локусов позволят различить 105 хромосом. А поскольку хромосом у каждого из нас по паре, то сочетания аллелей этих пяти локусов дают 105 х105 = 1010 вариантов. Это число вариантов больше, чем число людей на земле. На практике при идентификации используют набор аллелей из 13 локусов, хотя и пяти как мы видим, может быть волне достаточно. Генетическая карта была первой картой генома человека, на основе которой строилась дальнейшая работа по картированию. Эту карту соотнесли с физической картой, показывающей порядок следования клонированных фрагментов ДНК вдоль генома (см. рисунок 1 справа). 8

Физические карты генома часто представлены наборами фрагментов ДНК, клонированные в векторных молекулах (рекомбинантных ДНК), упорядоченно расположенных относительно друга. Такой набор непрерывно перекрывающихся фрагментов ДНК называется контиг. Для того чтобы выявить перекрывание клонированных фрагментов ДНК и понадобилась ранее установленная карта генетических маркеров. Перекрывание устанавливалось между «большими» молекулами ДНК, содержащими примерно 106 пар нуклеотидов, которые были клонированы в искусственных хромосомах дрожжей (YAC-клоны, сокращение от Yeast Artificial Chromosome). Искусственные, потому что у них удалили основную часть собственно дрожжевой ДНК и вставили человеческие фрагменты ДНК. Такие конструкции способны реплицироваться в клетках дрожжей. Размер хромосом дрожжей как раз примерно 1 -2 миллиона пар нуклеотидов. Как устанавливали перекрывание клонированных фрагментов ДНК? У нас есть YAC-клон № 1 с протяженным фрагментом клонированной ДНК, а в нем, предположим, обнаружен и маркер А и маркер В, для которых из генетических данных известно, что они соседние на карте. В YAC-клоне № 2 уже нет маркера А, а есть маркеры В и С, причем также известно из генетической карты что В и С – соседи. В клоне № 3 есть маркеры С и D. Сопоставление данных по присутствию генетических маркеров А, В, С и D в YAC-клонах показывает что они перекрываются в последовательности YAC № 1, № 2, № 3. 9

Вставки ДНК из 3000 YAC-клонов примерно равны по длине геному человека. В анализ на перекрывание YAC-колонов взяли 30000 клонов, с тем чтобы каждая точка генома перекрывалась несколькими клонами. Вначале неизвестно было, как они расположены, но в среднем каждая точка генома перекрывалась 10 раз. Было использовано порядка 3000 STR-маркеров, и посмотрели, эти как маркеры и клоны друг с другом перекрываются. В качестве метода, выявляющего присутствие генетического маркера в составе YAC-клонов, использовался ПЦР. На заключительном этапе составления физической карты генома человека в этих 30 000 YAC-клонов, выявлено присутствие примерно 30000 маркеров. Это один маркер на 100 000 пар нуклеотидов. Расстояние между концами YAC-клонов также составило 100 000 п. н. (при длине клона 1 млн. п. н.). Картирование проводили на роботизированных машинах, которые проводили приблизительно по 300 000 ПЦР-реакций в день. Позволило расставить в контиг все YAC клоны. Предполагалось, что они будут непосредственно секвенироваться. Однако в дальнейшем была использована друга схема секвенирования клонов. Картированные YAC-клоны часто использовали для поиска генов, находящихся во вставке YAC, а к сиквенсу этот этап не привел. 10

11

Перекрывание можно также посмотреть по расположению специфических рестрикционных сайтов. Рассмотрим этот способ подробнее. Структура фрагмента ДНК выявляется по положению участков расщепления специфическими ферментами – рестрикционными эндонуклеазами (рестриктазами). Каждая рестриктаза узнает последовательность нуклеотидов определенной длины и состава. Например, рестриктаза Eco. RI узнает GAATTC и никакую другую (расщеплять ДНК она будет в среднем один раз на 46=4096 нуклеотидов), Bam. HI узнает GGATTC. Предположим, что у нас есть клонированный фрагмент ДНК, длиной 13000 нуклеотидов, и мы расщепили его рестриктазой Bam. HI, получив два фрагмента по 9 и 4 тысячи нуклеотидов. Затем если мы расщепим Eco. RI, получим фрагменты по 8, 3 и 2 kb. Когда мы посмотрим двойное расщепление, получим фрагменты размерами 7, 3, 2, 1 kb. Размеры известны, потому что рядом есть дорожка, в которой идет фракционирование молекул стандартного размера, что позволяет создать калибровочную кривую. Если мы проведем второе расщепление, то увидим, что фрагмент в 9 kb расщепился на фрагменты по 7 и 2 kb. Эта специфическая последовательность сайтов и специфическое расстояние между ними является портретом молекулы (см. рис. ниже). По этим портретам мы можем сопоставлять молекулы друг с другом, независимо от того, что они кодируют, и что в них находится. Это очень типичная процедура. Расщепление фрагмента ДНК каждой рестриктазой по отдельности и их смесью позволяет создать рестрикционную карту фрагмента. 12

13

14

Итак, мы расставили молекулы методом генетического и физического картирования. Вернемся к методу секвенирования. Использовалась примесь дидезоксинуклеотидов - dd. NTP (на рисунке – справа; у них нет OH-группы у 3’-атома углерода), которая добавлялась к обычным дезоксинуклеотидам (на рисунке слева). И при синтезе ДНК in vitro это приводило к прекращению синтеза цепи в позиции, в которой вставился dd. NTP. Через позицию 3’ идет присоединение нуклеотида к строящейся молекуле ДНК. Но если на 3`- конце не будет гидроксильной группы, а водород, то синтез дальше не пойдет – он будет терминирован. Это используется следующим образом. У нас есть матрица (нить ДНК), которую надо секвенировать. Если идет синтез, и в первой позиции матрицы стоит А (см. рис. ниже), то может встроиться обычный Т и синтез пойдет дальше, а может встроиться dd. ТTP и синтез дальше не пойдет. Произойдет обрыв цепи, а полученный синтезированный огрызок займет при фракционировании определенную позицию согласно своему размеру. Следующий обрыв будет соответствовать второй букве секвенируемой нити, и также займет свою позицию согласно длине при фракционировании на электрофорезе и т. д. И так по каждому нуклеотиду. Так мы восстановим последовательность нуклеотидов в секвенируемой нити ДНК. Этот метод предложил Фрэд Сэнгер, за что получил свою вторую Нобелевскую премию. 15

16

17

Рассмотрим определение последовательности нуклеотидов в клонированном фрагменте ДНК. Клонированный фрагмент находится в так называемой векторной молекуле ДНК – молекуле, которая позволяет ввести его в клетку (обычно это клетка бактериальная, но иногда используются и дрожжевые клетки). Все работы по секвенированию генома человека прошли при участии бактериальных векторных молекул. Участок вектора, прилежащий к вставке, содержит последовательность нуклеотидов, комплементарную универсальному секвенирующему праймеру. С этого праймера инициируется синтез ДНК in vitro, который с первого нуклеотида будет идти по матрице клонированного фрагмента ДНК человека. Универсальных праймеров используется два, один к последовательности вектора прилежащей к одному концу вставки, другой праймер к последовательности вектора прилежащей к другому концу вставки. С одного из праймеров клонированный фрагмент секвенируется с одной стороны, а с другого праймера – с другой стороны. 18

Вектор у нас один и тот же, а вставок – миллионы, но все они секвенировались с одной и той же пары праймеров. Основная часть генома была секвенирована при клонировании фрагментов в 2 тысячи пар нуклеотидов, потому что тысяча читалась с одной стороны и тысяча – с другой. Каждая точка генома человека была просеквенирована несколько десятков раз в составе разных клонированных молекул ДНК. То есть расстояние в геноме между концами клонированных и секвенированных фрагментов ДНК составляло меньше 200 пар нуклеотидов. От каждой точки старта было прочитано около 1000 нуклеотидов. Из всего этого набора «текстов» воспроизводилась структура генома человека. Но собрать эти 1000 -буквенные сиквенсы в контиги длинной в мииллионы букв удалось лишь на основе того, что большая часть фрагментов была предварительно картирована относительно хромосом человека. Без картирования сиквенс мог попасть в повторяющийся участок генома, а продолжение сиквенса из такого участка имеет столько вариантов продолжений, сколько раз повтор присутствует в геноме человека (некоторые повторы – миллион раз). Поэтому сначала устанавливали последовательность расположения клонированных фрагментов в геноме. Это было сделано для фрагментов размером около 200 тыс пар нуклеотидов, а уже затем их секвенировали. Процесс секвенирования по методу Сенгера может быть автоматизирован. Механизм представлен на следующем слайде. 19

20

На слайде виден праймер, синтез с которого идет влево. У нас есть дидезоксинуклеотидфосфаты T, A, C и G. Каждый из них занимает свою позицию во фрагменте синтезируемом по исследуемой матричной нити. На предыдущем слайде каждой букве соответствовала отдельная дорожка геля, их всего четыре. Если каждую из букв терминирующих синтез пометить в свой цвет, то все терминаторы можно объединить в одной пробирке и фракционировать продукты в одной дорожке. Обрыв синтеза в позиции данной буквы даст фрагмент со своим положением в геле после фракционирования. Каждое положение обрыва будет характеризоваться цветом той- буквы терминатора, на которой произошел обрыв. В ходе фракционирования терминированных фрагментов лазер будет фиксировать на детекторе последовательные пики - какая прошла полоса по счету, и какого она цвета. Далее эта последовательность пиков дешифруется в последовательность нуклеотидов в молекуле ДНК. Точность сиквенса (установления того, какая именно буква терминировала синтез в данной позиции) определяется соотношением высот пиков соответствующих разным буквам в одной и той же позиции секвенируемого фрагмента. Между двумя пиками разных цветов в одной позиции было заданное дискриминирующее значение. Техника отрабатывалась так, что буква считалась достоверно установленной для данной позиции, если основной пик в этой позиции был выше других в заданное количество раз. 21

22

Бактерия H. influenzae была первым свободно живущим организмом, геном которого был полностью секвенирован. Поскольку геном бактерии маленький, около тысячи нуклеотидов, и повторов нем мало (да и короткие они), то предварительное картирование клонированных фрагментов ДНК не понадобилось – эти фрагменты сразу сиквенировались. Такая работа была проведена в институте генетических исследований ТIGR под началом Крега Вентера. Вентер затем организовал фирму Селера, секвенировавшую геном человека, где он применил ту же схему секвенирования что и для бактерии. Причем деньги он взял у частных фирм, так как государство не верило, что у него что-нибудь получится. Мировое сообщество предварительно использовало генетическую и физическую карты, относительно которой была выстроена последовательность перекрывающихся фрагментов клонированной ДНК (контиг), предназначенной для секвенирования. То есть сиквенс генома человека был собран из фрагментов правило благодаря использованию упорядоченного набора клонов и установлению последовательности нуклеотидов картированных клонов. 23

24

25

Вентер же, в отличие от мирового сообщества, использовал случайный набор клонов и попытался восстановить полную последовательность нуклеотидов прямо из сравнения сиквенсов всей кучи фрагментов. На бактерии у него это удалось, но на человеке это сработало лишь потому, что он использовал публично доступные данные от мирового сообщества о том, какие молекулы где расположены в геноме человека. Вентер опубликовал свою работу на месяц раньше, чем мировое сообщество, потому что он ничего не картировал, а использовал секвенирование совсем коротких рекомбинантных молекул. Общую длина секвенированных фрагментов ДНК была у Вентера в пять раз больше, чем сделало все мировое сообщество. Используя данные мирового сообщества о картированных фрагментах, Вентер смог восстановить в единую последовательность нуклеотидов все то, что он насеквенировал. Если бы данных мирового сообщества не было бы, то вся его работа была представлена короткими отрезками, которые бы разветвлялись, из-за того, что в геноме находятся повторы. В результате проделанной работы вышло две статьи: статья Вентера в журнале Science и статья Лэндера – лидера мирового сообщества - в журнале Nature. 26

Проект генома человека начат в 1990 г. Первая (черновая) версия последовательности нуклеотидов была закончена в 2000 г. Конечная версия, которая больше не будет совершенствоваться (названная Build 35) - закончена в 2004 г. 27

Последняя версия последовательности содержит 2, 85 миллиардов пар нуклеотидов с 341 брешью, то есть в этих местах по каким-то причинам секвенировать геномную ДНК не удалось. Сиквенс покрывает около 99% той части генома человека, которая представлены в некомпактизированной форме – эухроматине. Точность сиквенса в конечной версии – 1 ошибка на 100 тысяч позиций подряд. Еще точнее секвенировать весь геном уже никто не будет. Напомню, что папин геном отличается у вас от маминого генома примерно в 1 позиции на тысячу. Предсказанное число генов у человека теперь 2025 тысяч, что немного меньше, чем предсказывалось раньше. 28

Кроме данных о последовательности нуклеотидов геномной ДНК человека (референтная последовательность) созданы также базы данных: 1) о последовательности нуклеотидов транскрибируемых участков ДНК (EST database, EST = Expressed Sequence Tags), которая характеризует не геномную ДНК, а то, что транскрибировалось с ДНК. 2) о положении и содержании отличий (полиморфизмов, то есть нуклеотидных замен) других известных последовательностей ДНК человека от референтной последовательности (SNP database, SNP = Single Nucleotide Polymorphism) 29

Геномика – недавно возникшее направление науки, объектом изучения которой являются геномы всех организмов, не только человека. Одно из направлений геномики - воссоздание суммарной карты метаболических путей живого, состоящей из частных метаболических карт, характерных для каждого организма. Выявление в разных геномах определенных наборов генов метаболических функций позволяет предположить функциональную связь генов этого набора в едином участке метаболической цепи. В частности, один из подходов такой. Исследуют ряд видов (рисунок ниже), к примеру, бактерий. У первых трех видов есть гены для белков 1, 3 и 6. Остальные белки у некоторых есть, а у некоторых нет. Этот набор генов (1, 3 и 6) отсутствует у четвертого вида. Такого рода присутствие-отсутствие цельного набора генов позволяет сделать предположение о том, что кодируемые ими белки каким-то образом связаны в метаболическом цикле. Гены такого набора необязательно располагаются рядом в геноме. 30

31

Еще один критерий функциональной связи между генами, особо хорошо работающий на бактериях, основан на сохранении соседства одних и тех же (по сиквенсу) генов у разных видов бактерий. У бактерий нередко бывает, что группа генов, расположенных вместе, отвечает за группу последовательных этапов метаболизма. Такая группа генов регулируется на уровне транскрипции единым образом и называется оперон (единица операции). Часто последовательность расположения генов в опероне совпадает с последовательностью метаболических этапов. Для эукариот соседнее расположение функционально связанных генов не типично, хоть такие гены и разбросаны у них по геному, скоординированная 32 регуляция транскрипции есть и эукариот.

На данный момент просеквенировано несколько сотен геномов бактерий и геномы нескольких эукариот. Теперь мы знаем, что - у бактерий размеры генома не бывают меньше 0, 5 миллионов пар нуклеотидов, - а максимальный размер генома около 10 миллионов п. н. , - у дрожжей (эукариотический организм)– порядка 12 миллионов, - у червя нематоды – 97 млн. , - а у человека – 3 миллиарда пар нуклеотидов. - А число генов у про- и эукариот различается уже в меньшее число раз. Минимальное количество генов у бактерии микоплазмы – 470 штук, - у дрожжей – 6000, - у нематоды – 19000, - а у человека около 20000, то есть от нематоды и мухи по количеству генов мы не сильно отличаемся. Количество хромосомной ДНК, приходящейся на один ген - у бактерий -1000 п. н. то есть гены упакованы очень плотно; - у дрожжей – 2000 п. н. , и кое-где гены разделены некоторым пространством; - у нематоды – 5000 п. н. на ген и появляются пространства внутри генов – интроны; у человека – 30000 п. н. - У нас в геноме большие межгенные пространства и большие пространства внутри генов, которые не переходят в зрелую РНК. 33

Заметим, все эти организмы по размерам зрелых транскриптов не сильно отличаются. В зрелой РНК белок-кодирующий участок занимает обычно основную часть последовательности. Часть генов кодируют РНК, с которой белок вообще не синтезируется. Перед белок-кодирующей последовательностью в зрелой м. РНК расположены участки регуляции трансляции, а после белок кодирующей последовательности – участки определяющие стабильность (время жизни РНК). У прокариот последовательности перед и после белок-кодирующей части гораздо короче, чем у эукариот. Так что по размерам РНК все организмы ближе, чем по размерам генов, а по размерам белков – еще ближе. 34

Экспериментально проводили «выключение» каждого гена у многих бактерий, и смотрели, выживут они в данных условиях или нет. Оказалось, что у бактерий можно «выключить» (поочередно) около 50% генов, и они все равно будут жить. У дрожжей можно выключить 80% генов и они все равно будут жить. Как это было экспериментально показано? В геном клетки вставляют репортерный фрагмент ДНК, который позволяет замерить скорость транскрипции и трансляции в точке вставки фрагмента. Известно поэтому, что и траснкрипция и трансляция репортерного гена через данную точку в данных условиях происходит с регуляторных элементов гена, разорванного вставкой репортера, хотя разорванный ген сам не функционален. Таким образом 80% генов дрожжей по одному «убивали» и видели, что клетка дрожжей все равно живет. 35

У нематоды на 20 000 генов получено несколько десятков тысяч мутаций, которые, по-видимому, поражают около 2 000 генов (так называемых групп комплементации). Это около 10% всех генов нематоды. То есть если «выключить» около 90% генов, клетка будет продолжать жить. У человека из 20 000 генов только в 1700 (меньше 10%) известны мутации, которые связаны с болезнями, наследуемыми по Менделю как моногенный признак. 36

37

В связи с этим понятно, что количество генов, мутации в которых будут приводить заболеваниям человека (по крайней мере, к летальным), скорее всего, не увеличится значительно, по сравнению с тем, что уже известно к настоящему времени. Сейчас в интернет доступна база данных OMIM (Online Mendelian Inheritance in Man) по генам, мутации которых приводят к заболеваниям и проявляются как менделирующие признаки. В геноме не все его участки транскрибируется. В связи с этим встал вопрос экспериментального определения, где и сколько в геноме генов. Под одним геном понимается участок ДНК, который соответствует единому транскрипту, образованному с этого участка. При транскрипции участка ДНК получается так называемыя пре-м. РНК, которая содержит и экзоны (участки, переходящие затем в зрелую м. РНК), и интроны (вставочные последовательности, которые удаляются из м. РНК). Интроны удаляются из пре-м. РНК в результате процесса, называемого сплайсингом. Остающиеся в результате участки пре-м. РНК, называемые экзонами, соединяются в единую нить. Она называется зрелой м. РНК. (Некоторые из РНК не кодируют белок. Называть такие РНК матричными, т. е. м. РНК терминологически не верно, хотя они соответствуют генам и имеют свои функции.) 38

Зрелая м. РНК используется как материал для экспериментального исследования наличия гена в геноме, его положения и интрон-экзонной структуры. Инструментом для такого исследования являются биологические микрочипы. Первый патент на микрочипы принадлежит коллективу под руководством Андрея Дарьевича Мирзабекова, который был директором Института молекулярной биологии РАН и заведующий одной из кафедр ФМБФ МФТИ. Он предложил иммобилизовать синтетические фрагменты ДНК на твердые матрицы, и проводить гибридизацию этой матрицы с исследуемым образцом нуклеиновой кислоты – ДНК или РНК. Как исследовать, действительно ли ген существует, то есть транскрибируется ли данный участок ДНК? Для этого ген представляют в чипе частью его последовательности – олигонуклеотидом, который иммобилизован в микроплощадке с определенными координатами на этой матрице. Этот олигонуклеотид соответствует части экзона, предсказанного компьютером на основе сиквенса геномной ДНК. Чтобы выяснить, действительно геном в данном участке транскрибируется, берется клетка и из нее выделяется суммарная РНК. Из всех этих молекул РНК получают ДНК-копии, которые флуоресцентно метят и проводят гибридизацию с иммобилизованными на микрочипе олигонуклеотидами. Если в данных условиях какие-то площадки с олигонуклеотидами «молчат» (они показаны черным), то это значит, что участок геномной последовательности, комплементарной этому олигонуклеотиду, не транскрибируется. Если же площадка матрицы «светится» , значит олигонуклеотиды в этой площадке прогибридизовались с флуоресцентно меченым продуктом, то есть соответствующий участок генома транскрибировался и действительно 39 является частью какого-то гена.

40

В реальном эксперименте все участки на матрице в той или иной мере «светятся» . Поэтому без сравнения с некоторым стандартом, нельзя сказать с чем связано появление сигнала в данной площадке чипа. Чтобы определить, является ли полученный результат ошибкой эксперимента или нет, проводится сравнение двух объектов. Для этого берутся некие клетки А, из них получают РНК, и их флуоресцентно метят (на слайде - красным). То же проводят и с клетками В, но метят РНК другим цветом (зеленым). Затем проводят гибридизацию чипа со смесью этих двух препаратов РНК. Если сигнал в данной площадке на чипе получается красным, значит в клетках А транскрипция данного гена сильнее, чем в клетках В. Если сигнал зеленый, то транскрипция сильнее в клетках В. Если красного и зеленого поровну, то получится желтый цвет. Таким образом, возникает возможность сравнивать уровень траснкрипции данного гена в разных клетках - B, C, D и т. д. , нормируя его на уровень транскрипции этого гена в клетках А. При этом сравнивают транскрипцию гена в разных тканях, в них гены экспрессируются поразному. Можно сравнивать опухоль и норму, тогда выявляют те гены, которые специфически более сильно транскрибируются в опухоли или в норме. Можно посмотреть разные стадии развития, как работают гены в зародышевом развитии и во взрослом состоянии. Таким образом, гибридизация на микрочипах позволяет узнать, какие гены в геноме в данных условиях транскрибируются, а именно этим он и проявляет свою жизнь. 41

42

Гибридизация на микрочипах позволяет проверить компьютерное предсказание о том, что данный фрагмент генома – экзон, (участок, остающийся в зрелой м. РНК) и он действительно транскрибируется. Каждый ген не обязан экспрессироваться во всех тканях и в каждых данных условиях. Поэтому нужно исследовать много условий и тканей, чтобы выявить все участки генома, соответствующие экзонам. На слайде каждая гибридизация на данном чипе соответствует какому-то одному типу ткани или условиям ее функционирования. Красным указано количество экзонов в каждой из хромосом, существование которых экспериментально подтверждено. На каждом чипе 1 090 408 площадок с пробами-олигонуклеотидами, соответствующими каждому из 442 785 экзонов человека, предсказанных компьютером. Олигонуклеотиды в площадках соответствуют как транскрибируемой нити ДНК, так комплементарной нити. В геноме человека транскрипция комплементарных нитей ДНК, характерна для небольшой части генов. Такие гены перекрываются и, возможно, взаимно регулируются на уровне транскрипции. У бактерий перекрывание генов гораздо более частое явление, чем у эукариот. 43

44

Микрочипы могут быть использованы для исследования изменений уровня транскрипции генов, связанной с возникновением или прогрессией заболевания, (например, опухолевого или инфекционного). Предполагается, что каждая болезнь, характеризуется своим штрихкодом - изменением уровня транскрипции набора генов характерного именно для данной болезни. Этот анализ является очень важным для усовершенствования функциональной диагностики в медицине. 45

Провели такой опыт. Взяли образцы РНК из опухолей у двух групп больных. В одной группе метастазы были, а в другой – нет. Метастазы – это возникновение новых очагов опухоли в организме, пространственно отделенных от исходного очага. На данном чипе довольно резко проходит граница между группами зеленых и красных площадок. То есть видны гены, изменение уровня экспрессии которых характерно для стадии метастазирования опухоли, что можно использовать для диагностики этой стадии. Пока этот метод диагностики недоработан. Предполагается, что в будущем по штрих-коду изменения экспрессии в определенном наборе генов можно будет диагностировать конкретные заболевания и стадии их развития, а следовательно и знать, как лечить. 46

47

Сделаем небольшое отступление. Генетические карты были построены для многих видов. На видах с подробными генетическими картами проводится экспериментальный поиск мутаций связанных с регистрируемыми морфологическими изменениями. На слайде показана схема такой работы на рыбах. Вначале проводят мутагенез. После этого получают гибриды первого поколения. Их используют для возвратных скрещиваний с мутагенизированными родителями. Если оказывается, что какой-то признак выявляется, то смотрят, с какими генетическими маркерами он сонаследуется. Таким образом исследуется, какие гены повреждены мутациями, выявляемыми фенотипически. 48

Обобщая вышесказанное, гены (мутации), определяющие морфологические или биохимические признаки, могут быть идентифицированы после общегеномного мутагенеза (например, EMS) и генетического скрининга. Для этого проводят анализ сонаследования исследуемого аллеля с полиморфными маркерами ДНК, перекрывающими весь геном в известной последовательности, и расстояние между которыми достаточно мало, чтобы отнести исследуемый аллель к одному из интервалов генетической карты. 49

На этом слайде показано, что существуют бактерии, у которых количество генов может быть больше, чем например у дрожжей. Мы привыкли считать, что бактерии устроены проще, но это не всегда так. Существуют бактерии, у которых генов порядка 10 тысяч. 50

51

На этом слайде обращает внимание, что хотя число генов разнится у разных видов, число так называемых белковых доменов (структурные единицы в белке, отвечающие за единичную функцию) отличаются в пределах разных царств живого (прокариоты и эукариоты) до полутора раз, не более. Конечно комбинации этих доменов разные, но сами домены похожи, то есть они кодируются сходными по последовательности нуклеотидов участками генома и эти сходные участки имеют общее происхождение в эволюции. Обратно заявление будет не верно. Если функции белков сходны, это не означает, что их структура будет одинакова. Одна и та же функция, например, один и тот же каталитический процесс, может выполняться разными, не родственными по происхождению белками. Один и тот же процесс может катализироваться даже и белком 52 и РНК (рибозим), у которых нет ничего общего в происхождении.

На данном слайде показаны средние значения характеристик различных элементов генов человека. Средний размер экзона - 145 нуклеотидов, интрона – 3365 и т. д. В общей сложности получается, что белоккодирующая часть гена невелика по сравнению с белок-некодирующей частью, поэтому, когда происходят какие-нибудь мутации, велика вероятность, что промутирует белок-некодирующая часть. Такие мутации или вообще не скажутся на структуре белка, или приведут к изменению его количества, но не структуры (изменения регуляторных участков инициации транскрипции или стабильности РНК), или приведут к драматическим изменениям структуры РНК (мутации в мишенях для сплайсинга). 53

Распределение генов человека по размеру Размер, тыс. пар нуклеотидов 500 % общего числа 23, 3 35, 6 20, 2 13, 0 6, 7 1, 2 54

Общая структура генома такова (размер генома человека 3200 Mb) Гены занимают всего 1200 Мb. Основная часть этого пространства приходится на псевдогены (нефункциональные гены, инактивированные мутациями), различные фрагменты генов и интроны. На экзоны функциональных генов (суммарная длина зрелых РНК) приходится 48 Мb. Здесь есть некоторое лукавство, так как на одну пре-м. РНК в среднем приходится 1, 4 зрелых РНК. А из одной зрелой м. РНК в некоторых случаях может получиться до тысячи белков. Межгенная ДНК занимает 2000 Мb, она представлена главным образом короткими рассеянными по всему геному повторяющимися последовательностями, которые занимают 1400 Мb. Один из таких повторов – Alu-повтор, длиной около 300 п. н. , повторен в геноме миллион раз. Другой примечательный тип рассеянных повторов – длинные концевые повторы (LTR, long terminal repeat). Эти элементы являются молекулярными свидетельствами перескока фрагмента ДНК внутри генома. Общая протяженность таких участков на молекуле ДНК– 250 Мb. 55

Число генов у человека оценено в 20 - 25 тысяч, (оценка 2001 г. - 35 – 40 тыс.). 56

Основная часть генома человека занята не генами: 63 -74% длины – межгенные пространства, половина из них – повторы. Ген человека внутри «пустой»: 95% внутригенной ДНК вырезается (интроны). Общая длина белок кодирующих областей около 1% от геномной ДНК человека. Это лишь в 3 раза больше длины генома бактерий. 57

Примечание: От 26383 до 39114 генов человека были предсказаны компьютером (в 2001 г.), но лишь менее 7000 были подтверждены на человеке. И более, чем для 80% генов, хоть в чем-то была пересмотрена структура в период с 2001 по 2003 г и продолжает уточняться на микрочипах. Сейчас предсказанное число генов у человека 20 -25 тысяч и существование около 19 000 из них экспериментально подтверждено – с них образуются транскрипты. Имеющееся на данный момент определение гена (ген – это фрагмент геномной ДНК с котранскрибируемыми субфрагментами) - не полное. Например, возможна транскрипция с двух цепей. Плохо выявляются короткие гены и белок-некодирующие гены. Их, по крайней мере, под тысячу, но точное число не известно. Такие гены – тоже гены, хоть белок они и не кодируют. Они - гены, потому что с них образуется РНК. Причем РНК некоторых белк-некодирующих генов состоит из нескольких экзонов. То есть, клетке эти РНК зачем-то нужны, но мы пока не понимаем, зачем. 58

59

Предположим, образовался транскрипт зрелой м. РНК, и он может содержать экзоны 1, 2, 3. Это вовсе не означает, что он обязательно будет содержать их все. У нас может появиться РНК, которая будет содержать экзоны 1 и 2 или экзоны 1 и 3, и в результате с них будут образовываться разные белки. Такой способ процессинга (обработки) генетической информации называется альтернативный У человека есть ген slo. Он «работает» во внутреннем ухе, в частности, этот белок присутствует в ворсинках, которые отвечают за распознавание высоты звука. Он состоит из 35 экзонов (на рисунке - прямоугольники), 8 из которых (синие) могут или присутствовать, или отсутствовать в зрелой м. РНК. Возможны 8! = 40 320 вариантов сплайсинга, но только около 500 из них обнаружены. Других, может быть, и нет, то есть природа не должна, вообще говоря, реализовывать все возможные варианты. 61

62

Биологическая роль множественного сплайсинга заключается в следующем. Разные типы волосяных клеток внутреннего уха реагируют на звуки разных частот от 20 до 20 000 герц. Различия клеток в восприятии частоты частично определяются свойствами альтернативных сплайс-форм белка Slo. Как определяется выбор между вариантами сплайсинга неизвестно. Известны случаи, когда с одного локуса образуются тысячи разных белков. К ним, в частности, относятся белки, которые образуются на поверхности нервных клеток. Таким образом, они, видимо, как-то участвуют в распознавании друга, и в формировании нейронных сетей. В этом случае происходит выбрасывание не только экзонов или интронов, но и может реализовываться и альтернативный участок инициации транскрипции. Такие случаи известны, в частности, для человека, когда у разных генов есть несколько разных промоторов, каждый из которых дает свою РНК, в которой, в зависимости от того, где он начался, будет дополнительный экзон, связанной с различной длиной транскрипта на 5’-конце. 63

64

Механизм сплайсинга Процесс соединения одного экзона с другим происходит в участках определенной последовательности нуклеотидов. Донорный сайт сплайсинга всегда заканчивается одним из двух динуклеотидов, обычно – AG. В начале происходит нуклеофильная атака донорного экзона, затем происходит разрезание, кусочек GU заворачивается и присоединяется к А. Затем разрезается вторая часть, первый экзон соединяется со вторым, и образуется интрон. 65

66

Если посмотреть, какую долю гена составляют экзоны, то самый большой известный транскрипт (у гена миодистрофина) имеет длину около 2, 5 миллионов нуклеотидов. У него в зрелую часть РНК переходит 14 тыс нуклеотидов (0, 6%), а остальные 99, 4% от первичного транскрипта выкидывается (интроны). С ростом размеров гена в хромосоме его белок-кодирующая часть увеличивается незначительно, а количество интронов в гене растет. С ростом числа интронов растет число сайтов сплайсинга и вероятность их повреждения. Поэтому для генов с большим числом интронов потеря функции при мутации может быть связана не с белок- кодирующей частью ДНК, а с регуляторными элементами сплайсинга. Секвенирование генома человека показало, что некоторые экзоны многократно повторены в геноме. Это могут повторы экзонов в составе одного гена, или присутствие одного и того же экзона в составе нескольких разных генов. Получается, что экзоны, основные элементы структуры РНК, то есть белок-кодирующие элементы, в процессе эволюции могут каким-то образом размножаться в геноме и «перетасовываться» между разными генами. Такое явление получило название exon shuffling – перетасовка экзонов. Ниже показаны разные белки, в которых содержатся одинаковые экзоны. Таким образом, оказывается, что эволюция – это нередко именно блоковые изменения генома, а не точечные изменения. 67

68

69

На 2001 год для более 40% генов человека не было никаких предположений относительно выполняемых функций. А для остальных раскладка была достаточно условной. Принадлежность белка к одному функциональному классу не исключает его принадлежности также и к другому классу. Например, то что белок связывается с ДНК, не означает, что он не может быть еще и ферментом и т. д. Это - характеристика, которая была дана гену по той его части, которая связана с охарактеризованной функцией, но, вообще говоря, такая функция у белка может быть и не одна. Больше всего генов отвечают за экспрессию, репликацию и поддержание функций генома; около 20% - за передачу сигналов между клетками, около 17% - за то, чтобы клетка сама по себе была здорова, и для других функции не классифицированы. Оказывается, что у человека, по сравнению с дрожжами, бактериями и т. д. , в геноме имеется больше генов регуляторов транскрипции. То есть, транскрипционные регуляторы сильно размножились в эволюционной линии млекопитающих, в частности, человека. Предполагается что разнообразие регуляторов транскрипции обеспечивает большую тонкость реакции генома на сигналы внешней среды. То есть у млекопитающих больше число ансамблей координировано транскрибируемых генов, чем в других группах. 71

72

73

Ниже показано, как выглядит кусок генома человека (≈50 000 п. н.). Около половины длины этого фрагмента ДНК занимают элементы, структура и функция которых понятна. Среди этих элементов есть гены (экзоны и интроны) и псевдогены - есть гены функциональные, а есть их нефункциональные копии. Они, обычно, не содержат интронов (считается, что после транскрипции и преобразовании зрелой РНК возможен процесс встраивания ее обратно в геном в виде ДНК-копии; тогда это будет ген, содержащий лишний «хвост» и не содержащий интронов). А также короткие (SINE) и длинные (LINE) диспергированные повторы, длинные концевые повторы (LTR) – следы, оставшиеся после транспозиции, транспозоны, микросателлиты. 74

75

К 2001 году в геноме человека было выявлено 1112 “генов болезней” (то есть таких, мутации в которых ведут к заболеванию) и еще есть 94 “составных” гена, образующихся при опухолевых перестройках генома. Пока, в основном, раскрыты по механизму те заболевания, которые затрагивают белок-кодирующую часть гена. Возможно, не меньшее количество мутаций, вызывающих болезни, будет найдено и в участках регуляции транскрипции, сплайсинга и стабильности РНК. 76

77

По представлениям на март 2005 года, у человека 24000 белоккодирующих генов, из них 1700 генов ассоциированы с заболеваниями. Обнаружено 44, 500 мутаций в этих 1700 генах (в среднем 26 на ген), связанных к заболеваниям. А для остальных 10 000 известных мутаций подобная связь не выявлена. 20% смертей в США происходит из-за того, что прием лекарства осуществлялся либо не того, либо не так. Но это связано не с некомпетентностью врачей, а с тем, что мы все генетически разные. У болезней много мишеней и если бить не по той мишени, то лекарство точно не будет полезным, а потому может быть и вредным. У человека может быть специфическая реакция на данное лекарство (слишком низкая или слишком высокая скорость метаболизма). А в нашей стране ведущая пока причина смертей взрослого населения – пьянство. Эта первопричина просто скрыта за определением «травматизм» (производственный, бытовой, дорожный и т. д.), который и указывают как причину смерти. Выявлена корреляция потребления алкоголя в нашей стране и продолжительности жизни: когда, снижается потребление алкоголя, продолжительность жизни идет вверх, и наоборот. 78

Если два белка характеризуются сходной последовательностью аминокислотных (выше критической длины, до которой совпадения могут быть остатков чисто случайными), то у них есть общая предковая последовательность, и соответствующий предковый ген. Количество таких предковых структур у белков весьма ограничено. К примеру, был один ген в геноме, а потом их стало два (дупликация). Со временем мутации изменили эти гены каждый по-своему. А потом этот вид дал начало двум новым видам (см. рис. ниже). Все эти гены являются «родственниками» (гомологами), но по-разному называются. Гомологичные гены, которые мы рассматриваем в составе разных видов, называются ортологи, а гомологичные гены в одном геноме называют паралоги. 79

80

Сравнения таких родственных генов часто используют при исследовании эволюции. Эволюционная геномика (сравнительная геномика), используется очень интенсивно в медицине. Пример ее практического применения. У людей по разным причинам бывает ожирение. В частности, есть семейные формы, менделирующие. У человека мутации, вызывающие это заболевание, картированы не были. Сходный фенотип ожирения наблюдали у мышей. У мышей этот генетически картировали (картируют, на самом деле, не ген, а собственно мутацию в гене). Просеквенировали участок вокруг этой мутации, потом нашли такую же последовательность нуклеотидов в геноме человека. Стало ясно, в каком месте генома человека надо искать мутации, вызывающие ожирение у человека. Проверка этого участке генома человека у больных людей и сравнение его со той же нуклеотидной последовательностью у здоровых подтвердила, что мутации этого гена у человека, как и у мыши, приводят к 81 ожирению.

Данные по количеству генов, вовлеченных в развитие и функционирование некоторых органов и тканей человека 82

83

86

Геном актинии оказался почти таким же сложным, как у человека Прочтение генома актинии показало, что важнейшие генетические новации в эволюции многоклеточных животных произошли на самых ранних ее этапах. Последний общий предок актинии, человека и мухи, повидимому, жил около 700 млн лет назад и уже обладал весьма сложным геномом. Базовая генетическая «программа» , руководившая развитием первых животных, оказалась настолько удачной и гибкой, что последующая прогрессивная эволюция животных обеспечивалась в основном изменениями ее «настроек» , а не «архитектуры» . Геном человека оказался в целом гораздо больше похож на геном актинии (на фото - актиния Nematostella), чем геномы мухи и червя. Фото с сайта genome. jgipsf. org 87

88

89

Геномом называется полный состав ДНК клетки. Геномика - это молодая интенсивно развивающаяся отрасль генетики, изучающая принципы построения геномов и их структурнофункциональную организацию. Структурная геномика изучает нуклеотидные последовательности ДНК, в том числе строение и локализацию генов. Одной из задач структурной геномики является построение генетических карт организмов. Функциональная геномика решает задачи идентификации функций отдельных участков генома и механизмы их взаимодействий в клеточном ансамбле. Современные представления о геноме человека базируются на нескольких открытиях молекулярной биологии 70 -х годов ХХ века, основными из которых являются открытие полимеразной цепной реакции (ПЦР), позволяющей получать достаточное количество ДНК для анализа, и разработка методов секвенирования, которые позволяют расшифровывать точную последовательность нуклеотидов в цепях ДНК. 90

В конце 80 -х годов ХХ столетия началось осуществление международного проекта "Геном человека", основной задачей которого было секвенирование генома человека. Полное секвенирование генома человека было завершено в 2000 году. Секвенирование генома человека привело к открытию огромного количества однонуклеотидных полиморфизмов (ОНП) - генетических вариантов последовательностей нуклеотидов одного и того же участка ДНК у разных людей. Распределенные по всему геному ОНП используются в качестве генетических маркеров. По расчетам генетиков люди оказываются идентичными по нуклеотидным последовательностям на 99, 9%. Таким образом, генетическая вариативность людей возникает за счет различий лишь в 0, 1% генома. Данные секвенирования показали, что в геноме человека чуть более 30000* генов. Большинство генов имеют размеры до 50000 пар нуклеотидов. Число синтезируемых белковых продуктов превышает число генов в 1, 5 -2 раза. Это является результатом альтернативного сплайсинга. 91

В конце 80 -х годов ХХ столетия началось осуществление международного проекта "Геном человека", основной задачей которого было секвенирование генома человека. Полное секвенирование генома человека было завершено в 2000 году. 92

Цель этого проекта заключалась в выяснении последовательности оснований во всех молекулах ДНК в клетках человека. Одновременно должна быть установлена локализация всех генов, что помогло бы выяснить причину многих наследственных заболеваний и этим открыть пути к их лечению. Что бы последовательно приближаться к решению проблемы картирование генов человека, было сформулировано пять основных целей: 1) Завершить составление детальной генетической карты, на которой были бы помечены гены, отстоящие друг от друга на расстоянии не превышающем в среднем 2 млн. оснований (1 млн. оснований принято называть мегобазой); 2) составить физические карты каждой хромосомы (разрешение 0. 1 Мб); 3) получить карту всего генома в виде охарактеризованных клонов (5 тыс. оснований в клоне или 5 Кб); 4) завершить к 2004 году полное секвенирование ДНК (разрешение одного основание); 5) нанести на полностью завершенную секвенсовую карту все гены человека (к 2005 году). 94

Ожидалось, что, когда все указанные цели будут постигнуты, исследователи определят все функции генов и разработают методы биологического и медицинского применения полученных данных. Рассмотрев темпы ускорения работы в рамках проекта «Геном человека» , руководители этого проекта объявили 23 октября 1998 г. , что программа будет полностью завершена гораздо раньше, чем планировалось, и сформулировали «Новые задачи проекта «Геном человека»: 1) полностью завершить в декабре 1998 года работу по секвенирование генома «Круглого червя» С. elegans (это было сделано в срок); 2) закончить предварительный анализ последовательности ДНК человека к 2001 году, а полную последовательность к 2003 году; 3) картировать к 2002 году геном плодовой мухи; 4) начать секвенирование генома мыши с использованием методов ДНК искусственных хромосом дрожжей (завершить этот проект к 2005 году). Помимо этих целей, официально включен в поддерживаемый правительством США и рядом других правительств проект, некоторые исследовательские центры объявили о задачах, которые будут решаться в основном за счет частных фондов и пожертвователей. Так, ученые калифорнийского университета (Беркли), Орегонского университета и Ракового исследовательского центра имени Фрейда Хатчинсона начали программу «Геном собаки» . Международное общество секвенирование в феврале 1996 года приняло решение о том, что любая последовательность нуклиотидов размером 1 -2 Кб должна быть обнародована (через Интернет) в течение 24 часов после ее установления. 95

ЧТО БУДЕТ СДЕЛАННО ПОСЛЕ ЗАВЕРШЕНИЯ АНАЛИЗА ГЕНОМА ЧЕЛОВЕКА? Главная стратегическая задача будущего сформулирована следующим образом: изучить однонуклеотидные вариации ДНК в разных органах и клетках отдельных индивидуумов и выявить различия между индивидуумами. Анализ таких вариаций даст возможность не только подойти к созданию индивидуальных генных портретов людей, что в частности даст возможность лечить болезни, но и определить различия между популяциями. А также выявлять географические районы повышенного риска, что поможет давать чёткие рекомендации о необходимости очистке территории от загрязнения и выявить производства, на которых есть большая опасность поражение геномов персонала. Эта грандиозная задача рождает не одни радужные ожидания всеобщего блага, но и вполне осознанную тревогу юристов и борцов за индивидуальные права человека. Так, в частности, высказываются возражения против распространения персональной информации без решения тех, кого она касается. Один пример помогает понять эти тревоги: уже сейчас страховые компании нацелились на добывание таких сведений правдами и неправдами, они намериваются использовать данные против тех, кого они страхуют. Например, если подающий на страховку несёт потенциально болезнетворный ген, компании не хотят страховать таких людей вовсе или же пытаются заломить бешенные суммы за их страховки. Исходя из этого, . конгресс США уже принял ряд законов, направленный на строгий запрет распространения генетической информации относительно отдельных людей, юристы всего мира 96 интенсивно работают в данном направлении.

Области практического применения генной инженерии Создание трансгенных растений Еще 10 лет тому назад биотехнология растений заметно отставала в своем развитии, но за последние 3 года наблюдается быстрый выброс на рынок трансгенных растений с новыми полезными признаками. Трансгенные растения в США в 1996 году занимали площадь 3 млн. акров, в 1997 году площадь увеличилась до 15 млн. акров, в 1998 году – до 60 млн. акров, а в прошлом году до 80 млн. акров. Поскольку основные трансгенные формы кукурузы, сои, хлопчатника с устойчивостью к гербицидам и насекомым хорошо себя зарекомендовали, есть все основания ожидать, что площадь под генноиженерные растения в 2001 году увеличатся в 4 -5 раз. В апреле 1998 года доля в процентах трансгенных форм растений в сельском хозяйстве составило: кукуруза – 6, соя – 12, хлопчатник – 15, томаты –

Другая проблема возникла с медицинским лечением. Несмотря на огромные достижение современной медицины, производимые сегодня лекарственные препараты столь дороги, что ¾ населения земли сейчас полностью полагаются на традиционные донаучные методы лечения, прежде всего на неочищенные препараты растительного происхождения. В развитых странах лекарственные средства на 25% состоят из природных веществ, выделенных из растений. Открытия последних лет (противоопухолевые препараты: таксол, подофиллотоксин) свидетельствуют о том, что растения еще долго будут оставаться источником полезных биологически-активных веществ (БТА), и что способности растительной клетки к синтезу сложных БТА все еще значительно превосходят синтетические способности инженера-химика. Вот почему ученые взялись за проблему создания трансгенных растений. Отсчёт истории генетической инженерии растений принято вести с 1982 года, когда впервые были получены генетически трансформированные растения. Метод трансформации основывается на природной способности бактерий Agrobacterium tumefaciens генетически модифицировать растения. Реконструированные штаммы Agrobactrium, содержащие неонкогенные варианты Ti-плазмид и обладающие повышенной вирулентностью, стали основой одного из наболее популярных методов трансформации. 98

Первоначально трансформация применялась для генно-инженерных двудольных растений, однако работы последних лет свидетельствуют, что этот метод эффективен и в отношении кукурузы, риса, пшеницы. Другим широко распространённым методом трансформации, является технология, основанная на обстреле ткани микрочастицами золота (или других тяжелых металлов), покрытыми раствором ДНК. Все выращиваемые ныне коммерческие сорта получены с помощью названных выше двух методов. Современный арсенал методов трансформации, однако, довольно обширен и включает такие подходы, как введение ДНК в голые клетки (протопласты), электропорация клеток, микроинъекций ДНК в клетки, прокалывание клеток путём встряхивания их в суспензии микроигл, опосредованная вирусами инфекции и так далее. Генетические изменённые растения с устойчивостью к различным классам гербицидов в настоящее время являются наиболее успешным биотехнологическим продуктом. Дело в том, что биотехнология позволила совершить такой прыжок, так как оказалось возможным генетически изменять устойчивость растений к тем или иным гербицидам либо путем введения генов, кодирующих белки, нечувствительные к данному классу гербицидов, либо за счет введения генов, обеспечивающих ускоренный метаболизм гербицидов растений. 99

К настоящему времени клонированы гены, кодирующие нечувствительные к действию гербицидов ферменты-мишени, что дало возможность получать трансгенные растения, устойчивые к таким гербицидам, как глифостат и хлорсульфуроновым, и имидазолиноновым гербицидом. Изолированы также гены, которые кодируют ферменты деградации некоторых гербицидов, что позволило получить трансгенные растения устойчивые к фосфинотрицину и далапону. В 1997 году устойчивая к Roundup соя, распространяемая компанией "As Grow", была признана в США сельскохозяйственным продуктом года. Ученые пошли далее. Так как множество растений подвержены нападению и поеданию со стороны насекомых, то ученые генной инженерии провели эксперимент с давно известной бактерией Bacillus-Thiringiensis, которая продуцирует белок, оказалось она является очень токсичной для многих видов насекомых, но в то же время безопасна для млекопитающих. , белок (дельта-эндотаксин, CRY- белок) продуцируется различными штамами Bacillus-Thiringiensis. Это прототаксин который расщепляется в кишечнике насекомых, образуя активированный токсин. Активизированный белок специфично связывается с рецепторами средней кишки насекомых, что приводит к образованию пор и лизису клеток кишечного эпителия. 100

Взаимодействие токсинов с рецепторами строго специфично, что усложняет подбор комбинации токсин-насекомое. В природе найдено большое количество штаммов Bacillus-Thiringiensis, чьи токсины действуют только на определенные виды насекомых. Препараты Bacillus- Thiringiensis в течение десятилетий использовались для контроля насекомых на полях. Встраивание гена этого белка в геном растений дает возможность получить трансгенные растения, не поедаемые насекомые. Но этот метод потребовал большой работы со стороны генной инженерии, в плане подборов необходимых штаммов и созданию генноинженерных конструкций, которые дают наибольший эффект для конкретных классов насекомых. Кроме видоспецифичности по действию на насекомых встраивание прокариотических генов дельта-токсинов в геном растений даже под контролем сильных эукариотических промоторов не привело к высокому уровню экспрессии. Предположительно такое явление возникло в связи с тем, что эти бактериальные гены содержат значительно больше адениновых и тиминовых нуклеатидных оснований, чем растительная ДНК. Эта проблема была решена путем создания модефицированных генов, где один из природного гена вырезали и добавили те или иные фрагменты с сохранением доменов, кодирующих активные части дельта-токсинов. Так, например, с помощью таких подходов был получен картофель, устойчивый к колорадскому жуку. В настоящее время так называемый Bt – растения хлопка и кукурузы занимают основную долю в общем объеме генетически модифицированных растений этих культур, которые выращивают на полях США. 101

Перспективы Ожидается что детальное знание человеческого генома откроет новые пути к успехам в медицине и биотехнологии. Несколько компаний, например Myriad Genetics, начали предлагать простые способы проведения генетических тестов, которые могут показать предрасположенность к различным заболеваниям, включая рак груди, нарушение свертываемости крови, кистозный фибриоз, заболевания печени и многим другим. Также ожидается, что информация о геноме человека поможет поиску причин возникновения рака, болезни Альцгеймера и другим областям клинического значения и, вероятно, в будущем может привести к значительным успехам в их лечении. Также, например, исследователь, изучающий определённую форму рака может сузить свой поиск до одного гена. Посетив базу данных человеческого генома в сети, этот исследователь может проверить что другие учёные написали об этом гене включая (потенциально) трёхменую структуру его производного белка, его функции, его эволюционную связь с другими человеческими генами или с генами в мышах или дрожжах или дрозофиле, возможные пагубные мутации, взаимосвязь с другими генами, тканями тела в которых ген активируется, заболеваниями, связанными с этим геном или другие данные. Более того, глубокое понимание процесса заболевания на уровне молекулярной биологии может предложить новые терапевтические процедуры. Учитывая установленную огромную роль ДНК в молекулярной биологии и её центральную роль в определении фундаментальных принципов работы клеточных процессов, вероятно, что расширение знаний в данной области будет способствовать успехам медицины в различных областях клинического значения, которые без них были бы невозможны. 102

Анализ сходства в последовательностях ДНК различных организмов также открывает новые пути в исследовании теории эволюции. Во многих случаях вопросы эволюции теперь можно ставить в терминах молекулярной биологии. И в самом деле, многие важнейшие вехи в истории эволюции (появление рибосомы и органелл, развитие эмбриона, иммунной системы позвоночных) можно проследить на молекулярном уровне. Ожидается что этот проект прольёт свет на многие вопросы о сходстве и различиях между людьми и нашими ближайшими сородичами (приматами, а на деле и всеми млекопитающими). Проект определения разнообразия человеческого генома (HGDP), отдельное исследование, нацеленное на картирование участков ДНК, которые различаются между этническими группами, который был, по слухам, приостановлен, но на самом деле продолжает работу и в настоящее время накапливает новые результаты. В будущем HGDP, вероятно, сможет получить новые данные в области контроля заболеваний, развития человека и антропологии. HGDP может открыть секреты уязвимости этнических групп к отдельным заболеваниям и подсказать новые стратегии для их преодоления. Он может также показать, как человеческие популяции адаптировались к этим заболеваниям. 103

Ученым удалось "прочитать" последовательность нуклеотидов. А вот на расшифровку наследственного аппарата человека уйдут еще многие годы - около половины генов Homo Sapiens до сих пор остаются не раскрытыми. Установление последовательности генов - это первый шаг в понимании генома человека. Ведь представления о функциях установленных генов всего лишь демонстрируют порядок, в котором следуют нуклеотиды в цепочке ДНК. Таким образом, первое глубокое изучение генома человека прояснило гораздо меньше загадок, чем ожидалось. Впрочем, впоследствии это позволило ученым сделать несколько громких открытий: Значительный процент наших генов был сформирован человеческой цивилизацией. Американские ученые выяснили, что около 1800 генов (примерно 7% человеческого генома) изменились в результате естественного отбора за последние 50 тыс. лет, т. е. в процессе развития человеческой цивилизации. Примерно в той же пропорции изменились и геномы кукурузы, после того как люди ее окультурили. Главным образом изменения произошли в генах, отвечающих за белковый обмен и сопротивляемость различным заболеваниям. По мнению ученых, эти изменения можно объяснить развитием сельского хозяйства, ростом городов и увеличением плотности населения. Мутация генов, ответственных за деятельность мозга, ученые связывают с развитием культуры. 105

Люди, проживающие даже в разных уголках земли, отличаются друг от друга только на 0, 1%. Тем не менее, это маленькое расхождение в ДНК обеспечивает достаточно признаков, чтобы определить географических предков индивидуума. А вот гены шимпанзе и человека, чье родство ранее считалось самым близким, совпадают только на 95%. Человек стал человеком 3 миллиона лет назад. Именно тогда предки Homo Sapiens начали ходить вертикально после того, как "отключился" один из генов. Данный ген - Neu 5 Gc - контролирует выработку в организме сиаловой кислоты (один из сахаров). Исследователи предполагают, что мутация произошла где-то в промежутке между появлением общего предка человека и шимпанзе и возникновением уже непосредственных предшественников Homo Sapiens. В организмах животных все клетки покрыты оболочкой из сахаров. У человека этого нет. Специалисты предполагают, что это как-то связано с развитием мозга: на отрезке эволюции, когда предки современного человека отделились от предков шимпанзе, размеры головного мозга у них были примерно одинаковы. 106

Научившись различать цвета, предки человека перестали выбирать партнеров по запаху. Развитие цветового зрения привело к тому, что приматы, обитавшие в восточном полушарии, и появившиеся затем вследствие их развития люди утратили способность распознавать феромоны. Это произошло около 23 млн. лет назад, незадолго до того, как надсемейство человекообразных обезьян, от которых со временем произошли люди, распалось на несколько обособленных групп. Когда и самцы обезьян, обитающих в восточном полушарии, около 23 млн. лет назад приобрели второй ген цветового зрения, автоматически возник новый способ полового отбора. Теперь для сигнализации зрелости и способности самок к воспроизводству стали использоваться не феромоны, а вторичные половые признаки, такие, как яркие цветные участки на коже и др. Особенности фигуры заложены генетически. Генетическая программа организма определяет фигуру и ответственна за вес. На эту закономерность натолкнулись ученые, когда они начали исследовать жировую ткань мышей на наличие склонности к излишнему весу. Было выделено по крайней мере 12 генов, влияющих на различные места накопления жира. Еще три гена играют, по всей видимости, решающую роль в наличие склонности к излишнему весу. Вклад генов в распределение жировых масс оценивается как 50 -60 -процентный. 107

Существует ген, отвечающий за пристрастие к никотину. Две группы ученых провели исследования различных форм гена CYP 2 A 6 - фермента, который содержится главным образом в печени и регулирует никотиновый метаболизм в теле человека. Ранее проведенные исследования показали, что у людей, у которых этот ген не работает, меньше риск получить никотиновую зависимость. Эксперты считают, что у таких людей никотин в течение более долгого времени выводится из организма, поэтому желание выкурить следующую сигарету появляется через более длительный промежуток времени. Алкогольная зависимость также определяется генами. Американские ученые обнаружили ген, который является связующим звеном между алкоголизмом и чувством страха. Опыты доказали, что отсутствие копии определенного гена вызывает у мышей чувство страха и неудержимое влечение к алкоголю. Ученые предполагают, что мыши пытались подавить свой страх при помощи алкоголя, так как частое потребление спирта делало их смелее. Подобная мотивация, возможно, приводит к хроническому алкоголизму и у людей. 108

109

В качестве потенциального вектора рассматривается небольшой аденоассоциированный вирус (AAV), потому что в отличие от аденовирусов он не вызывает заболевания. Однако он не так хорошо переносит ген. Для улучшения его как вектора проводятся эксперименты по облучению и химической модификации. В других лабораториях экспериментируют с ретровирусами-переносчиками CFTR, так как эти вирусы естественным образом встраивают свой геном в клетки хозяина.

Правда, при этом остается нерешенным вопрос, избавит ли нормальный синтез белка CFTR от бактериальных инфекций легких, на которые приходятся 90% заболеваемости и смертности. Есть все основания надеяться, что генная инженерия успешно справится с этой задачей. Белок в легких, функция которого заключается в уничтожении чужеродных клеток, не активизируется при повышенной концентрации соли (а именно этим и характеризуется кистозный фиброз); но как только CFTR начинает вырабатывать свой продукт, концентрация соли понижается, и белок активизируется.

В настоящее время разрабатываются методы генной терапии при лечении других наследственных болезней. Так, при нарушениях функции кровяных клеток их можно преобразовывать в культуральной среде и вводить в

костный мозг пациента, в их естественную среду. Несомненно, некоторые из разработок увенчаются успехом и в течение последующих лет станут обычной медицинской практикой.

Все приведенные факты - примеры так называемой соматической генной терапии, то есть они применяются по отношению к телу (соме ) пациента в надежде, что получится достаточное количество клеток, способных выполнять нормальные функции. Пациент может выздороветь, но риск передачи нежелательных генов потомству все равно остается, потому что половые клетки таким образом не модифицируются.Терапия половых клеток нацелена на модификацию всего организма, включая и железы, вырабатывающие половые клетки. Простейший (теоретически) способ состоит в том, чтобы модифицировать оплодотворенную яйцеклетку, введя в нее подходящий трансген. Такого рода процедура уже возможна и успешно проведена на опытных животных, например на мышах. Но можно ли ее применить по отношению к человеку и, главное, стоит ли? Это серьезный этический вопрос, и некоторые поборники нравственности утверждают, что если соматическая генная терапия этична, то играть с человеческим геномом и изменять генный набор наших потомков недопустимо, поэтому подобные процедуры следует запретить.

Геномика - изучение всего генома

Последние достижения в области секвенирования и развитие технических средств для обработки большого количества клонов в библиотеке генов позволили ученым исследовать сразу весь геном организма. Сейчас определены полные последовательности многих видов, в том числе большинства так называемых модельных генетических организмов, таких как Е. coli, круглого червяCaenorhabditis elegans;

и, конечно, классического объекта генетики, плодовой мушки Drosophila melanogaster. В 1990-х годах, несмотря на ряд неурядиц и разногласий, был начат проект по исследованию человеческого генома («Геном человека»), средства на который выделил Национальный институт здоровья. В феврале

ПРЕСС, 2004. - 448 с: ил.

2001 года большая группа исследователей во главе с Дж. Крэйгом Вентером из частной лаборатории «Селера Дженомикс» сделали заявление о предварительной расшифровке человеческого генома. Результат их работы был опубликован 16 февраля 2001 года в журнале «Science».

Другая версия, которую представила группа из Международного консорциума по секвенированию человеческого генома, была напечатана 13 февраля 2001 года в журнале «Nature».

Временем зарождения геномики можно считать середину ХХ века, когда генетики составили карты всех хромосом модельных организмов, основываясь на частоте рекомбинаций (см. гл. 8). Однако на этих картах были показаны лишь те гены, для которых были известны мутантные аллели, и поэтому полными такие карты назвать нельзя. Полное секвенирование ДНК позволяет выявить местонахождение всех генов организма, а также установить последовательность оснований между ними.

Геномика делится на структурную и функциональную. Структурная геномика ставит целью выяснить, где именно в хромосомной ДНК расположены те или иные гены. Компьютерные программы распознают типичные для генов начала и концы, отбирая те последовательности, которые, вероятнее всего, и являются генами. Такие последовательности называют открытой рамкой считывания (open

reading frame, OFR ). Те же компьютерные программы могут опознавать и типичные интроны в OFR-последовательностях. После того как интроны из потенциального гена вычленены, по оставшемуся коду компьютер определяет последовательность аминокислот в белке. Затем эти потенциальные белки сравнивают с теми белками, функции которых уже известны и последовательности которых уже занесены в базу данных. Благодаря такому роду программ был установлен так называемыйэволюционный консерватизм: то, что для большинства генов в разных организмах имеются схожие гены. С позиций эволюционного развития такое сходство объяснимо: если белок какого-то одного биологического вида хорошо приспособлен для своих функций, то его ген передается в том же виде или с небольшими изменениями к видам, происходящим от начального. Эволюционный консерватизм позволяет опознавать гены, родственные данному гену в других организмах. Сравнив полученный ген с уже известными, зачастую можно определить и его функцию, обязательно проверив ее в последующих экспериментах.

После определения всех потенциальных генов приступают к составлению генетической карты. Генетическая карта человека - довольно запутанная и пестрая диаграмма, так как каждый ген отмечают определенным цветом в зависимости от его функции, устанавливаемой в сравнении с другими известными генами. Большинство генов человека, как и вообще гены всех эукариот, имеют большие интроны. По приблизительным оценкам, среди опубликованных последовательностей около трети или четверти приходится на интроны. Любопытно, что только около 1,5% всего генома человека (около 2,9 х 109 пар

оснований) содержат последовательности (экзоны), кодирующие белки. Кроме того, похоже, что эта ДНК содержит только 35 000-45 ООО генов, а это меньше предсказанного. Нам еще предстоит понять, как относительно малое количество генов кодирует такой сложный организм.

От двух третей до трех четвертей генома приходится на обширные

Генетика / Бартон Гуттман, Энтони Гриффитс, Дэвид Сузуки, Тара Куллис. - М.: ФАИР-

ПРЕСС, 2004. - 448 с: ил.

Количество копий повторяющейся ДНК у разных людей неодинаково, поэтому их можно использовать для установления личности, в том числе и в судебной медицине.

Функциональная геномика

Функциональная геномика - это исследование функций генов на уровне всего генома. Хотя потенциальные гены можно определить по сходству с генами, выполняющими известные функции в других организмах, все догадки следует проверять на примере изучаемого организма. В некоторых модельных организмах, например в пищевых дрожжах, можно систематически отключать функцию генов по очереди.Выключение гена происходит посредством замены его функциональной формы стертой формой на особом векторе. Затем получают штамм с выключенным геном и оценивают его фенотип. В ходе продолжающейся программы по анализу генома пищевых дрожжей по очереди было выключено несколько тысяч генов.

Другой метод функциональной геномики заключается в том, что изучают механизм транскрипции на уровне всего генома. Данный метод основан на предположении, что большинство биологических явлений представляют собой сложные процессы с участием многих генов. Особый интерес у исследователей вызывают процессы, связанные с развитием организма, о которых мы упоминали в гл. 11. Если транскрипцию генов изучать в разных условиях роста, то можно составить представление о полных генетических путях развития организма.

Но как можно изучать транскрипцию на уровне всего генома? Опять-таки в этом ученым помогают новые технологии. ДНК каждого гена в геноме или некоторой части генома помещают на поверхности небольших стеклянных пластин, расположенных по порядку. Потом их подвергают воздействию со стороны всех видов мРНК, обнаруженных в клетке данного организма. ДНК на пластинках получают двумя

способами. При одном способе все мРНК подвергаются обратной транскрипции, чтобы получить короткие комплементарные молекулы ДНК, соответствующие одному гену. При другом способе гены (или части генов) синтезируются по одному основанию за раз на определенных участках пластин. Синтез осуществляют роботы, открывающие и закрывающие

Генетика / Бартон Гуттман, Энтони Гриффитс, Дэвид Сузуки, Тара Куллис. - М.: ФАИР-

ПРЕСС, 2004. - 448 с: ил.

поверхность стекла в определенном порядке. Пластинки с геномом многих организмов можно приобрести в химических компаниях.

Для изучения механизма транскрипции все мРНК определенной стадии развития помечают флуоресцентной меткой и распределяют их по поверхности пластин. Эти мРНК прикрепляются к соответствующим им ДНК, и их можно опознать по светящимся участкам. Поскольку положение каждой ДНК отдельного гена на пластинах известно заранее, компьютер определяет, какие гены транскрибируются на данной стадии развития.

Итак, с помощью этих и других технологий генетики начинают выяснять общие модели организации живого с функциональной и структурной стороны. Для обработки громадного количества информации появилась особая ветвь науки - биоинформатика. Ближайшие десятилетия обещают стать временем поистине великих открытий.

Генетика / Бартон Гуттман, Энтони Гриффитс, Дэвид Сузуки, Тара Куллис. - М.: ФАИР-

ПРЕСС, 2004. - 448 с: ил.