Генетический код: описание, характеристики, история исследования. Как генетический код влияет на характер и судьбу

Каждый живой организм обладает особым набором белков. Определенные соединения нуклеотидов и их последовательность в молекуле ДНК образуют генетический код. Он передает информацию о строении белка. В генетике была принята определенная концепция. Согласно ей, одному гену соответствовал один фермент (полипептид). Следует сказать, что исследования о нуклеиновых кислотах и белках проводились в течение достаточно продолжительного периода. Далее в статье подробнее рассмотрим генетический код и его свойства. Будет также приведена краткая хронология исследований.

Терминология

Генетический код - это способ зашифровки последовательности белков аминокислот с участием нуклеотидной последовательности. Этот метод формирования сведений характерен для всех живых организмов. Белки - природные органические вещества с высокой молекулярностью. Эти соединения также присутствуют в живых организмах. Они состоят из 20 видов аминокислот, которые называются каноническими. Аминокислоты выстроены в цепочку и соединены в строго установленной последовательности. Она определяет структуру белка и его биологические свойства. Встречается также несколько цепочек аминокислот в белке.

ДНК и РНК

Дезоксирибонуклеиновая кислота - это макромолекула. Она отвечает за передачу, хранение и реализацию наследственной информации. ДНК использует четыре азотистых основания. К ним относятся аденин, гуанин, цитозин, тимин. РНК состоит из тех же нуклеотидов, кроме того из них, в составе которого находится тимин. Вместо него присутствует нуклеотид, содержащий урацил (U). Молекулы РНК и ДНК представляют собой нуклеотидные цепочки. Благодаря такой структуре образовываются последовательности - "генетический алфавит".

Реализация информации

Синтез белка, который кодируется геном, реализовывается при помощи объединения мРНК на матрице ДНК (транскрипции). Также происходит передача генетического кода в последовательность аминокислот. То есть имеет место синтез полипептидной цепи на мРНК. Для зашифровки всех аминокислот и сигнала окончания белковой последовательности достаточно 3-х нуклеотидов. Эта цепь называется триплетом.

История исследования

Изучение белка и нуклеиновых кислот проводилось длительное время. В середине 20 века, наконец, появились первые идеи о том, какую природу имеет генетический код. В 1953 году выяснили, что некоторые белки состоят из последовательностей аминокислот. Правда, тогда еще не могли определить их точное количество, и по этому поводу велись многочисленные споры. В 1953 году авторами Уотсоном и Криком было опубликовано две работы. Первая заявляла о вторичной структуре ДНК, вторая говорила о ее допустимом копировании при помощи матричного синтеза. Кроме того, был сделан акцент на то, что конкретная последовательность оснований - это код, несущий наследственную информацию. Американский и советский физик Георгий Гамов допустил гипотезу кодирования и нашел метод ее проверки. В 1954 году была опубликована его работа, в ходе которой он выдвинул предложение установить соответствия между боковыми аминокислотными цепями и "дырами", имеющими ромбообразную форму, и использовать это как механизм кодирования. Потом его назвали ромбическим. Разъясняя свою работу, Гамов допустил, что генетический код может являться триплетным. Труд физика стал одним из первых среди тех, которые считались близкими к истине.

Классификация

По истечении нескольких лет предлагались различные модели генетических кодов, представляющие собой два вида: перекрывающиеся и неперекрывающиеся. В основе первой было вхождение одного нуклеотида в состав нескольких кодонов. К ней принадлежит треугольный, последовательный и мажорно-минорный генетический код. Вторая модель предполагает два вида. К неперекрывающимся относятся комбинационный и "код без запятых". В основе первого варианта лежит кодировка аминокислоты триплетами нуклеотидов, и главным является его состав. Согласно "коду без запятых", определенные триплеты соответствуют аминокислотам, а остальные нет. В этом случае считалось, что при расположении любых значащих триплетов последовательно другие, находящиеся в иной рамке считывания, получатся ненужными. Ученые полагали, что существует возможность подбора нуклеотидной последовательности, которая будет удовлетворять этим требованиям, и что триплетов ровно 20.

Хотя Гамов с соавторами ставили под сомнение такую модель, она считалась наиболее правильной на протяжении следующих пяти лет. В начале второй половины 20-го века появились новые данные, которые позволили обнаружить некоторые недочеты в "коде без запятых". Было выявлено, что кодоны способны провоцировать синтез белка в пробирке. Ближе к 1965 году осмыслили принцип всех 64 триплетов. В результате обнаружили избыточность некоторых кодонов. Другими словами, последовательность аминокислот кодируется несколькими триплетами.

Отличительные особенности

К свойствам генетического кода относятся:

Вариации

Впервые отклонение генетического кода от стандартного было обнаружено в 1979 году во время изучения генов митохондрий в организме человека. Далее выявили еще подобные варианты, в том числе множество альтернативных митохондриальных кодов. К ним относятся расшифровка стоп-кодона УГА, используемого в качестве определения триптофана у микоплазм. ГУГ и УУГ у архей и бактерий нередко применяются в роли стартовых вариантов. Иногда гены кодируют белок со старт-кодона, отличающийся от стандартно используемого этим видом. Кроме того, в некоторых белках селеноцистеин и пирролизин, которые являются нестандартными аминокислотами, вставляются рибосомой. Она прочитывает стоп-кодон. Это зависит от последовательностей, находящихся в мРНК. В настоящее время селеноцистеин считается 21-ой, пирролизан - 22-ой аминокислотой, присутствующей в составе белков.

Общие черты генетического кода

Однако все исключения являются редкостью. У живых организмов в основном генетический код имеет ряд общих признаков. К ним относятся состав кодона, в который входят три нуклеотида (два первых принадлежат к определяющим), передача кодонов тРНК и рибосомами в аминокислотную последовательность.

Благодаря процессу транскрипции в клетке осуществляется передача информации от ДНК к белку: ДНК - и-РНК - белок. Генетическая информация, содержащаяся в ДНК и в и-РНК, заключена в последовательности расположения нуклеотидов в молекулах. Каким же образом происходит перевод информации с "языка" нуклеотидов на "язык" аминокислот? Такой перевод осуществляется с помощью генетического кода. Код, или шифр,- это система символов для перевода одной формы информации в другую. Генетический код - это система записи информации о последовательности расположения аминокислот в белках с помощью последовательности расположения нуклеотидов в информационной РНК. Насколько важна именно последовательность расположения одних и тех же элементов (четырех нуклеотидов в РНК) для понимания и сохранения смысла информации, можно убедиться на простом примере: переставив буквы в слове код, мы получим слово с иным значением - док. Какими же свойствами обладает генетический код?

1. Код триплетен. В состав РНК входят 4 нуклеотида: А, Г, Ц, У. Если бы мы пытались обозначить одну аминокислоту одним нуклеотидом, то 16 из 20 аминокислот остались бы не зашифрованы. Двухбуквенный код позволил бы зашифровать 16 аминокислот (из четырех нуклеотидов можно составить 16 различных комбинаций, в каждой из которых имеется два нуклеотида). Природа создала трехбуквенный, или триплетный, код. Это означает, что каждая из 20 аминокислот зашифрована последовательностью трех нуклеотидов, называемых триплетом или кодоном. Из 4 нуклеотидов можно создать 64 различные комбинации по 3 нуклеотида в каждой (4*4*4=64). Этого с избытком хватает для кодирования 20 аминокислот и, казалось бы, 44 кодона являются лишними. Однако это не так.

2. Код вырожден. Это означает, что каждая аминокислота шифруется более чем одним кодоном (от двух до шести). Исключение составляют аминокислоты метионин и триптофан, каждая из которых кодируется только одним триплетом. (Это видно из таблицы генетического кода .) Тот факт, что метионин кодируется одним триплетом АУТ, имеет особый смысл, который вам станет понятен позже ( 16).

3. Код однозначен. Каждый кодон шифрует только одну аминокислоту. У всех здоровых людей в гене, несущем информацию о бета-цепи гемоглобина , триплет ГАА или ГАГ, I стоящий на шестом месте, кодирует глутаминовую кислоту. У больных серповидноклеточной анемией второй нуклеотид в этом триплете заменен на У. Как видно из таблицы, триплеты ГУА или ГУГ, которые в этом случае образуются, кодируют аминокислоту валин. К чему приводит такая замена, вы уже знаете из раздела о ДНК .

4. Между генами имеются "знаки препинания". В печатном тексте в конце каждой фразы стоит точка. Несколько связанных по смыслу фраз составляют абзац. На языке генетической информации таким абзацем являются оперон и комплементарная ему и-РНК. Каждый ген в опероне кодирует одну полипептидную цепочку - фразу. Так как в ряде случаев по матрице и-РНК последовательно создается несколько разных полипептидных цепей, они должны быть отделены друг от друга. Для этого в генетическом коде существуют три специальные триплета - УАА, УАГ, УГА, каждый из которых обозначает прекрдщение синтеза одной полипептидной цепи. Таким образом, эти триплеты выполняют функцию знаков препинания. Они находятся в конце каждого гена. Внутри гена нет "знаков препинания". Поскольку генетический код подобен языку, разберем это свойство на примере такой составленной из триплетов фразы: жил был кот тих был сер мил мне тот кот. Смысл написанного понятен, несмотря на отсутствие "знаков препинания. Если же мы уберем в первом слове одну букву (один нуклеотид в гене), но читать будем также тройками букв, то получится бессмыслица: илб ылк отт ихб ылс ерм илм нет отк от Нарушение смысла возникает и при выпадении одного или двух нуклеотидов из гена. Белок, который будет считываться с такого испорченного гена, не будет иметь ничего общего с тем белком, который кодировался нормальным геном.

6. Код универсален. Генетический код един для всех живущих на Земле существ. У бактерий и грибов, пшеницы и хлопка, рыб и червей, лягушки и человека одни и те же триплеты кодируют одни и те же аминокислоты.

При необходимости синтеза белков перед клеткой возникает одна серьезная проблема – информация в ДНК хранится в виде последовательности, закодированной 4 символами (нуклеотидами), а белки состоят из 20 различных символов (аминокислот). Если попытаться использовать сразу все четыре символа для кодировки аминокислот, то получится всего 16 сочетаний, в то время как протеиногенных аминокислот насчитывается 20. Не хватает...

На этот счет существует пример гениального мышления:

"Возьмем, например, колоду игральных карт, в которой мы обращаем внимание только на масть карты. Сколько триплетов одного и того же вида можно получить? Четыре, конечно: трое червей, трое бубен, трое пик и трое треф. Сколько триплетов с двумя картами одной и той же масти и одной другой? Пусть мы имеем четыре выбора для третьей карты. Поэтому мы имеем 4x3 = 12 возможностей. В дополнение мы имеем четыре триплета со всеми тремя различными картами. Итак, 4+12+4=20, а это и есть точное число аминокислот, которое мы хотели получить" (Георгий Гамов, англ. George Gamow, 1904-1968г, советский и американский физик-теоретик, астрофизик и популяризатор науки).

Действительно, экспериментами доказано, что для каждой аминокислоты имеется по два обязательных нуклеотида и третий вариабельный, менее специфичный ("эффект качания "). В случае, если брать три символа из четырех, то получится 64 комбинации, что намного перекрывает число аминокислот. Таким образом выяснено, что любая аминокислота кодируется тремя нуклеотидами. Эта тройка получила название кодон . Их, как уже сказано, существует 64 варианта. Три из них не кодируют никакой аминокислоты, это так называемые "нонсенс-кодоны " (франц. non-sens - бессмыслица) или "стоп-кодоны".

Генетический код

Генетический (биологический) код – это способ кодирования информации о строении белков в виде нуклеотидной последовательности. Он предназначен для перевода четырехзначного языка нуклеотидов (А, Г, У, Ц) в двадцатизначный язык аминокислот. Он обладает характерными особенностями:

  • Триплетность – три нуклеотида формируют кодон, кодирующий аминокислоту. Всего насчитывают 61 смысловой кодон.
  • Специфичность (или однозначность ) – каждому кодону соответствует только одна аминокислота.
  • Вырожденность – одной аминокислоте может соответствовать несколько кодонов.
  • Универсальность – биологический код одинаков для всех видов организмов на Земле (однако в митохондриях млекопитающих есть исключения).
  • Колинеарность – последовательность кодонов соответствует последовательности аминокислот в кодируемом белке.
  • Неперекрываемость – триплеты не накладываются друг на друга, располагаясь рядом.
  • Отсутствие знаков препинания – между триплетами нет дополнительных нуклеотидов или каких-либо иных сигналов.
  • Однонаправленность – при синтезе белка считывание кодонов идет последовательно, без пропусков или возвратов назад.

Однако ясно, что биологический код не может проявить себя без дополнительных молекул, которые выполняют переходную функцию или функцию адаптора .

Адапторная роль транспортных РНК

Транспортные РНК являются единственным посредником между 4-х буквенной последовательностью нуклеиновых кислот и 20-ти буквенной последовательностью белков.

Каждая транспортная РНК имеет определенную триплетную последовательность в антикодоновой петле (антикодон ) и может присоединить только такую аминокислоту, которая соответствует этому антикодону. Именно от наличия того или иного антикодона в тРНК зависит, какая аминокислота включится в белковую молекулу, т.к. ни рибосома, ни мРНК не узнают аминокислоту.

Таким образом, адапторная роль тРНК заключается:

  1. в специфичном связывании с аминокислотами,
  2. в специфичном, согласно кодон-антикодоновому взаимодействию, связывании с мРНК,
  3. и, как результат, во включении аминокислот в белковую цепь в соответствии с информацией мРНК.

Присоединение аминокислоты к тРНК осуществляется ферментом аминоацил-тРНК-синтетазой , имеющей специфичность одновременно к двум соединениям: какой-либо аминокислоте и соответствующей ей тРНК. Для реакции требуется две макроэргические связи АТФ. Аминокислота присоединяется к 3"-концу акцепторной петли тРНК через свою α-карбоксильную группу, и связь между аминокислотой и тРНК становится макроэргической . α-Аминогруппа остается свободной.

Реакция синтеза аминоацил-тРНК

Так как существует около 60 различных тРНК, то некоторым аминокислотам соответствует по две или более тРНК. Различные тРНК, присоединяющие одну аминокислоту, называют изоакцепторными .

Сегодня ни для кого не секрет, что программа жизнедеятельности всех живых организмов записана на молекуле ДНК. Проще всего представить молекулу ДНК в виде длинной лестницы. Вертикальные стойки этой лестницы состоят из молекул сахара, кислорода и фосфора. Вся важная рабочая информация в молекуле записана на перекладинах лестницы — они состоят из двух молекул, каждая из которых крепится к одной из вертикальных стоек. Эти молекулы — азотистые основания — называются аденин, гуанин, тимин и цитозин, но обычно их обозначают просто буквами А, Г, Т и Ц. Форма этих молекул позволяет им образовывать связи — законченные ступеньки — лишь определенного типа. Это связи между основаниями А и Т и между основаниями Г и Ц (образованную таким образом пару называют «парой оснований» ). Других типов связи в молекуле ДНК быть не может.

Спускаясь по ступенькам вдоль одной цепи молекулы ДНК, вы получите последовательность оснований. Именно это сообщение в виде последовательности оснований и определяет поток химических реакций в клетке и, следовательно, особенности организма, обладающего данной ДНК. Согласно центральной догме молекулярной биологии , на молекуле ДНК закодирована информация о белках , которые, в свою очередь, выступая в роли ферментов (см. Катализаторы и ферменты), регулируют все химические реакции в живых организмах.

Строгое соответствие между последовательностью пар оснований в молекуле ДНК и последовательностью аминокислот, составляющих белковые ферменты, называется генетическим кодом. Генетический код был расшифрован вскоре после открытия двуспиральной структуры ДНК. Было известно, что недавно открытая молекула информационной , или матричной РНК (иРНК, или мРНК), несет информацию, записанную на ДНК. Биохимики Маршалл Уоррен Ниренберг (Marshall W. Nirenberg) и Дж. Генрих Маттеи (J. Heinrich Matthaei) из Национального института здравоохранения в городке Бетезда под Вашингтоном, округ Колумбия, поставили первые эксперименты, которые привели к разгадке генетического кода.

Они начали с того, что синтезировали искусственные молекулы иРНК, состоявшие только из повторяющегося азотистого основания урацила (который является аналогом тимина, «Т», и образует связи только с аденином, «А», из молекулы ДНК). Они добавляли эти иРНК в тестовые пробирки со смесью аминокислот, причем в каждой пробирке лишь одна из аминокислот была помечена радиоактивной меткой. Исследователи обнаружили, что искусственно синтезированная ими иРНК инициировала образование белка лишь в одной пробирке, где находилась меченая аминокислота фенилаланин. Так они установили, что последовательность «—У—У—У—» на молекуле иРНК (и, следовательно, эквивалентную ей последовательность «—А—А—А—» на молекуле ДНК) кодирует белок, состоящий только из аминокислоты фенилаланина. Это было первым шагом к расшифровке генетического кода.

Сегодня известно, что три пары оснований молекулы ДНК (такой триплет получил название кодон ) кодируют одну аминокислоту в белке. Выполняя эксперименты, аналогичные описанному выше, генетики в конце концов расшифровали весь генетический код, в котором каждому из 64 возможных кодонов соответствует определенная аминокислота.

В любой клетке и организме все особенности анатомического, морфологического и функционального характера определяются структурой белков, которые входят в них. Наследственным свойством организма является способность к синтезу определенных белков. В аминокислоты расположены в полипептидной цепочке, от которой зависят биологические признаки.
Для каждой клетки характерна своя последовательность нуклеотидов в полинуклеотидной цепи ДНК. Это и есть генетический код ДНК. Посредством его записывается информация о синтезе тех или иных белков. О том, что такое генетический код, о его свойствах и генетической информации рассказывается в этой статье.

Немного истории

Идея о том, что, возможно, генетический код существует, была сформулирована Дж.Гамовым и А.Дауном в середине двадцатого столетия. Они описали, что последовательность нуклеотидов, отвечающая за синтез определенной аминокислоты, содержит по меньшей мере три звена. Позже доказали точное количество из трех нуклеотидов (это единица генетического кода), которое назвали триплет или кодон. Всего нуклеотидов насчитывается шестьдесят четыре, потому что молекулы кислот, где происходит или РНК, состоит из остатков четырех различных нуклеотидов.

Что такое генетический код

Способ кодирования последовательности белков аминокислот благодаря последовательности нуклеотидов характерен для всех живых клеток и организмов. Вот что такое генетический код.
В ДНК есть четыре нуклеотида:

  • аденин - А;
  • гуанин - Г;
  • цитозин - Ц;
  • тимин - Т.

Они обозначаются заглавными буквами латинскими или (в русскоязычной литературе) русскими.
В РНК также присутствуют четыре нуклеотида, однако один из них отличается от ДНК:

  • аденин - А;
  • гуанин - Г;
  • цитозин - Ц;
  • урацил - У.

Все нуклеотиды выстраиваются в цепочки, причем в ДНК получается двойная спираль, а в РНК — одинарная.
Белки строятся на двадцати аминокислотах, где они, расположенные в определенной последовательности, определяют его биологические свойства.

Свойства генетического кода

Триплетность. Единица генетического кода состоит из трех букв, он триплетен. Это означает, что двадцать существующих аминокислот зашифрованы тремя определенными нуклеотидами, которые называются кодонами или трилпетами. Существуют шестьдесят четыре комбинации, которые можно создать из четырех нуклеотидов. Этого количества более чем достаточно для того, чтобы закодировать двадцать аминокислот.
Вырожденность. Каждая аминокислота соответствует более чем одному кодону, за исключением метионина и триптофана.
Однозначность. Один кодон шифрует одну аминокислоту. Например, в гене здорового человека с информацией о бета-цели гемоглобина триплет ГАГ и ГАА кодирует А у всех, кто болен серповидноклеточной анемией, один нуклеотид заменен.
Коллинеарность. Последовательность аминокислот всегда соответствует последовательности нуклеотидов, которую содержит ген.
Генетический код непрерывен и компактен, что означает то, что он не имеет «знаков препинания». То есть, начинаясь на определенном кодоне, идет непрерывное считывание. К примеру, АУГГУГЦУУААУГУГ будет считываться как: АУГ, ГУГ, ЦУУ, ААУ, ГУГ. Но никак не АУГ, УГГ и так далее или как-то еще иначе.
Универсальность. Он един абсолютно для всех земных организмов, от людей до рыб, грибов и бактерий.

Таблица

В представленной таблице присутствуют не все имеющиеся аминокислоты. Гидроксипролин, гидроксилизин, фосфосерин, иодопроизводных тирозина, цистин и некоторые другие отсутствуют, так как они являются производными других аминокислот, кодирующихся м-РНК и образующихся после модификации белков в результате трансляции.
Из свойств генетического кода известно, что один кодон способен кодировать одну аминокислоту. Исключением является выполняющий дополнительные функции и кодирующий валин и метионин, генетический код. ИРНК, находясь в начале с кодоном, присоединяет т-РНК, которая несет формилметион. По завершении синтеза он отщепляется сам и захватывает за собой формильный остаток, преобразуясь в остаток метионина. Так, вышеупомянутые кодоны являются инициаторами синтеза цепи полипептидов. Если же они находятся не в начале, то ничем не отличаются от других.

Генетическая информация

Под этим понятием подразумевается программа свойств, которая передается от предков. Она заложена в наследственности как генетический код.
Реализуется при синтезе белка генетический код :

  • информационной и-РНК;
  • рибосомальной р-РНК.

Информация передается прямой связью (ДНК-РНК-белок) и обратной (среда-белок-ДНК).
Организмы могут получать, сохранять, передавать ее и использовать при этом наиболее эффективно.
Передаваясь по наследству, информация определяет развитие того или иного организма. Но из-за взаимодействия с окружающей средой реакция последнего искажается, благодаря чему и происходит эволюция и развитие. Таким образом в организм закладывается новая информация.


Вычисление закономерностей молекулярной биологии и открытие генетического кода проиллюстрировали то, что необходимо соединить генетику с теорией Дарвина, на основе чего появилась синтетическая теория эволюции — неклассическая биология.
Наследственность, изменчивость и естественный отбор Дарвина дополняются генетически определяемым отбором. Эволюция реализуется на генетическом уровне путем случайных мутаций и наследованием самых ценных признаков, которые наиболее адаптированы к окружающей среде.

Расшифровка кода у человека

В девяностых годах был начат проект Human Genome, в результате чего в двухтысячных были открыты фрагменты генома, содержащие 99,99% генов человека. Неизвестными остались фрагменты, которые не участвуют в синтезе белков и не кодируются. Их роль пока остается неизвестной.

Последняя открытая в 2006 году хромосома 1 является самой длинной в геноме. Более трехсот пятидесяти заболеваний, в том числе рак, появляются в результате нарушений и мутаций в ней.

Роль подобных исследований трудно переоценить. Когда открыли, что такое генетический код, стало известно, по каким закономерностям происходит развитие, как формируется морфологическое строение, психика, предрасположенность к тем или иным заболеваниям, обмен веществ и пороки индивидов.