Генетичний код: опис, характеристики, історія дослідження. Як генетичний код впливає на характер та долю

Кожен живий організм має особливий набір білків. Певні сполуки нуклеотидів та їх послідовність у молекулі ДНК утворюють генетичний код. Він передає інформацію про будову білка. У генетиці було прийнято певну концепцію. Відповідно до неї, одному гену відповідав один фермент (поліпептид). Слід сказати, що дослідження про нуклеїнові кислоти та білки проводилися протягом досить тривалого періоду. Далі у статті докладніше розглянемо генетичний код та його властивості. Буде також наведено коротку хронологію досліджень.

Термінологія

Генетичний код – це спосіб зашифрування послідовності білків амінокислот за участю нуклеотидної послідовності. Цей спосіб формування відомостей уражає всіх живих організмів. Білки – природні органічні речовини з високою молекулярністю. Ці сполуки також є у живих організмах. Вони складаються з 20 видів амінокислот, які називаються канонічними. Амінокислоти вибудовані в ланцюжок і з'єднані в встановленій послідовності. Вона визначає структуру білка та його біологічні властивості. Зустрічається також кілька ланцюжків амінокислот у білку.

ДНК та РНК

Дезоксирибонуклеїнова кислота – це макромолекула. Вона відповідає за передачу, зберігання та реалізацію спадкової інформації. ДНК використовує чотири азотисті основи. До них належать аденін, гуанін, цитозин, тимін. РНК складається з тих же нуклеотидів, крім того, у складі якого перебуває тімін. Замість нього є нуклеотид, що містить урацил (U). Молекули РНК і ДНК є нуклеотидні ланцюжки. Завдяки такій структурі утворюються послідовності – "генетичний алфавіт".

Реалізація інформації

Синтез білка, що кодується геном, реалізовується за допомогою об'єднання мРНК на матриці ДНК (транскрипції). Також відбувається передача генетичного коду послідовність амінокислот. Тобто має місце синтез поліпептидного кола на мРНК. Для зашифрування всіх амінокислот та сигналу закінчення білкової послідовності достатньо 3-х нуклеотидів. Цей ланцюг називається триплетом.

Історія дослідження

Вивчення білка та нуклеїнових кислот проводилося тривалий час. У середині 20 століття нарешті з'явилися перші ідеї про те, яку природу має генетичний код. 1953 року з'ясували, що деякі білки складаються з послідовностей амінокислот. Щоправда, тоді ще не могли визначити їх точну кількість, і з цього приводу точилися численні суперечки. У 1953 році авторами Вотсоном і Криком було опубліковано дві роботи. Перша заявляла про вторинну структуру ДНК, друга говорила про її допустиме копіювання за допомогою матричного синтезу. Крім того, було зроблено акцент на те, що конкретна послідовність підстав - це код, який несе спадкову інформацію. Американський та радянський фізик Георгій Гамов припустився гіпотези кодування та знайшов метод її перевірки. У 1954 році була опублікована його робота, в ході якої він висунув пропозицію встановити відповідності між бічними амінокислотними ланцюгами та "дірками", що мають ромбоподібну форму, і використовувати це як механізм кодування. Потім його назвали ромбічним. Роз'яснюючи свою роботу, Гамов припустив, що генетичний код може бути триплетним. Праця фізика стала однією з перших серед тих, які вважалися близькими до істини.

Класифікація

Через кілька років пропонувалися різні моделі генетичних кодів, що являють собою два види: перекриваються і неперекриваються. В основі першої було входження одного нуклеотиду до складу кількох кодонів. До неї належить трикутний, послідовний та мажорно-мінорний генетичний код. Друга модель передбачає два види. До тих, що не перекриваються, відносяться комбінаційний і "код без ком". В основі першого варіанта лежить кодування амінокислоти триплетами нуклеотидів, і головним є його склад. Згідно з "кодом без ком", певні триплети відповідають амінокислотам, а решта немає. У цьому випадку вважалося, що при розташуванні будь-яких значущих триплетів послідовно інші, що знаходяться в іншій рамці зчитування, вийдуть непотрібними. Вчені вважали, що є можливість підбору нуклеотидної послідовності, яка задовольнятиме цим вимогам, і що триплетів рівно 20.

Хоча Гамов із співавторами ставили під сумнів таку модель, вона вважалася найбільш правильною протягом наступних п'яти років. На початку другої половини 20-го століття з'явилися нові дані, які дозволили виявити деякі недоліки в "коді без ком". Було виявлено, що кодони здатні стимулювати синтез білка в пробірці. Ближче до 1965 року осмислили принцип усіх 64 триплетів. В результаті виявили надмірність деяких кодонів. Іншими словами, послідовність амінокислот кодується кількома триплетами.

Відмінні особливості

До властивостей генетичного коду належать:

Варіації

Вперше відхилення генетичного коду від стандартного було виявлено в 1979 під час вивчення генів мітохондрій в організмі людини. Далі виявили ще подібні варіанти, зокрема безліч альтернативних мітохондріальних кодів. До них відносяться розшифрування стоп-кодону УГА, що використовується як визначення триптофану у мікоплазм. ГУГ та УУГ у архей та бактерій нерідко застосовуються в ролі стартових варіантів. Іноді гени кодують білок зі старт-кодону, який відрізняється від стандартно використовуваного цим видом. Крім того, в деяких білках селеноцистеїн та піролізин, які є нестандартними амінокислотами, вставляються рибосомою. Вона прочитує стоп-кодон. Це від послідовностей, що у мРНК. В даний час селеноцистеїн вважається 21-ою, піролізан - 22-ою амінокислотою, що присутня у складі білків.

Загальні риси генетичного коду

Однак усі винятки є рідкістю. У живих організмів переважно генетичний код має низку загальних ознак. До них відносяться склад кодону, до якого входять три нуклеотиди (два перші належать до визначальних), передача кодонів тРНК та рибосомами в амінокислотну послідовність.

Завдяки процесу транскрипції у клітині здійснюється передача інформації від ДНК до білка: ДНК – і-РНК – білок. Генетична інформація, що міститься в ДНК та і-РНК, укладена в послідовності розташування нуклеотидів у молекулах. Яким чином відбувається переклад інформації з "мови" нуклеотидів на "мову" амінокислот? Такий переклад здійснюється за допомогою генетичного коду. Код, або шифр, - це система символів для переведення однієї форми інформації до іншої. Генетичний код - це система запису інформації про послідовність розташування амінокислот у білках за допомогою послідовності розташування нуклеотидів в інформаційній РНК. Наскільки важлива саме послідовність розташування тих самих елементів (чотирьох нуклеотидів в РНК) для розуміння і збереження сенсу інформації, можна переконатися на простому прикладі: переставивши літери в слові код, ми отримаємо слово з іншим значенням - док. Які ж властивості має генетичний код?

1. Код триплетен. До складу РНК входять 4 нуклеотиди: А, Г, Ц, У. Якби ми намагалися позначити одну амінокислоту одним нуклеотидом, то 16 із 20 амінокислот залишилися б не зашифровані. Дволітерний код дозволив би зашифрувати 16 амінокислот (з чотирьох нуклеотидів можна скласти 16 різних комбінацій, у кожній з яких є два нуклеотиди). Природа створила трилітерний, або триплетний, код. Це означає, що кожна з 20 амінокислот зашифрована послідовністю трьох нуклеотидів, які називають триплетом або кодоном. З 4 нуклеотидів можна створити 64 різні комбінації по 3 нуклеотиди в кожній (4 * 4 * 4 = 64). Цього з надлишком вистачає для кодування 20 амінокислот і, здавалося б, 44 кодони є зайвими. Однак, це не так.

2. Код вироджено. Це означає, що кожна амінокислота шифрується більш ніж одним кодоном (від двох до шести). Виняток становлять амінокислоти метіонін і триптофан, кожна з яких кодується лише одним триплетом. (Це видно з таблиці генетичного коду.) Той факт, що метіонін кодується одним триплетом АУТ, має особливий сенс, який вам стане зрозумілим пізніше (16).

3. Код однозначний. Кожен кодон шифрує лише одну амінокислоту. У всіх здорових людей у ​​гені, що несе інформацію про бета-ланцюги гемоглобіну, триплет ГАА або ГАГ, що стоїть на шостому місці, кодує глутамінову кислоту. У хворих на серповидноклітинну анемію другий нуклеотид у цьому триплеті замінений на У. Як видно з таблиці, триплети ГУА або ГУГ, які в цьому випадку утворюються, кодують амінокислоту валін. До чого призводить така заміна, ви вже знаєте з розділу ДНК.

4. Між генами є "розділові знаки". У друкованому тексті наприкінці кожної фрази стоїть крапка. Декілька пов'язаних за змістом фраз становлять абзац. Мовою генетичної інформації таким абзацом є оперон та комплементарна йому і-РНК. Кожен ген в опероні кодує один поліпептидний ланцюжок - фразу. Так як у ряді випадків за матрицею і-РНК послідовно створюється кілька різних поліпептидних ланцюгів, вони повинні бути відокремлені один від одного. Для цього в генетичному коді існують три спеціальні триплети - УАА, УАГ, УГА, кожен з яких означає припинення синтезу одного поліпептидного ланцюга. Таким чином, ці триплети виконують функцію розділових знаків. Вони перебувають у кінці кожного гена. Усередині гена немає "розділових знаків". Оскільки генетичний код подібний до мови, розберемо цю властивість на прикладі такої складеної з триплетів фрази: жив був кіт тих був сер милий мені той кіт. Сенс написаного зрозумілий, незважаючи на відсутність "розділових знаків. Якщо ж ми приберемо в першому слові одну літеру (один нуклеотид в гені), але читатимемо також трійками літер, то вийде нісенітниця: ілбілк отт ихб ылс ерм илм немає отк від Порушення сенсу виникає і при випадінні одного або двох нуклеотидів з гена.

6. Код універсальний. Генетичний код єдиний всім живих Землі істот. У бактерій і грибів, пшениці та бавовни, риб і черв'яків, жаби та людини одні й ті самі триплети кодують ті самі амінокислоти.

При необхідності синтезу білків перед клітиною виникає одна серйозна проблема – інформація в ДНК зберігається у вигляді послідовності, закодованої 4 символами(нуклеотидами), а білки складаються з 20 різних символів(Амінокислот). Якщо спробувати використати відразу всі чотири символи для кодування амінокислот, то вийде всього 16 поєднань, тоді як протеїногенних амінокислот налічується 20.

Із цього приводу існує приклад геніального мислення:

"Візьмемо, наприклад, колоду гральних карт, у якій ми звертаємо увагу лише масть карти. Скільки триплетів того самого виду можна отримати? Чотири, звичайно: троє хробаків, троє бубон, троє пік та троє треф. Скільки триплетів з двома картами однієї і тієї ж масті та однієї іншої? Нехай ми маємо чотири вибори для третьої карти. Тому ми маємо 4x3 = 12 можливостей. На додаток, ми маємо чотири триплети з усіма трьома різними картами. Отже, 4+12+4=20, а це і є точна кількість амінокислот, яку ми хотіли отримати" (Георгій Гамов, англ. George Gamow, 1904-1968, радянський і американський фізик-теоретик, астрофізик і популяризатор науки).

Дійсно, експериментами доведено, що для кожної амінокислоти є по два обов'язкові нуклеотиди та третій варіабельний, менш специфічний (" ефект гойданняУ випадку, якщо брати три символи з чотирьох, то вийде 64 комбінації, що набагато перекриває число амінокислот. Таким чином з'ясовано, що будь-яка амінокислота кодується трьома нуклеотидами. Ця трійка отримала назву кодон. Їх, як уже сказано, існує 64 варіанти. Три з них не кодують жодної амінокислоти, це так звані " нонсенс-кодони(франц. non-sens- нісенітниця) або "стоп-кодони".

Генетичний код

Генетичний (біологічний) код – це спосіб кодування інформації про будову білків у вигляді нуклеотидної послідовності. Він призначений для перекладу чотиризначної мови нуклеотидів (А, Г, У, Ц) у двадцятизначну мову амінокислот. Він має характерні особливості:

  • Триплетність– три нуклеотиди формують кодон, що кодує амінокислоту. Усього нараховують 61 смисловий кодон.
  • Специфіка(або однозначність) – кожному кодону відповідає лише одна амінокислота.
  • Виродженість– одній амінокислоті може відповідати кілька кодонів.
  • Універсальність- Біологічний код однаковий для всіх видів організмів на Землі (проте в мітохондріях ссавців є винятки).
  • Колінеарність- Послідовність кодонів відповідає послідовності амінокислот в білку, що кодується.
  • Неперекриваність– триплети не накладаються один на одного, розташовуючись поряд.
  • Відсутність розділових знаків– між триплетами немає додаткових нуклеотидів або інших сигналів.
  • Односпрямованість- При синтезі білка зчитування кодонів йде послідовно, без перепусток або повернень назад.

Однак ясно, що біологічний код не може проявити себе без додаткових молекул, які виконують перехідну функцію або функцію адаптора.

Адапторна роль транспортних РНК

Транспортні РНК є єдиним посередником між 4-х літерною послідовністю нуклеїнових кислот та 20-ти літерною послідовністю білків.

Кожна транспортна РНК має певну триплетну послідовність антикодонової петлі ( антикодон) і може приєднати тільки таку амінокислоту, яка відповідає цьому антикодону. Саме наявності того чи іншого антикодону в тРНК залежить, яка амінокислота включиться в білкову молекулу, т.к. ні рибосоми, ні мРНК не впізнають амінокислоту.

Таким чином, адапторна роль тРНКполягає:

  1. у специфічному зв'язуванні з амінокислотами,
  2. у специфічному, згідно з кодон-антикодонової взаємодії, зв'язуванні з мРНК,
  3. і, як результат, у включенні амінокислот до білкового ланцюга відповідно до інформації мРНК.

Приєднання амінокислоти до тРНК здійснюється ферментом аміноацил-тРНК-синтетазою, Що має специфічність одночасно до двох сполук: будь-якої амінокислоти та відповідної їй тРНК. Для реакції потрібні два макроергічні зв'язки АТФ. Амінокислота приєднується до 3"-кінця акцепторної петлі тРНК через свою α-карбоксильну групу, і зв'язок між амінокислотою та тРНК стає макроергічної. α-аміногрупа залишається вільною.

Реакція синтезу аміноацил-тРНК

Так як існує близько 60 різних тРНК, то деяким амінокислот відповідає по дві або більше тРНК. Різні тРНК, що приєднують одну амінокислоту, називають ізоакцепторними.

Сьогодні ні для кого не є секретом, що програма життєдіяльності всіх живих організмів записана на молекулі ДНК. Найпростіше уявити молекулу ДНК у вигляді довгих сходів. Вертикальні стійки цих сходів складаються з молекул цукру, кисню та фосфору. Вся важлива робоча інформація в молекулі записана на поперечинах сходів - вони складаються з двох молекул, кожна з яких кріпиться до однієї з вертикальних стійок. Ці молекули - азотисті основи - називаються аденін, гуанін, тимін і цитозин, але зазвичай їх позначають просто буквами А, Г, Т і Ц. Форма цих молекул дозволяє їм утворювати зв'язки - закінчені сходинки - лише певного типу. Це зв'язки між основами А і Т і між основами Г і Ц (утворену таким чином пару називають «парою підстав»). Інших типів зв'язку в молекулі ДНК не може бути.

Спускаючись сходами вздовж одного ланцюга молекули ДНК, ви отримаєте послідовність підстав. Саме це повідомлення у вигляді послідовності основ і визначає потік хімічних реакцій у клітині і, отже, особливості організму, що має цю ДНК. Згідно з центральною догмою молекулярної біології, на молекулі ДНК закодована інформація про білки, які, у свою чергу, виступаючи в ролі ферментів ( див.Каталізатори та ферменти), регулюють усі хімічні реакції в живих організмах.

Сувора відповідність між послідовністю пар основ у молекулі ДНК і послідовністю амінокислот, що становлять білкові ферменти, називається генетичним кодом. Генетичний код розшифрували незабаром після відкриття двоспіральної структури ДНК. Було відомо, що нещодавно відкрита молекула інформаційної, або матричноїРНК (іРНК, або мРНК) несе інформацію, записану на ДНК. Біохіміки Маршалл Уоррен Ніренберг (Marshall W. Nirenberg) та Дж. Генріх Маттеї (J. Heinrich Matthaei) з Національного інституту охорони здоров'я в містечку Бетезда під Вашингтоном, округ Колумбія, поставили перші експерименти, які призвели до розгадки генетичного коду.

Вони почали з того, що синтезували штучні молекули іРНК, що складалися тільки з азотистої основи урацилу, що повторюється (який є аналогом тиміну, «Т», і утворює зв'язки тільки з аденіном, «А», з молекули ДНК). Вони додавали ці іРНК у тестові пробірки із сумішшю амінокислот, причому в кожній пробірці лише одна з амінокислот була позначена радіоактивною міткою. Дослідники виявили, що штучно синтезована ними іРНК ініціювала утворення білка лише в одній пробірці, де була мічена амінокислота фенілаланін. Так вони встановили, що послідовність «-У-У-У-» на молекулі іРНК (і, отже, еквівалентну їй послідовність «-А-А-А-» на молекулі ДНК) кодує білок, що складається тільки з амінокислоти фенілаланіну. Це було першим кроком до розшифрування генетичного коду.

Сьогодні відомо, що три пари основ молекули ДНК (такий триплет отримав назву кодон) кодують одну амінокислоту в білку. Виконуючи експерименти, аналогічні описаному вище, генетики зрештою розшифрували весь генетичний код, у якому кожному з 64 можливих кодонів відповідає певна амінокислота.

У будь-якій клітині та організмі всі особливості анатомічного, морфологічного та функціонального характеру визначаються структурою білків, які входять до них. Спадковою властивістю організму є здатність до синтезу певних білків. В амінокислоти розташовані в поліпептидному ланцюжку, від якого залежать біологічні ознаки.
Для кожної клітини характерна своя послідовність нуклеотидів у полінуклеотидному ланцюзі ДНК. Це генетичний код ДНК. За допомогою його записується інформація про синтез тих чи інших білків. Про те, що таке генетичний код, про його властивості та генетичну інформацію розповідається в цій статті.

Трохи історії

Ідея про те, що, можливо, генетичний код існує, була сформульована Дж.Гамовим та А.Дауном у середині двадцятого століття. Вони описали, що послідовність нуклеотидів, що відповідає за синтез певної амінокислоти, містить щонайменше три ланки. Пізніше довели точну кількість із трьох нуклеотидів (це одиниця генетичного коду), яку назвали триплет або кодон. Усього нуклеотидів налічується шістдесят чотири, тому що молекули кислот, де відбувається або РНК, складається із залишків чотирьох різних нуклеотидів.

Що таке генетичний код

Спосіб кодування послідовності білків амінокислот завдяки послідовності нуклеотидів характерний для всіх живих клітин та організмів. Ось що таке генетичний код.
У ДНК є чотири нуклеотиди:

  • аденін - А;
  • гуанін – Г;
  • цитозин – Ц;
  • тімін - Т.

Вони позначаються великими літерами латинськими або (у російськомовній літературі) російськими.
У РНК також присутні чотири нуклеотиди, однак один із них відрізняється від ДНК:

  • аденін - А;
  • гуанін – Г;
  • цитозин – Ц;
  • урацил - У.

Всі нуклеотиди вишиковуються в ланцюжки, причому в ДНК виходить подвійна спіраль, а в РНК одинарна.
Білки будуються на двадцяти амінокислотах, де вони, розташовані у певній послідовності, визначають його біологічні властивості.

Властивості генетичного коду

Триплетність. Одиниця генетичного коду складається з трьох букв, він триплетен. Це означає, що двадцять існуючих амінокислот зашифровано трьома певними нуклеотидами, які називаються кодон або трилпет. Існують шістдесят чотири комбінації, які можна створити із чотирьох нуклеотидів. Цієї кількості більш ніж достатньо для того, щоб закодувати двадцять амінокислот.
Виродженість. Кожна амінокислота відповідає більш ніж одному кодону, за винятком метіоніну та триптофану.
Однозначність. Один кодон шифрує одну амінокислоту. Наприклад, у гені здорової людини з інформацією про бета-мету гемоглобіну триплет ГАГ і ГАА кодує А у всіх, хто хворий на серповидноклітинну анемію, один нуклеотид замінений.
Колінеарність. Послідовність амінокислот завжди відповідає послідовності нуклеотидів, яку містить ген.
Генетичний код безперервний і компактний, що означає те, що він не має «розділових знаків». Тобто, починаючись на певному кодоні, відбувається безперервне зчитування. Наприклад, АУГГУГЦУУААУГУГ зчитуватиметься як: АУГ, ГУГ, ЦУУ, ААУ, ГУГ. Але ніяк не АУГ, УГГ і так далі чи ще якось інакше.
Універсальність. Він єдиний абсолютно для всіх земних організмів, від людей до риб, грибів та бактерій.

Таблиця

У представленій таблиці присутні в повному обсязі наявні амінокислоти. Гідроксипролін, гідроксилізин, фосфосерин, йодових тирозину, цистин та деякі інші відсутні, оскільки вони є похідними інших амінокислот, що кодуються м-РНК і утворюються після модифікації білків в результаті трансляції.
Зі властивостей генетичного коду відомо, що один кодон здатний кодувати одну амінокислоту. Винятком є ​​виконуючий додаткові функції та кодуючий валін та метіонін, генетичний код. ІРНК, перебуваючи на початку з кодоном, приєднує т-РНК, яка несе формілметіон. Після завершення синтезу він відщеплюється сам і захоплює у себе формальний залишок, перетворюючись на залишок метионина. Так, вищезгадані кодони є ініціаторами синтезу ланцюга поліпептидів. Якщо ж вони не на початку, то нічим не відрізняються від інших.

Генетична інформація

Під цим поняттям мається на увазі програма властивостей, що передається від предків. Вона закладена у спадковості як генетичний код.
Реалізується при синтезі білка генетичний код:

  • інформаційної та-РНК;
  • рибосомальний р-РНК.

Інформація передається прямим зв'язком (ДНК-РНК-білок) та зворотним (середовище-білок-ДНК).
Організми можуть отримувати, зберігати, передавати її та використовувати при цьому найбільш ефективно.
Передаючись у спадок, інформація визначає розвиток тієї чи іншої організму. Але через взаємодію Космосу з навколишнім середовищем реакція останнього спотворюється, завдяки чому відбувається еволюція та розвитку. Таким чином, в організм закладається нова інформація.


Обчислення закономірностей молекулярної біології та відкриття генетичного коду проілюстрували те, що необхідно поєднати генетику з теорією Дарвіна, на основі чого з'явилася синтетична теорія еволюції – некласична біологія.
Спадковість, мінливість та природний відбір Дарвіна доповнюються генетично обумовленим відбором. Еволюція реалізується на генетичному рівні шляхом випадкових мутацій та успадкування найцінніших ознак, які найбільш адаптовані до навколишнього середовища.

Розшифрування коду у людини

У дев'яностих роках було розпочато проект Human Genome, внаслідок чого у двохтисячних було відкрито фрагменти геному, що містять 99,99% генів людини. Невідомими залишилися фрагменти, які беруть участь у синтезі білків і кодуються. Їхня роль поки що залишається невідомою.

Остання відкрита у 2006 році хромосома 1 є найдовшою у геномі. Понад триста п'ятдесят захворювань, у тому числі рак, з'являються в результаті порушень і мутацій в ній.

Роль таких досліджень важко переоцінити. Коли відкрили, що таке генетичний код, стало відомо, за якими закономірностями відбувається розвиток, як формується морфологічна будова, психіка, схильність до тих чи інших захворювань, обмін речовин та вади індивідів.