Funkcje kodu genetycznego DNA. Podstawowe właściwości kodu genetycznego i ich znaczenie

- jeden system zapisywanie informacji dziedzicznej w cząsteczkach kwasu nukleinowego w postaci sekwencji nukleotydów. Kod genetyczny opiera się na zastosowaniu alfabetu składającego się jedynie z czterech liter-nukleotydów, wyróżnionych zasadami azotowymi: A, T, G, C.

Główne właściwości kodu genetycznego są następujące:

1. Kod genetyczny jest trójkowy. Triplet (kodon) to sekwencja trzech nukleotydów kodujących jeden aminokwas. Ponieważ białka zawierają 20 aminokwasów, oczywiste jest, że każde z nich nie może być kodowane przez jeden nukleotyd (ponieważ w DNA występują tylko cztery rodzaje nukleotydów, w tym przypadku 16 aminokwasów pozostaje niekodowanych). Dwa nukleotydy również nie wystarczą do kodowania aminokwasów, ponieważ w tym przypadku można zakodować tylko 16 aminokwasów. Oznacza, najmniejsza liczba liczba nukleotydów kodujących jeden aminokwas jest równa trzy. (W tym przypadku liczba możliwych trójek nukleotydów wynosi 4 3 = 64).

2. Redundancja (degeneracja) kodu wynika z jego tripletowego charakteru i oznacza, że ​​jeden aminokwas może być kodowany przez kilka tripletów (ponieważ jest 20 aminokwasów i 64 triplety). Wyjątkiem są metionina i tryptofan, które są kodowane tylko przez jedną trójkę. Ponadto niektóre trojaczki pełnią określone funkcje. Zatem w cząsteczce mRNA trzy z nich UAA, UAG, UGA są kodonami stop, czyli sygnałami stop, które zatrzymują syntezę łańcucha polipeptydowego. Triplet odpowiadający metioninie (AUG), znajdujący się na początku łańcucha DNA, nie koduje aminokwasu, ale pełni funkcję inicjującego (ekscytującego) odczytu.

3. Kod, obok redundancji, charakteryzuje się właściwością jednoznaczności, co oznacza, że ​​każdy kodon odpowiada tylko jednemu konkretnemu aminokwasowi.

4. Kod jest współliniowy, tj. sekwencja nukleotydów w genie dokładnie odpowiada sekwencji aminokwasów w białku.

5. Kod genetyczny jest niepokrywający się i zwarty, to znaczy nie zawiera „znaków interpunkcyjnych”. Oznacza to, że proces odczytu nie dopuszcza możliwości nakładania się kolumn (tripletów) i rozpoczynając od określonego kodonu, odczyt przebiega w sposób ciągły, triplet za tripletem, aż do sygnałów stopu (kodonów terminacji). Na przykład w mRNA następna sekwencja zasady azotowe AUGGGUGTSUUAAUGUG będą czytane tylko przez następujące trójki: AUG, GUG, TSUU, AAU, GUG, a nie AUG, UGG, GGU, GUG itp. lub AUG, GGU, UGTs, TsUU itp. lub jakiś inny lub w sposób (na przykład kodon AUG, znak interpunkcyjny G, kodon UGC, znak interpunkcyjny U itp.).

6. Kod genetyczny jest uniwersalny, to znaczy geny jądrowe wszystkich organizmów kodują informację o białkach w ten sam sposób, niezależnie od poziomu organizacji i systematycznej pozycji tych organizmów.

Gen- strukturalne i Jednostka funkcyjna dziedziczność kontrolująca rozwój pewien znak lub właściwości. Rodzice przekazują zestaw genów swojemu potomstwu podczas reprodukcji Rosyjscy naukowcy wnieśli ogromny wkład w badanie genu: Simashkevich E.A., Gavrilova Yu.A., Bogomazova O.V. (2011)

Obecnie w biologii molekularnej ustalono, że geny to odcinki DNA niosące jakąś integralną informację - o budowie jednej cząsteczki białka lub jednej cząsteczki RNA. Te i inne cząsteczki funkcjonalne determinują rozwój, wzrost i funkcjonowanie organizmu.

Jednocześnie każdy gen charakteryzuje się szeregiem specyficznych regulatorowych sekwencji DNA, takich jak promotory, które bezpośrednio biorą udział w regulacji ekspresji genu. Sekwencje regulatorowe można znaleźć w bliskość z otwartej ramki odczytu kodującej białko, czyli początek sekwencji RNA, jak w przypadku promotorów (tzw. cis elementy cis-regulacyjne) i na odległości wielu milionów par zasad (nukleotydów), jak w przypadku wzmacniaczy, izolatorów i supresorów (czasami klasyfikowanych jako przeł-elementy regulacyjne, język angielski. elementy transregulacyjne). Zatem koncepcja genu nie ogranicza się tylko do regionu kodującego DNA, ale jest szerszą koncepcją, która obejmuje również sekwencje regulatorowe.

Pierwotnie termin gen pojawił się jako teoretyczna jednostka dyskretnej transmisji informacje dziedziczne. Historia biologii pamięta spory o to, które cząsteczki mogą być nośnikami informacji dziedzicznej. Większość badaczy uważała, że ​​takimi nośnikami mogą być jedynie białka, gdyż ich budowa (20 aminokwasów) pozwala na utworzenie większej liczby wariantów niż struktura DNA, które składa się jedynie z czterech rodzajów nukleotydów. Później udowodniono eksperymentalnie, że to DNA zawiera informację dziedziczną, co zostało wyrażone jako centralny dogmat biologii molekularnej.

Geny mogą ulegać mutacjom – przypadkowym lub celowym zmianom w sekwencji nukleotydów w łańcuchu DNA. Mutacje mogą prowadzić do zmiany sekwencji, a co za tym idzie, zmiany cechy biologiczne białka lub RNA, co z kolei może skutkować ogólnym lub miejscowym zmienionym lub nieprawidłowym funkcjonowaniem organizmu. Takie mutacje w niektórych przypadkach są chorobotwórcze, ponieważ powodują chorobę lub śmiertelne na poziomie embrionalnym. Jednak nie wszystkie zmiany w sekwencji nukleotydów prowadzą do zmian w strukturze białka (w wyniku efektu degeneracji kodu genetycznego) lub do istotnej zmiany sekwencji i nie są chorobotwórcze. W szczególności ludzki genom charakteryzuje się polimorfizmami pojedynczych nukleotydów i zmianami liczby kopii. warianty liczby kopii), takie jak delecje i duplikacje, które stanowią około 1% całej ludzkiej sekwencji nukleotydowej. W szczególności polimorfizmy pojedynczych nukleotydów definiują różne allele pojedynczego genu.

Monomery tworzące każdą nić DNA są złożone związki organiczne, w tym zasady azotowe: adenina (A) lub tymina (T) lub cytozyna (C) lub guanina (G), pentaatomowy cukier-pentoza-deoksyryboza, od którego nazwano sam DNA, a także reszta kwasu fosforowego zwane nukleotydami.

Właściwości genów

  1. dyskretność - niemieszalność genów;
  2. stabilność - zdolność do utrzymania struktury;
  3. labilność - zdolność do wielokrotnego mutowania;
  4. Allelizm wielokrotny – w populacji występuje mnóstwo genów formy molekularne;
  5. alleliczność - w genotypie organizmów diploidalnych występują tylko dwie formy genu;
  6. specyficzność – każdy gen koduje swoją własną cechę;
  7. plejotropia – wielokrotne działanie genu;
  8. ekspresywność - stopień ekspresji genu w cesze;
  9. penetracja - częstotliwość manifestacji genu w fenotypie;
  10. amplifikacja - zwiększenie liczby kopii genu.

Klasyfikacja

  1. Geny strukturalne to unikalne składniki genomu, które reprezentują pojedynczą sekwencję kodującą specyficzne białko lub niektóre typy RNA. (Zobacz także artykuł geny gospodarstwo domowe).
  2. Geny funkcjonalne – regulują funkcjonowanie genów strukturalnych.

Kod genetyczny- charakterystyczna dla wszystkich organizmów żywych metoda kodowania sekwencji aminokwasów białek za pomocą sekwencji nukleotydów.

DNA wykorzystuje cztery nukleotydy - adeninę (A), guaninę (G), cytozynę (C), tyminę (T), które w literaturze rosyjskiej są oznaczone literami A, G, C i T. Litery te tworzą alfabet kod genetyczny. RNA wykorzystuje te same nukleotydy, z wyjątkiem tyminy, która jest zastąpiona podobnym nukleotydem - uracylem, który jest oznaczony literą U (U w literaturze rosyjskiej). W cząsteczkach DNA i RNA nukleotydy układają się w łańcuchy i w ten sposób uzyskuje się sekwencje liter genetycznych.

Kod genetyczny

Do budowy białek w przyrodzie wykorzystuje się 20 różnych aminokwasów. Każde białko to łańcuch lub kilka łańcuchów aminokwasów w ściśle określonej kolejności. Sekwencja ta determinuje strukturę białka, a co za tym idzie, całego jego białka właściwości biologiczne. Zestaw aminokwasów jest także uniwersalny dla niemal wszystkich organizmów żywych.

Wdrożenie informacji genetycznej w żywych komórkach (czyli synteza białka kodowanego przez gen) odbywa się za pomocą dwóch procesów macierzowych: transkrypcji (czyli syntezy mRNA na matrycy DNA) i translacji kodu genetycznego w sekwencję aminokwasową (synteza łańcucha polipeptydowego na mRNA). Trzy kolejne nukleotydy wystarczą do zakodowania 20 aminokwasów, a także sygnału stopu wskazującego koniec sekwencji białka. Zestaw trzech nukleotydów nazywany jest tripletem. Akceptowane skróty odpowiadające aminokwasom i kodonom pokazano na rysunku.

Nieruchomości

  1. Potrójny- znacząca jednostka kodu to kombinacja trzech nukleotydów (triplet lub kodon).
  2. Ciągłość- pomiędzy trójkami nie ma znaków interpunkcyjnych, co oznacza, że ​​informacja jest odczytywana w sposób ciągły.
  3. Nie nakładające się- ten sam nukleotyd nie może jednocześnie być częścią dwóch lub więcej trypletów (nie obserwuje się tego w przypadku niektórych nakładających się genów wirusów, mitochondriów i bakterii, które kodują kilka białek przesunięcia ramki odczytu).
  4. Jednoznaczność (specyficzność)- konkretny kodon odpowiada tylko jednemu aminokwasowi (jednak kodon UGA ma Euplotes crassus koduje dwa aminokwasy – cysteinę i selenocysteinę)
  5. Degeneracja (redundancja)- kilka kodonów może odpowiadać temu samemu aminokwasowi.
  6. Wszechstronność - kod genetyczny działa tak samo w organizmach różne poziomy złożoność - od wirusów po ludzi (na tym opierają się metody Inżynieria genetyczna; istnieje szereg wyjątków, przedstawionych w tabeli w sekcji „Odmiany w standardowym kodzie genetycznym” poniżej).
  7. Odporność na hałas- mutacje podstawień nukleotydowych, które nie prowadzą do zmiany klasy kodowanego aminokwasu, nazywane są konserwatywny; nazywa się mutacje podstawienia nukleotydów, które prowadzą do zmiany klasy kodowanego aminokwasu rodnik.

Biosynteza białek i jej etapy

Biosynteza białek- złożony, wieloetapowy proces syntezy łańcucha polipeptydowego z reszt aminokwasowych, zachodzący na rybosomach komórek organizmów żywych z udziałem cząsteczek mRNA i tRNA.

Biosyntezę białek można podzielić na etapy transkrypcji, przetwarzania i translacji. Podczas transkrypcji odczytywana jest informacja genetyczna zakodowana w cząsteczkach DNA i ta informacja jest zapisywana w cząsteczkach mRNA. Podczas serii kolejnych etapów obróbki z mRNA usuwane są fragmenty niepotrzebne w kolejnych etapach i poddawana jest edycji sekwencja nukleotydów. Po przetransportowaniu kodu z jądra do rybosomów następuje właściwa synteza cząsteczek białka poprzez przyłączenie poszczególnych reszt aminokwasowych do rosnącego łańcucha polipeptydowego.

Pomiędzy transkrypcją a translacją cząsteczka mRNA przechodzi szereg kolejnych zmian, które zapewniają dojrzewanie funkcjonującej matrycy do syntezy łańcucha polipeptydowego. Do końca 5΄ przymocowana jest czapeczka, a do końca 3΄ ogon poli-A, co zwiększa żywotność mRNA. Wraz z pojawieniem się przetwarzania w komórce eukariotycznej stało się możliwe łączenie eksonów genów w celu uzyskania większej różnorodności białek kodowanych przez pojedynczą sekwencję nukleotydów DNA - alternatywne składanie.

Translacja polega na syntezie łańcucha polipeptydowego zgodnie z informacją zakodowaną w informacyjnym RNA. Sekwencja aminokwasów jest uporządkowana za pomocą transport RNA (tRNA), który tworzy kompleksy z aminokwasami - aminoacylo-tRNA. Każdy aminokwas ma swój własny tRNA, który ma odpowiadający mu antykodon, który „pasuje” do kodonu mRNA. Podczas translacji rybosom przemieszcza się wzdłuż mRNA, w wyniku czego łańcuch polipeptydowy rośnie. Energię do biosyntezy białek dostarcza ATP.

Gotowa cząsteczka białka jest następnie odcinana od rybosomu i transportowana do niego Właściwe miejsce komórki. Aby osiągnąć swoje stan aktywny niektóre białka wymagają dodatkowej modyfikacji potranslacyjnej.

Prowadzący Magazyn naukowy Natura donieśli o odkryciu drugiego kodu genetycznego – swego rodzaju „kodu w kodzie”, który został niedawno złamany przez biologów molekularnych i programistów komputerowych. Co więcej, aby to zidentyfikować, nie posłużyli się teorią ewolucji, ale technologią informacyjną.

Nowy kod nosi nazwę Kodu Splicingu. Znajduje się wewnątrz DNA. Kod ten kontroluje podstawowy kod genetyczny w bardzo złożony, ale przewidywalny sposób. Kod splicingowy kontroluje sposób i czas składania genów i elementów regulatorowych. Rozwikłanie tego kodu w kodzie pomaga rzucić światło na niektóre z długotrwałych tajemnic genetyki, które wyszły na jaw od czasu projektu sekwencjonowania ludzkiego genomu. Jedną z tych tajemnic było to, dlaczego w tak złożonym organizmie jak człowiek znajduje się tylko 20 000 genów? (Naukowcy spodziewali się odkryć znacznie więcej). Dlaczego geny są dzielone na segmenty (eksony), które są oddzielane elementami niekodującymi (introny), a następnie łączone (tj. splicowane) po transkrypcji? I dlaczego geny włączają się w niektórych komórkach i tkankach, a w innych nie? Przez dwie dekady biolodzy molekularni próbował odkryć mechanizmy regulacji genetycznej. Artykuł ten bardzo na to wskazuje ważny punkt w zrozumieniu tego, co się naprawdę dzieje. Nie odpowiada na wszystkie pytania, ale pokazuje, że kod wewnętrzny istnieje. Kod ten to system przesyłania informacji, który można rozszyfrować tak wyraźnie, że naukowcy są w stanie przewidzieć, jak to zrobić pewne sytuacje a genom może zachowywać się z niewytłumaczalną precyzją.

Wyobraź sobie, że w pokoju obok słyszysz orkiestrę. Otwierasz drzwi, zaglądasz do środka i widzisz grających w pokoju trzech lub czterech muzyków instrumenty muzyczne. Tak to według Brandona Freya, który brał udział w łamaniu szyfru, wygląda. ludzki genom. On mówi: „Mogliśmy wykryć tylko 20 000 genów, ale wiedzieliśmy, że składają się one na ogromną liczbę produktów białkowych i elementów regulacyjnych. Jak? Jedna z metod nazywa się alternatywnym splicingiem.. Można składać różne eksony (części genów). różne sposoby. „Na przykład trzy geny białka neuroreksyny mogą wytworzyć ponad 3000 komunikatów genetycznych, które pomagają kontrolować okablowanie mózgu”., mówi Frey. W artykule napisano także, że naukowcy wiedzą, że 95% naszych genów podlega splicingowi alternatywnemu i w większości przypadków transkrypty (cząsteczki RNA powstałe w wyniku transkrypcji) ulegają odmiennej ekspresji w różnych typach komórek i tkanek. Musi istnieć coś, co kontroluje sposób tworzenia i wyrażania tych tysięcy kombinacji. To jest zadanie Kodu Splicingu.

Czytelnicy chcący szybko zapoznać się z odkryciem mogą przeczytać artykuł pod adresem Nauka codziennie zatytułowany „Naukowcy, którzy złamali „kod splicingu”, odkrywają tajemnicę złożoności biologicznej”. Artykuł mówi: „Naukowcy z Uniwersytetu w Toronto zdobyli zupełnie nowy wgląd w to, w jaki sposób żywe komórki korzystają z ograniczonej liczby genów, tworząc niezwykle złożone narządy, takie jak mózg”.. Sama natura zaczyna się od artykułu Heidi Ledford „Kod w kodzie”. Następnie Tejedor i Valcárcel opublikowali artykuł zatytułowany „Regulacja genów: łamanie drugiego kodu genetycznego”. Ostatecznie rozstrzygnięciem okazał się artykuł autorstwa zespołu badaczy z Uniwersytetu w Toronto pod kierownictwem Benjamina D. Blencowe’a i Brandona D. Freya „Cracking the Splicing Code”.

Ten artykuł jest zwycięstwem informatyki, które przypomina nam o łamaczach szyfrów z II wojny światowej. Ich metody obejmowały algebrę, geometrię, teorię prawdopodobieństwa, rachunek wektorowy, teorię informacji, optymalizację kodu programu i inne. najlepsze praktyki. To, czego nie potrzebowali, to było teoria ewolucji , o którym nigdy nie wspomniano Artykuły naukowe. Czytając ten artykuł, widać, w jakim stresie znajdują się autorzy tej uwertury:

„Opisujemy schemat „kodu splicingu”, który wykorzystuje kombinacje setek właściwości RNA do przewidywania specyficznych tkankowo zmian w alternatywnym składaniu tysięcy eksonów. Kod ustanawia nowe klasy wzorców splicingu, rozpoznaje różne programy regulacyjne w różnych tkankach i ustanawia sekwencje regulacyjne kontrolowane przez mutacje. Odkryliśmy szeroko rozpowszechnione strategie regulacyjne, w tym: wykorzystanie nieoczekiwanie dużych pul nieruchomości; identyfikacja niskie poziomy wtręty eksonów osłabiane właściwościami określonych tkanek; manifestacja właściwości intronów jest głębsza niż wcześniej sądzono; i modulacja poziomów wariantów splotu cechy strukturalne transkrypcja. Kod pomógł zidentyfikować klasę eksonów, których włączenie wycisza ekspresję w tkankach dorosłych poprzez aktywację degradacji mRNA i których wykluczenie sprzyja ekspresji podczas embriogenezy. Kod ułatwia odkrywanie i szczegółową charakterystykę regulowanych zdarzeń alternatywnego splicingu w skali obejmującej cały genom”.

W zespole, który złamał kod, znaleźli się specjaliści z Katedry Inżynierii Elektronicznej i Komputerowej oraz z Katedry Genetyki Molekularnej. (Sam Frey pracuje dla oddziału Microsoft Corporation, Microsoft Research) Podobnie jak łamacze kodów z przeszłości, Frey i Barash opracowali „nowa metoda wspomaganej komputerowo analizy biologicznej, która wykrywa” słowa kodowe„ukryty wewnątrz genomu”. Przy pomocy ogromnej ilości tworzonych danych genetycy molekularni, zespół badaczy dokonał „inżynierii wstecznej” kodu splicingu dopóki nie byli w stanie przewidzieć, jak się zachowa. Kiedy badacze już to ustalili, przetestowali kod pod kątem mutacji i zobaczyli, w jaki sposób eksony były wstawiane lub usuwane. Odkryli, że kod może nawet powodować zmiany specyficzne dla tkanki lub działać inaczej w zależności od tego, czy mysz była osobą dorosłą, czy embrionem. Jeden gen, Xpo4, jest powiązany z rakiem; Naukowcy zauważyli: „Dane te potwierdzają wniosek, że ekspresja genu Xpo4 musi być ściśle kontrolowana, aby uniknąć możliwych szkodliwych konsekwencji, w tym powstawania nowotworów (raka), ponieważ jest on aktywny podczas embriogenezy, ale jego ilość jest zmniejszona w tkankach dorosłych. Okazuje się, że byli absolutnie zaskoczeni poziomem kontroli, jaki zaobserwowali. Celowo czy nie, Frey jako wskazówki użył języka inteligentnego projektu, a nie przypadkowych zmian i selekcji. Zauważył: „Zrozumienie kompleksu układ biologiczny jak zrozumienie złożonego obwodu elektronicznego.”

Tak powiedziała Heidi Ledford pozorna prostota kod genetyczny Watsona-Cricka z jego czterema zasadami, kodonami tripletowymi, 20 aminokwasami i 64 „znakami” DNA – kryje pod sobą cały świat złożoności. Zamknięty w tym prostszym kodzie kod splicingu jest znacznie bardziej złożony.

Ale pomiędzy DNA i białkami jest RNA - oddzielny świat trudności. RNA jest transformatorem, który czasami przenosi wiadomości genetyczne, a czasami je kontroluje, obejmując wiele struktur, które mogą wpływać na jego funkcję. W artykule opublikowanym w tym samym numerze zespół badaczy pod kierownictwem Benjamina D. Blencowe'a i Brandona D. Freya z Uniwersytetu w Toronto w Ontario w Kanadzie donosi o wysiłkach mających na celu rozszyfrowanie drugiego kodu genetycznego, który może przewidzieć, w jaki sposób segmenty informacyjnego RNA transkrybowane z określonego genu, mogą być mieszane i dopasowywane, tworząc różnorodne produkty w różnych tkankach. Proces ten nazywany jest alternatywnym splicingiem. Tym razem nie ma prostej tabeli – zamiast tego istnieją algorytmy, które łączą ponad 200 różnych właściwości DNA z określeniami struktury RNA.

Prace tych badaczy wskazują na szybki postęp, jaki poczyniły metody obliczeniowe w składaniu modelu RNA. Oprócz zrozumienia alternatywnego splicingu informatyka pomaga naukowcom przewidywać struktury RNA i identyfikować małe regulacyjne fragmenty RNA, które nie kodują białek. „To wspaniały czas”– mówi Christopher Berg, biolog obliczeniowy z Massachusetts Institute of Technology w Cambridge. „W przyszłości odniesiemy wielki sukces”.

Informatyka, biologia obliczeniowa, algorytmy i kody – te pojęcia nie były częścią słownika Darwina, kiedy tworzył swoją teorię. Mendel miał bardzo uproszczony model rozkładu cech podczas dziedziczenia. Ponadto pomysł, że funkcje są kodowane, został wprowadzony dopiero w 1953 roku. Widzimy, że pierwotny kod genetyczny jest regulowany przez zawarty w nim jeszcze bardziej złożony kod. To rewolucyjne pomysły. Co więcej, wszystko na to wskazuje ten poziom kontroli nie jest ostatni. Ledford przypomina nam, że na przykład RNA i białka mają strukturę trójwymiarową. Funkcje cząsteczek mogą się zmieniać, gdy zmienia się ich kształt. Musi istnieć coś, co kontroluje zwijanie, aby trójwymiarowa struktura spełniała wymagania funkcji. Ponadto wydaje się, że dostęp do genów jest kontrolowany inny kod, kod histonowy. Kod ten jest kodowany przez markery molekularne lub „ogony” białek histonowych, które służą jako centra skręcania i superskręcania DNA. Opisując nasze czasy, mówi Ledford „ciągły renesans informatyki RNA”.

Tejedor i Valcárcel zgadzają się, że za prostotą kryje się złożoność. „Koncepcja jest bardzo prosta: DNA tworzy RNA, które następnie tworzy białko”., - rozpoczynają swój artykuł. „Ale w rzeczywistości wszystko jest znacznie bardziej skomplikowane”. W latach pięćdziesiątych dowiedzieliśmy się, że wszystkie żywe organizmy, od bakterii po ludzi, mają podstawowy kod genetyczny. Ale szybko zdaliśmy sobie sprawę, że złożone organizmy (eukarioty) mają pewną nienaturalną i trudną do zrozumienia właściwość: ich genomy mają osobliwe sekcje, introny, które należy usunąć, aby eksony mogły się połączyć. Dlaczego? Dzisiaj mgła się rozwiewa: „Główną zaletą tego mechanizmu jest to, że pozwala różne komórki wybierać alternatywne sposoby splicing prekursorowego informacyjnego RNA (pre-mRNA), w wyniku czego jeden gen tworzy różne komunikaty”- wyjaśniają, - „a następnie różne mRNA mogą kodować różne białka różne funkcje» . Więcej informacji można uzyskać z mniejszej ilości kodu, pod warunkiem, że w kodzie znajduje się inny kod, który wie, jak to zrobić.

Tym, co sprawia, że ​​złamanie kodu splicingu jest tak trudne, jest to, że czynniki kontrolujące składanie eksonów są ustalane przez wiele innych czynników: sekwencje zlokalizowane w pobliżu granic eksonów, sekwencje intronów i czynniki regulacyjne, które albo pomagają, albo hamują maszynerię splicingu. Oprócz, „efekty określonej sekwencji lub czynnika mogą się różnić w zależności od jego położenia względem granic intron-ekson lub innych motywów regulacyjnych”, wyjaśniają Tejedor i Valcarcel. „Dlatego większość wymagające zadanie przewidywanie splicingu specyficznego dla tkanki wymaga obliczenia algebry niezliczonych motywów i relacji między czynnikami regulacyjnymi, które je rozpoznają”..

Aby rozwiązać ten problem, zespół naukowców wprowadził do komputera ogromną ilość danych na temat sekwencji RNA i warunków, w jakich powstały. „Następnie zadaniem komputera było zidentyfikowanie kombinacji właściwości, które najlepiej wyjaśniałyby ustalony eksperymentalnie, specyficzny dla tkanki dobór eksonów”.. Innymi słowy, badacze dokonali inżynierii wstecznej kodu. Podobnie jak łamacze szyfrów podczas II wojny światowej, naukowcy, znając algorytm, mogą dokonywać przewidywań: „Prawidłowo i dokładnie zidentyfikował alternatywne eksony i przewidział ich zróżnicowaną regulację między parami typów tkanek”. I tak jak każde dobro teoria naukowa odkrycie dostarczyło nowych informacji: „Pozwoliło nam to uzyskać nowy wgląd we wcześniej zidentyfikowane motywy regulacyjne i wskazało na nieznane wcześniej właściwości znanych regulatorów, a także nieoczekiwane powiązania funkcjonalne między nimi”.– zauważyli naukowcy. „Na przykład kod sugeruje, że włączenie eksonów prowadzących do przetworzonych białek jest wspólny mechanizm kontrolowanie procesu ekspresji genów podczas przejścia z tkanki embrionalnej do tkanki dorosłej”.

Tejedor i Valcárcel rozważają publikację swojego artykułu najpierw ważne krok: „Pracę tę... lepiej postrzegać jako odkrycie pierwszego fragmentu znacznie większego Kamienia z Rosetty potrzebnego do rozszyfrowania alternatywnych komunikatów naszego genomu”. Według tych naukowców przyszłe badania niewątpliwie poszerzą ich wiedzę na temat tego nowego kodu. Na zakończenie swojego artykułu krótko wspominają ewolucję i robią to w bardzo nietypowy sposób. Mówią: „To nie znaczy, że ewolucja stworzyła te kody. Oznacza to, że postęp będzie wymagał zrozumienia interakcji kodów. Kolejną niespodzianką było to, że zaobserwowany dotychczas stopień ochrony rodzi pytanie o możliwe istnienie „kodów specyficznych dla gatunku”..

Kod prawdopodobnie działa w każdej pojedynczej komórce i dlatego musi odpowiadać za ponad 200 typów komórek ssaków. Musi także radzić sobie z ogromną różnorodnością alternatywnych wzorów splicingu, nie wspominając o tym proste rozwiązania o włączeniu lub pominięciu oddzielnego eksonu. Ograniczona ewolucyjna ochrona alternatywnej regulacji splicingu (szacowana na około 20% między ludźmi i myszami) rodzi pytanie o istnienie kodów specyficznych dla gatunku. Co więcej, sprzężenie między przetwarzaniem DNA a transkrypcją genów wpływa na alternatywny splicing, a najnowsze dowody wskazują na pakowanie DNA przez białka histonowe i kowalencyjne modyfikacje histonów (tzw. kod epigenetyczny) w regulacji splicingu. Dlatego przyszłe metody będą musiały ustalić precyzyjną interakcję między kodem histonowym a kodem splicingowym. To samo tyczy się wciąż mało poznanego wpływu złożone struktury RNA do alternatywnego splicingu.

Kody, kody i jeszcze raz kody. Fakt, że naukowcy praktycznie nic nie mówią w tych artykułach o darwinizmie, wskazuje, że teoretycy ewolucji wyznający stare idee i tradycje będą mieli o czym myśleć po przeczytaniu tych artykułów. Ale ci, którzy są entuzjastycznie nastawieni do biologii kodów, znajdą się na czele. Mają świetną okazję, aby skorzystać z ekscytującej aplikacji internetowej, którą stworzyli łamacze kodów, aby zachęcić dalsze badania. Można go znaleźć na stronie internetowej Uniwersytetu w Toronto o nazwie Alternative Splicing Prediction Website. Odwiedzający na próżno będą szukać tutaj jakiejkolwiek wzmianki o ewolucji, pomimo starego aksjomatu, że bez niej nic w biologii nie ma sensu. Nowa wersja To wyrażenie z 2010 roku może brzmieć tak: „Nic w biologii nie ma sensu, jeśli nie spojrzy się na nie w świetle informatyki”. .

Linki i notatki

Cieszymy się, że mogliśmy opowiedzieć Wam o tej historii w dniu jej publikacji. Być może jest to jeden z najważniejszych Artykuły naukowe roku. (Oczywiście, każdy wielkie odkrycie, dokonane przez inne grupy naukowców, jak odkrycie Watsona i Cricka.) Jedyne, co możemy na to powiedzieć, to: „Wow!” To odkrycie jest niezwykłym potwierdzeniem stworzenia według planu i ogromnym wyzwaniem dla imperium darwinowskiego. Zastanawiam się, jak ewolucjoniści spróbują skorygować swoją uproszczoną historię o przypadkowych mutacjach i… naturalna selekcja, który został wynaleziony w XIX wieku, w świetle tych nowych danych.

Czy rozumiesz, o czym mówią Tejedor i Valcarcel? Gatunki mogą mieć swój własny kod, unikalny tylko dla tych gatunków. „Dlatego od przyszłych metod będzie zależało ustalenie dokładnej interakcji między kodem histonowym [epigenetycznym] a kodem splicingowym” – zauważają. W tłumaczeniu oznacza to: „Darwiniści nie mają z tym nic wspólnego. Po prostu nie mogą sobie z tym poradzić.” Gdyby prosty kod genetyczny Watsona-Cricka stanowił problem dla darwinistów, co powiedzieliby teraz o kodzie splicingowym, który tworzy tysiące transkryptów z tych samych genów? Jak radzą sobie z kodem epigenetycznym kontrolującym ekspresję genów? A kto wie, może w tej niesamowitej „interakcji”, o której dopiero zaczynamy poznawać, wchodzą w grę inne kody, przypominające Kamień z Rosetty, który dopiero zaczyna wyłaniać się z piasku?

Teraz, gdy myślimy o kodach i informatyce, zaczynamy myśleć o różnych paradygmatach nowych badań. A co, jeśli genom działa częściowo jako sieć pamięci? A jeśli dotyczy to algorytmów kryptograficznych lub kompresyjnych? Pamiętajmy o nowoczesnych systemach informatycznych i technologiach przechowywania informacji. Być może odkryjemy nawet elementy steganografii. Bez wątpienia istnieją dodatkowe mechanizmy oporności, takie jak duplikacje i poprawki, które mogą pomóc wyjaśnić istnienie pseudogenów. Kopie całego genomu mogą być reakcją na stres. Niektóre z tych zjawisk mogą być użytecznymi wskaźnikami wydarzenia historyczne, które nie mają nic wspólnego z uniwersalnym wspólnym przodkiem, ale pomagają w badaniu genomiki porównawczej w ramach informatyki i projektowania odporności oraz pomagają zrozumieć przyczynę chorób.

Ewolucjoniści znajdują się w poważnych trudnościach. Naukowcy próbowali zmodyfikować kod, ale jedyne, co im się udało, to rak i mutacje. Jak mają zamiar poruszać się po dziedzinie fitnessu, skoro jest ona pełna katastrof, które mogą nastąpić, gdy tylko ktoś zacznie ingerować w te nierozerwalnie powiązane kody? Wiemy, że istnieje pewna wbudowana odporność i przenośność, ale cały obraz jest niezwykle złożony, zaprojektowany i zoptymalizowany System informacyjny, a nie przypadkowe połączenie części, którymi można bawić się w nieskończoność. Cała idea kodu jest koncepcją inteligentnego projektu.

Dał to A.E. Wilder-Smith specjalne znaczenie. Kod zakłada zgodność obu części. Umowa to umowa z góry. Obejmuje planowanie i cel. Symbolu SOS używamy, jak powiedziałby Wilder-Smith, zgodnie z konwencją jako sygnału wzywania pomocy. SOS nie wygląda na katastrofę. To nie pachnie katastrofą. Nie ma to wrażenia katastrofy. Ludzie nie zrozumieliby, że te listy oznaczają katastrofę, gdyby nie zrozumieli istoty samego porozumienia. W podobny sposób, kodon alaniny, HCC, nie wygląda, nie pachnie ani nie przypomina alaniny. Kodon nie miałby nic wspólnego z alaniną, gdyby nie istniała z góry zgoda pomiędzy dwoma systemami kodowania (kodem białkowym i kodem DNA), że „GCC musi oznaczać alaninę”. Aby wyrazić tę zgodność, stosuje się rodzinę przetworników, syntetaz aminoacylo-tRNA, które tłumaczą jeden kod na inny.

Miało to na celu wzmocnienie teorii projektu w latach pięćdziesiątych XX wieku i wielu kreacjonistów skutecznie ją głosiło. Ale ewolucjoniści są jak gładko mówiący sprzedawca. Stworzyli swoje bajki o Dzwoneczku, który łamie szyfry i poprzez mutację i selekcję tworzy nowe gatunki, i przekonali wiele osób, że cuda wciąż mogą się dziać. No cóż, dzisiaj mamy XXI wiek i znamy kod epigenetyczny i kod splicingowy – dwa kody, które są znacznie bardziej złożone i dynamiczne niż prosty kod DNA. Wiemy o kodach w kodach, o kodach nad kodami i pod kodami - znamy całą hierarchię kodów. Tym razem ewolucjoniści nie mogą po prostu wsadzić palca w pistolet i wrobić nas w swoje piękne przemówienia, gdy działa są umieszczone po obu stronach - cały arsenał wycelowany w ich główne elementy konstrukcyjne. To wszystko jest grą. Narosła wokół nich cała era informatyki, już dawno wyszły z mody i wyglądają jak Grecy, którzy próbują wspiąć się po świecie z włóczniami. nowoczesne czołgi i helikoptery.

Przykro to mówić, ale ewolucjoniści tego nie rozumieją, a nawet jeśli tak, to nie zamierzają się poddać. Nawiasem mówiąc, w tym tygodniu, właśnie wtedy, gdy ukazał się artykuł o Kodeksie Splicingu, najbardziej wściekli i nienawistni Ostatnio retoryka przeciwko kreacjonizmowi i inteligentnemu projektowi. Mamy jeszcze wiele do usłyszenia podobne przykłady. I dopóki będą trzymać mikrofony i kontrolować instytucje, wiele osób da się nabrać na ich przynętę, myśląc, że nauka nadal daje im dobry powód. Mówimy ci to wszystko, abyś przeczytał ten materiał, przestudiował go, zrozumiał i wyposażył się w informacje, których potrzebujesz, aby pokonać prawdę prawdą ten bigoteryjny, wprowadzający w błąd nonsens. Teraz, śmiało!

Kod genetyczny wyrażony w kodonach to system kodowania informacji o strukturze białek, właściwy wszystkim żywym organizmom na planecie. Odszyfrowanie go zajęło dekadę, ale nauka zrozumiała, że ​​istniał on przez prawie sto lat. Ważna jest uniwersalność, swoistość, jednokierunkowość, a zwłaszcza degeneracja kodu genetycznego znaczenie biologiczne.

Historia odkryć

Problem kodowania zawsze był kluczowy w biologii. Nauka dość powoli zmierza w stronę matrycowej struktury kodu genetycznego. Od odkrycia podwójnej helisy DNA przez J. Watsona i F. Cricka w 1953 roku rozpoczął się etap rozwikłania samej struktury kodu, co dało wiarę w wielkość natury. Liniowa struktura białek i taka sama struktura DNA implikowała obecność kodu genetycznego jako zgodności między dwoma tekstami, ale zapisanego przy użyciu różne alfabety. A jeśli znany był alfabet białek, wówczas znaki DNA stały się przedmiotem badań biologów, fizyków i matematyków.

Nie ma sensu opisywać wszystkich kroków rozwiązania tej zagadki. Bezpośrednie doświadczenie, które udowodniło i potwierdziło istnienie wyraźnej i spójnej zgodności pomiędzy kodonami DNA a aminokwasami białkowymi, przeprowadzili w 1964 roku C. Janowski i S. Brenner. A potem – okres rozszyfrowania kodu genetycznego in vitro (w probówce) z wykorzystaniem technik syntezy białek w strukturach bezkomórkowych.

W pełni odszyfrowany kod E. Coli został upubliczniony w 1966 roku na sympozjum biologów w Cold Spring Harbor (USA). Następnie odkryto redundancję (degenerację) kodu genetycznego. Co to oznacza, wyjaśniono po prostu.

Dekodowanie trwa

Uzyskanie danych dotyczących rozszyfrowania kodu dziedzicznego było jednym z najważniejszych wydarzeń ubiegłego stulecia. Dziś nauka kontynuuje dogłębne badanie mechanizmów kodowania molekularnego i jego cech systemowych oraz nadmiaru znaków, które wyrażają właściwość degeneracyjną kodu genetycznego. Odrębna branża studiowanie - powstanie i ewolucja systemu kodowania materiału dziedzicznego. Dowody na związek pomiędzy polinukleotydami (DNA) i polipeptydami (białkami) dały impuls do rozwoju biologii molekularnej. A to z kolei do biotechnologii, bioinżynierii, odkryć w hodowli i uprawie roślin.

Dogmaty i zasady

Głównym dogmatem biologii molekularnej jest to, że informacja jest przekazywana z DNA do informacyjnego RNA, a następnie z niego do białka. W odwrotnym kierunku możliwy jest transfer z RNA do DNA i z RNA do innego RNA.

Ale matrycą lub podstawą zawsze pozostaje DNA. Wszystkie inne podstawowe cechy transmisji informacji są odzwierciedleniem matrycowej natury transmisji. Mianowicie transmisja poprzez syntezę innych cząsteczek na matrycy, która stanie się strukturą do odtwarzania informacji dziedzicznej.

Kod genetyczny

Liniowe kodowanie struktury cząsteczek białka odbywa się za pomocą komplementarnych kodonów (tripletów) nukleotydów, których jest tylko 4 (aden, guanina, cytozyna, tymina (uracyl)), co samoistnie prowadzi do powstania kolejnego łańcucha nukleotydów . Ten sam numer a chemiczna komplementarność nukleotydów jest głównym warunkiem takiej syntezy. Kiedy jednak tworzy się cząsteczka białka, nie ma zgodności jakościowej pomiędzy ilością i jakością monomerów (nukleotydy DNA są aminokwasami białkowymi). To jest naturalne kod dziedziczny- system zapisu w sekwencji nukleotydów (kodonów) sekwencji aminokwasów w białku.

Kod genetyczny ma kilka właściwości:

  • Potrójność.
  • Jednoznaczność.
  • Kierunkowość.
  • Nie nakładające się.
  • Redundancja (degeneracja) kodu genetycznego.
  • Wszechstronność.

Dajmy krótki opis, koncentrując się na znaczeniu biologicznym.

Potrójność, ciągłość i obecność sygnałów stopu

Każdy z 61 aminokwasów odpowiada jednej trójce sensownej (triplecie) nukleotydów. Trzy trojaczki nie niosą informacji o aminokwasach i są kodonami stop. Każdy nukleotyd w łańcuchu jest częścią tripletu i nie istnieje samodzielnie. Na końcu i na początku łańcucha nukleotydów odpowiedzialnych za jedno białko znajdują się kodony stop. Rozpoczynają lub zatrzymują translację (syntezę cząsteczki białka).

Specyficzność, brak nakładania się i jednokierunkowość

Każdy kodon (triplet) koduje tylko jeden aminokwas. Każda trójka jest niezależna od sąsiada i nie nakłada się na siebie. Jeden nukleotyd może być zawarty tylko w jednej trójce w łańcuchu. Synteza białek zawsze zachodzi tylko w jednym kierunku, który jest regulowany przez kodony stop.

Redundancja kodu genetycznego

Każdy triplet nukleotydów koduje jeden aminokwas. W sumie jest 64 nukleotydów, z czego 61 koduje aminokwasy (kodony sensowne), a trzy są nonsensowne, to znaczy nie kodują aminokwasu (kodony stop). Redundancja (degeneracja) kodu genetycznego polega na tym, że w każdej trójce można dokonać podstawień - radykalnych (prowadzących do zamiany aminokwasu) i konserwatywnych (nie zmieniających klasy aminokwasu). Łatwo obliczyć, że jeśli w trójce (pozycje 1, 2 i 3) można dokonać 9 podstawień, to każdy nukleotyd można zastąpić 4 - 1 = 3 innymi opcjami, to całkowita liczba możliwe opcje Będzie 61 9 podstawień nukleotydów = 549.

Degeneracja kodu genetycznego objawia się tym, że 549 wariantów to znacznie więcej, niż potrzeba do zakodowania informacji o 21 aminokwasach. Ponadto spośród 549 wariantów 23 podstawienia doprowadzą do powstania kodonów stop, 134 + 230 podstawień jest konserwatywnych, a 162 podstawienia są radykalne.

Reguła degeneracji i wykluczenia

Jeżeli dwa kodony mają dwa identyczne pierwsze nukleotydy, a pozostałe są reprezentowane przez nukleotydy tej samej klasy (puryny lub pirymidyny), to niosą informację o tym samym aminokwasie. Jest to zasada degeneracji lub redundancji kodu genetycznego. Dwa wyjątki to AUA i UGA – pierwszy koduje metioninę, chociaż powinna to być izoleucyna, a drugi to kodon stop, chociaż powinien kodować tryptofan.

Znaczenie degeneracji i uniwersalności

To właśnie te dwie właściwości kodu genetycznego mają największe znaczenie biologiczne. Wszystkie wymienione powyżej właściwości są charakterystyczne dla dziedzicznej informacji wszystkich form żywych organizmów na naszej planecie.

Degeneracja kodu genetycznego ma znaczenie adaptacyjne, jak wielokrotne powielanie kodu dla jednego aminokwasu. Dodatkowo oznacza to spadek znaczenia (degenerację) trzeciego nukleotydu w kodonie. Opcja ta minimalizuje uszkodzenia mutacyjne w DNA, które doprowadzą do rażących zaburzeń w strukturze białka. Jest to mechanizm ochronny żywych organizmów na planecie.

Cykl artykułów opisujących genezę Kodeksu cywilnego można potraktować jako śledztwo w sprawie wydarzeń, po których zachowało się wiele śladów. Jednak zrozumienie tych artykułów wymaga pewnego wysiłku, aby zrozumieć molekularne mechanizmy syntezy białek. Artykuł ten jest wstępem do cyklu autopublikacji poświęconych pochodzeniu kodu genetycznego i jest najlepszym miejscem do rozpoczęcia zapoznania się z tym tematem.
Zazwyczaj kod genetyczny(GK) definiuje się jako metodę (regułę) kodowania białka struktura pierwotna DNA lub RNA. W literaturze najczęściej pisze się, że jest to unikalna zgodność sekwencji trzech nukleotydów w genie z jednym aminokwasem w syntetyzowanym białku lub punktem końcowym syntezy białka. Definicja ta zawiera jednak dwa błędy. Odnosi się to do 20 tak zwanych aminokwasów kanonicznych, które wchodzą w skład białek wszystkich bez wyjątku żywych organizmów. Aminokwasy te są monomerami białkowymi. Błędy są następujące:

1) Nie ma 20 aminokwasów kanonicznych, ale tylko 19. Aminokwas możemy nazwać substancją, która zawiera jednocześnie grupę aminową -NH2 i grupę karboksylową - COOH. Faktem jest, że monomer białka - prolina - nie jest aminokwasem, ponieważ zawiera grupę iminową zamiast grupy aminowej, dlatego bardziej poprawne jest nazywanie proliny iminokwasem. Jednak w przyszłości we wszystkich artykułach poświęconych HA dla wygody napiszę około 20 aminokwasów, co sugeruje określony niuans. Struktury aminokwasów pokazano na ryc. 1.

Ryż. 1. Struktury aminokwasów kanonicznych. Aminokwasy mają części stałe, zaznaczone na rysunku kolorem czarnym i części zmienne (lub rodniki), zaznaczone na czerwono.

2) Zgodność aminokwasów z kodonami nie zawsze jest jednoznaczna. Informacje na temat naruszenia przypadków jednoznaczności można znaleźć poniżej.

Pojawienie się GC oznacza pojawienie się kodowanej syntezy białek. To wydarzenie jest jednym z kluczowych dla formacja ewolucyjna pierwsze żywe organizmy.

Strukturę HA przedstawiono w formie kołowej na ryc. 2.



Ryż. 2. Kod genetyczny w okrągłym kształcie. Wewnętrzny krąg- pierwsza litera kodonu, druga koło - druga litera kodonu, trzecie kółko - trzecia litera kodonu, czwarte kółko - oznaczenie aminokwasów w trzyliterowym skrócie; P - aminokwasy polarne, NP - aminokwasy niepolarne. Dla przejrzystości symetrii ważny jest wybrany porządek symboli U - C - A - G .

Zacznijmy więc opisywać główne właściwości HA.

1. Potrójność. Każdy aminokwas jest kodowany przez sekwencję trzech nukleotydów.

2. Obecność międzygenowych znaków interpunkcyjnych. Międzygeniczne znaki interpunkcyjne obejmują sekwencje Kwas nukleinowy, gdzie rozpoczyna się lub kończy transmisja.

Tłumaczenie nie może rozpocząć się od żadnego kodonu, ale tylko od ściśle określonego - startowy. Kodon start zawiera triplet AUG, od którego rozpoczyna się translacja. W tym przypadku triplet ten koduje albo metioninę, albo inny aminokwas – formylometioninę (u prokariotów), który można włączyć dopiero na początku syntezy białek. Na końcu każdego genu kodującego polipeptyd znajduje się co najmniej jeden z 3 kodony stop, Lub światła stopu: UAA, UAG, UGA. Kończą translację (tzw. syntezę białek na rybosomie).

3. Zwartość lub brak wewnątrzgenowych znaków interpunkcyjnych. W genie każdy nukleotyd jest częścią znaczącego kodonu.

4. Nie nakładające się. Kodony nie nakładają się na siebie; każdy ma swój własny uporządkowany zestaw nukleotydów, który nie pokrywa się z podobnymi zestawami sąsiednich kodonów.

5. Degeneracja. Odwrotna zgodność w kierunku aminokwas-kodon jest niejednoznaczna. Ta właściwość nazywa się degeneracją. Seria to zestaw kodonów kodujących jeden aminokwas, innymi słowy, jest to grupa równoważne kodony. Pomyślmy o kodonie jako o XYZ. Jeśli XY określa „sens” (tj. aminokwas), wówczas nazywany jest kodonem mocny. Jeśli do określenia znaczenia kodonu potrzebny jest określony Z, wówczas nazywa się taki kodon słaby.

Degeneracja kodu jest ściśle związana z niejednoznacznością parowania kodon-antykodon (antykodon oznacza sekwencję trzech nukleotydów na tRNA, która może komplementarnie łączyć się z kodonem na informacyjnym RNA (więcej szczegółów na ten temat można znaleźć w dwóch artykułach: Molekularne mechanizmy zapewniające degenerację kodu I Reguła Lagerquista. Fizykochemiczne uzasadnienie symetrii i zależności Rumera). Jeden antykodon na tRNA może rozpoznać od jednego do trzech kodonów na mRNA.

6.Jednoznaczność. Każdy triplet koduje tylko jeden aminokwas lub jest terminatorem translacji.

Istnieją trzy znane wyjątki.

Pierwszy. U prokariotów na pierwszej pozycji ( Wielka litera) koduje formylometioninę, a w każdym innym - metioninę. Na początku genu formylometionina jest kodowana zarówno przez zwykły kodon metioniny AUG, jak i przez kodon waliny GUG lub leucynę UUG, które w obrębie genu kodują walinę i leucynę, odpowiednio.

W wielu białkach formylometionina ulega rozszczepieniu lub usunięciu grupy formylowej, w wyniku czego formylometionina zostaje przekształcona w zwykłą metioninę.

Drugi. W 1986 roku kilka grup badaczy odkryło, że kodon stop UGA na mRNA może kodować selenocysteinę (patrz ryc. 3), pod warunkiem, że następuje po nim specjalna sekwencja nukleotydów.

Ryż. 3. Struktura 21. aminokwasu – selenocysteiny.

U E coli(jest to nazwa łacińska coli) selenocysteylo-tRNA podczas translacji i rozpoznaje kodon UGA w mRNA, ale tylko w pewnym kontekście, np.: dla uznania kodonu UGA za znaczący, ważna jest sekwencja o długości 45 nukleotydów zlokalizowana za kodonem UGA.

Rozważany przykład pokazuje, że w razie potrzeby żywy organizm może zmienić znaczenie standardowego kodu genetycznego. W tym przypadku Informacja genetyczna, zawarty w genach, jest kodowany w bardziej złożony sposób. Znaczenie kodonu określa się w kontekście określonej, rozszerzonej sekwencji nukleotydowej i przy udziale kilku wysoce specyficznych czynników białkowych. Ważne jest, że tRNA selenocysteiny znaleziono u przedstawicieli wszystkich trzech gałęzi życia (archeonów, eubakterii i eukariontów), co wskazuje na starożytne pochodzenie syntezy selenocysteiny i jej możliwą obecność u ostatniego uniwersalnego wspólnego przodka (co będzie omówimy w innych artykułach). Najprawdopodobniej selenocysteina występuje we wszystkich żywych organizmach bez wyjątku. Ale w każdym odrębny organizm Selenocysteina występuje w nie więcej niż kilkudziesięciu białkach. Wchodzi w skład aktywnych centrów enzymów, w szeregu homologów, których zwykła cysteina może funkcjonować na podobnej pozycji.

Do niedawna uważano, że kodon UGA można odczytać albo jako selenocysteinę, albo jako terminal, jednak ostatnio wykazano, że u orzęsków Euplotes Kodon UGA koduje cysteinę lub selenocysteinę. Cm. " Kod genetyczny pozwala na rozbieżności”

Trzeci wyjątek. U niektórych prokariotów (5 gatunków archeonów i jedna eubakteria – informacje na Wikipedii są bardzo nieaktualne) specjalny kwas- pirolizyna (ryc. 4). Jest kodowany przez trójkę UAG, która w kodzie kanonicznym służy jako terminator translacji. Zakłada się, że w tym przypadku, podobnie jak w przypadku kodowania selenocysteiny, odczyt UAG jako kodonu pirolizynowego następuje dzięki specjalnej strukturze na mRNA. tRNA pirolizyny zawiera antykodon CTA i jest aminoacylowany przez ARSazy klasy 2 (klasyfikacja ARSaz znajduje się w artykule „Kodazy pomagają zrozumieć, w jaki sposób kod genetyczny ").

UAG jest rzadko używany jako kodon stop, a gdy jest używany, często następuje po nim inny kodon stop.

Ryż. 4. Struktura 22. aminokwasu pirolizyny.

7. Wszechstronność. Po zakończeniu rozszyfrowania Kodeksu cywilnego w połowie lat 60. ubiegłego wieku przez długi czas uważano, że kod jest taki sam we wszystkich organizmach, co wskazuje na jedność pochodzenia wszelkiego życia na Ziemi.

Spróbujmy zrozumieć, dlaczego Kodeks cywilny jest uniwersalny. Faktem jest, że gdyby w organizmie zmieniła się przynajmniej jedna zasada kodowania, doprowadziłoby to do zmiany w strukturze znacznej części białek. Taka zmiana byłaby zbyt drastyczna i dlatego prawie zawsze śmiertelna, ponieważ zmiana znaczenia tylko jednego kodonu może dotyczyć średnio 1/64 wszystkich sekwencji aminokwasowych.

Prowadzi to do jednego bardzo ważnego wniosku: GC prawie się nie zmieniła od czasu swojego powstania ponad 3,5 miliarda lat temu. Oznacza to, że w jego strukturze znajduje się ślad pochodzenia, a analiza tej struktury może pomóc w dokładnym zrozumieniu, w jaki sposób mogła powstać GC.

W rzeczywistości HA może różnić się nieco pod względem bakterii, mitochondriów, kodu jądrowego niektórych orzęsków i drożdży. Obecnie istnieje co najmniej 17 kodów genetycznych różniących się od kanonicznego kodonem o 1-5. W sumie we wszystkich znanych wariantach odchyleń od uniwersalnego GK stosuje się 18 różnych podstawień znaczenia kodonu. Najwięcej odstępstw od standardowy kod znanych w mitochondriach – 10. Warto zauważyć, że mitochondria kręgowców, płazińce, szkarłupnie są kodowane różnymi kodami, a grzyby pleśniowe, pierwotniaki i koelenteraty - jednym.

Ewolucyjna bliskość gatunków wcale nie gwarantuje, że mają one podobne GC. Kody genetyczne mogą się różnić nawet między sobą różne rodzaje mykoplazmy (niektóre gatunki mają kod kanoniczny, inne inny). Podobną sytuację obserwuje się w przypadku drożdży.

Należy zauważyć, że mitochondria są potomkami organizmów symbiotycznych, które przystosowały się do życia wewnątrz komórek. Mają znacznie zredukowany genom; niektóre geny przeniosły się do jądra komórkowego. Dlatego zmiany w HA w nich nie są już tak dramatyczne.

Wyjątki odkryte później reprezentują Szczególne zainteresowanie z ewolucyjnego punktu widzenia, ponieważ mogę pomóc rzucić światło na mechanizmy ewolucji kodu.

Tabela 1.

Kody mitochondrialne w różnych organizmach.

Kodon

Kod uniwersalny

Kody mitochondrialne

Kręgowce

Bezkręgowce

Drożdże

Rośliny

UGA

ZATRZYMYWAĆ SIĘ

Trp

Trp

Trp

ZATRZYMYWAĆ SIĘ

AUA

Ile

Spotkał

Spotkał

Spotkał

Ile

CUA

Leja

Leja

Leja

Thr

Leja

AGA.

Argument

ZATRZYMYWAĆ SIĘ

Ser

Argument

Argument

AGG

Argument

ZATRZYMYWAĆ SIĘ

Ser

Argument

Argument

Trzy mechanizmy zmiany aminokwasu kodowanego przez kod.

Pierwsza ma miejsce, gdy pewien kodon nie jest używany (lub prawie nie jest używany) przez jakiś organizm z powodu nierównomiernego występowania niektórych nukleotydów (skład GC) lub kombinacji nukleotydów. W rezultacie taki kodon może całkowicie zniknąć z użycia (np. z powodu utraty odpowiedniego tRNA), a później można go wykorzystać do zakodowania innego aminokwasu, nie powodując przy tym znaczących uszkodzeń organizmu. Mechanizm ten może być odpowiedzialny za pojawienie się niektórych dialektów kodowych w mitochondriach.

Drugim jest przekształcenie kodonu stop w sens komórki jajowej. W takim przypadku niektóre z przetłumaczonych białek mogą zawierać dodatki. Jednak sytuację częściowo ratuje fakt, że wiele genów często kończy się nie jednym, ale dwoma kodonami stop, ponieważ możliwe są błędy translacyjne, w których kodony stop są odczytywane jako aminokwasy.

Trzecim jest możliwość niejednoznacznego odczytania pewnych kodonów, jak ma to miejsce w przypadku niektórych grzybów.

8 . Łączność. Nazywa się grupy równoważnych kodonów (to znaczy kodonów kodujących ten sam aminokwas). w serii. GC zawiera 21 serii, w tym kodony stop. Poniżej, dla pewności, zostanie wywołana dowolna grupa kodonów łączność, jeśli z każdego kodonu tej grupy można przejść do wszystkich innych kodonów tej samej grupy poprzez kolejne podstawienia nukleotydów. Z 21 serii 18 jest połączonych, 2 serie zawierają po jednym kodonie każda i tylko 1 seria dla aminokwasu seryny jest niepołączona i dzieli się na dwie połączone podserie.


Ryż. 5. Wykresy łączności dla niektórych serii kodów. a - połączony szereg waliny; b - połączone serie leucyny; Seria seryny jest niespójna i dzieli się na dwie połączone podserie. Rysunek pochodzi z artykułu V.A. Ratnera” Kod genetyczny jak system.”

Właściwość łączności można wytłumaczyć faktem, że w okresie tworzenia GC wychwytywała nowe kodony, które minimalnie różniły się od już używanych.

9. Regularność właściwości aminokwasów na podstawie korzeni trojaczków. Wszystkie aminokwasy kodowane przez triplety rdzenia U są niepolarne, nie mają ekstremalnych właściwości i rozmiarów oraz mają rodniki alifatyczne. Wszystkie trojaczki z korzeniem C mają mocne zasady, a kodowane przez nie aminokwasy są stosunkowo małe. Wszystkie trojaczki z korzeniem A mają słabe zasady i kodują polarne aminokwasy o niemałym rozmiarze. Kodony z rdzeniem G charakteryzują się ekstremalnymi i anomalnymi wariantami aminokwasów i serii. Kodują najmniejszy aminokwas (glicynę), najdłuższy i najbardziej płaski (tryptofan), najdłuższy i najbardziej sękaty (arginina), najbardziej reaktywny (cysteina) i tworzą anomalną podserię seryny.

10. Blokowość. Powszechny Kodeks Cywilny jest kodem „blokowym”. Oznacza to, że aminokwasy o podobnych właściwościach fizykochemicznych kodowane są przez kodony różniące się od siebie jedną zasadą. Blokowy charakter kodu jest wyraźnie widoczny na poniższym rysunku.


Ryż. 6. Struktura blokowa Kodeksu cywilnego. Aminokwasy z grupą alkilową zaznaczono kolorem białym.


Ryż. 7. Kolorowe przedstawienie właściwości fizykochemicznych aminokwasów na podstawie wartości opisanych w książceStyers „Biochemia”. Po lewej stronie jest hydrofobowość. Po prawej stronie widać zdolność do tworzenia helisy alfa w białku. Kolory czerwony, żółty i niebieski wskazują aminokwasy o wysokiej, średniej i niskiej hydrofobowości (po lewej) lub odpowiedni stopień zdolność do tworzenia helisy alfa (po prawej).

Właściwość blokowości i regularności można również wytłumaczyć faktem, że w okresie tworzenia GC wychwytywała nowe kodony, które minimalnie różniły się od już używanych.

Kodony o tych samych pierwszych zasadach (przedrostki kodonów) kodują aminokwasy o podobnych szlakach biosyntezy. Kodony aminokwasów należących do rodzin szikimianowych, pirogronianowych, asparaginianowych i glutaminianowych mają odpowiednio przedrostki U, G, A i C. O ścieżkach starożytnej biosyntezy aminokwasów i jej powiązaniu z właściwościami współczesnego kodu zob. „Starożytny dublet kod genetyczny zostało z góry określone przez szlaki syntezy aminokwasów. Na podstawie tych danych niektórzy badacze dochodzą do wniosku, że na powstanie kodu duży wpływ miały biosyntetyczne relacje między aminokwasami. Jednak podobieństwo szlaków biosyntezy wcale nie oznacza podobieństwa właściwości fizykochemicznych.

11. Odporność na hałas. W samym ogólna perspektywa Odporność na szumy GC oznacza, że ​​w przypadku przypadkowych mutacji punktowych i błędów tłumaczeniowych nie zmieniają się zbytnio właściwości fizykochemiczne aminokwasy.

Zastąpienie jednego nukleotydu w trójce w większości przypadków albo nie prowadzi do zmiany kodowanego aminokwasu, albo prowadzi do zmiany na aminokwas o tej samej polarności.

Jednym z mechanizmów zapewniających odporność GC na zakłócenia jest jego degeneracja. Średnia degeneracja jest równa liczbie zakodowanych sygnałów/całkowitej liczbie kodonów, gdzie zakodowane sygnały obejmują 20 aminokwasów i znak zakończenia translacji. Średnia degeneracja dla wszystkich aminokwasów i znaku terminacji wynosi trzy kodony na zakodowany sygnał.

Aby określić ilościowo odporność na zakłócenia, wprowadzamy dwie koncepcje. Nazywa się mutacje podstawienia nukleotydów, które nie prowadzą do zmiany klasy kodowanego aminokwasu konserwatywny. Nazywa się mutacje podstawień nukleotydowych prowadzące do zmiany klasy kodowanego aminokwasu rodnik .

Każda trójka umożliwia 9 pojedynczych podstawień. W sumie istnieje 61 trójek kodujących aminokwasy, zatem liczba możliwych podstawień nukleotydów dla wszystkich kodonów wynosi

61 x 9 = 549. Z tego:

23 podstawienia nukleotydów dają kodony stop.

134 podstawienia nie zmieniają kodowanego aminokwasu.
230 podstawień nie zmienia klasy kodowanego aminokwasu.
162 podstawienia prowadzą do zmiany klasy aminokwasów, tj. są radykalne.
Spośród 183 podstawień trzeciego nukleotydu 7 prowadzi do pojawienia się terminatorów translacji, a 176 jest konserwatywnych.
Spośród 183 podstawień pierwszego nukleotydu 9 prowadzi do pojawienia się terminatorów, 114 jest konserwatywnych, a 60 jest radykalnych.
Spośród 183 podstawień drugiego nukleotydu 7 prowadzi do pojawienia się terminatorów, 74 jest konserwatywnych, a 102 jest radykalnych.

Na podstawie tych obliczeń otrzymujemy ocena ilościowa odporność kodu na zakłócenia, jako stosunek liczby podstawień konserwatywnych do liczby podstawień radykalnych. Jest to równe 364/162=2,25

Na prawdziwa ocena Aby określić udział degeneracji w odporności na hałas, należy wziąć pod uwagę częstotliwość występowania aminokwasów w białkach, która jest różna u różnych gatunków.

Jaki jest powód odporności kodu na zakłócenia? Większość badaczy uważa, że ​​właściwość ta jest konsekwencją wyboru alternatywnych GC.

Stephen Freeland i Lawrence Hurst wygenerowali losowo takie kody i odkryli, że tylko jeden na sto alternatywnych kodów był nie mniej odporny na zakłócenia niż kod uniwersalny.
Nawet więcej interesujący fakt zostało odkryte, gdy badacze ci wprowadzili dodatkowe ograniczenie, aby uwzględnić rzeczywiste trendy we wzorcach mutacji DNA i błędach tłumaczeniowych. W takich warunkach TYLKO JEDEN KOD Z MILIONÓW MOŻLIWYCH okazał się lepszy od kodu kanonicznego.
Tę niespotykaną żywotność kodu genetycznego najłatwiej wytłumaczyć faktem, że powstał on w wyniku doboru naturalnego. Być może pewnego dnia świat biologiczny Było wiele kodów, każdy z własną wrażliwością na błędy. Organizm, który poradził sobie z nimi lepiej, miał więcej szans przetrwać, a kod kanoniczny po prostu wygrał walkę o byt. To założenie wydaje się całkiem realistyczne – wszak wiemy, że alternatywne kody naprawdę istnieją. Więcej informacji na temat odporności na zakłócenia można znaleźć w artykule Kodowana ewolucja (S. Freeland, L. Hirst „Zakodowana ewolucja”. // W świecie nauki. - 2004, nr 7).

Podsumowując, proponuję policzyć liczbę możliwych kodów genetycznych, które można wygenerować dla 20 aminokwasów kanonicznych. Z jakiegoś powodu nigdzie nie spotkałem tego numeru. Zatem potrzebujemy, aby wygenerowane GC zawierały 20 aminokwasów i sygnał stop, zakodowany przez CO NAJMNIEJ JEDEN KODON.

Ponumerujmy w myślach kodony w jakiejś kolejności. Porozmawiamy w następujący sposób. Jeśli mamy dokładnie 21 kodonów, wówczas każdy aminokwas i sygnał stop będą zajmować dokładnie jeden kodon. W tym przypadku możliwych będzie 21 grup głównych!

Jeśli kodonów jest 22, to pojawia się dodatkowy kodon, który może mieć jeden z dowolnych 21 zmysłów i kodon ten może znajdować się w dowolnym z 22 miejsc, natomiast pozostałe kodony mają dokładnie jeden inny sens, jak w przypadku 21 kodony. Otrzymujemy wówczas liczbę kombinacji 21!x(21x22).

Jeśli są 23 kodony, to rozumując podobnie, otrzymujemy, że 21 kodonów ma dokładnie jedno różne znaczenie każdy (21! opcji), a dwa kodony mają każdy po 21 różnych znaczeń (21 2 znaczeń ze STAŁĄ pozycją tych kodonów). Liczba różnych pozycji dla tych dwóch kodonów będzie wynosić 23x22. Łączna Warianty GC dla 23 kodonów - 21!x21 2 x23x22

Jeśli są 24 kodony, liczba GC będzie wynosić 21!x21 3 x24x23x22,...

....................................................................................................................

Jeśli jest 64 kodonów, liczba możliwych GC będzie wynosić 21!x21 43 x64!/21! = 21 43 x 64! ~ 9,1x10 145