генетична граматика

в момент проголошення їх здавалися

лише парадоксами або навіть єресями!

Що мислимо - то можливо,

що можливо - то мислимо.

Тонкий пристрій ДНК

Щоб подальша розповідь було більш ясним для читача, розглянемо спочатку докладніше, як же влаштована ця дивна і загадкова молекула ДНК.

Отже, ДНК складається з 4-х азотистих основ, а також цукру (дезоксирибози) і фосфорної кислоти. Два азотистих підстави (скорочено званих Ц і Т) відносяться до класу так званих піримідинових підстави, а два інших (А і Г) - до пуріновим підставах. Такий поділ пов'язаний з особливостями їх структур, які показані на рис. 1.

генетична граматика

Мал. 1. Структура азотистих основ (елементарних «букв»), з яких побудована молекула ДНК

Окремі підстави пов'язані в ланцюжку ДНК цукрово-фосфатними зв'язками. Ці зв'язки зображені на наступному малюнку (рис. 2).

генетична граматика

Мал. 2. Хімічна структура ланцюга ДНК

генетична граматика

Мал. 3. Схема взаємодії двох комплементарних ланцюгів в молекулі ДНК

Дві полімерні ланцюги закручені в правильну подвійну спіраль. Вони утримуються разом за допомогою водневих зв'язків між парами підстав (А-Т і Г-Ц) подібно сходами. З цієї причини говорять, що два ланцюги ДНК комплементарні. Для природи це не дивно. Відомо безліч прикладів комплементарності. Комплементарні, наприклад, давньокитайські символи «інь» і «янь», гнізда розетки і контактні штирі.

Подвійна спіраль ДНК схематично зображено на рис. 4. Зовні вона нагадує мотузяну драбину, завиту в праву спіраль. Ступенями в цих сходах є пари нуклеотидів, а зв'язують їх «боковинки» складаються з цукрово-фосфатного остову.

генетична граматика

Мал. 4. Знаменита подвійна спіраль ДНК а - Рентгенограма ДНК, отримана Р. Франклін, яка допомогла Уотсоном і Криком знайти ключ до двухспіральной структурі ДНК; б - Схематичне зображення двухспіральной молекули ДНК

Так була відкрита знаменита «подвійна спіраль». Якщо послідовність ланок (нуклеотидів) у ДНК розглядати як її первинну структуру, то подвійна спіраль - це вже вторинна структура ДНК. Запропонована Уотсоном і Криком модель «подвійної спіралі» витончено вирішувала не тільки проблему кодування інформації, а й подвоєння (реплікації) гена.

У 1962 році Дж. Уотсон, Ф. Крик і Моріс Уілкінс отримали по достоїнству за це досягнення Нобелівську премію. А ДНК була названа найголовнішою молекулою живої природи. У всьому цьому, звичайно ж, зіграли свою роль точні відомості про будову ДНК, але не в меншій мірі і «провісні» побудови складної просторової структури, що зажадало від дослідників не тільки логіки, а й творчої уяви - якості, властивого художникам, письменникам і поетам. «Тут, в Кембриджі, відбулося, можливо, найвидатніший після книги Дарвіна подія в біології - Уотсон і Крик розкрили структуру гена!» - писав у той час в Копенгаген Нільса Бора його колишній учень М. Дельбрюк. Відомий іспанський художник Сальвадор Далі після відкриття подвійної спіралі сказав, що це для нього стало доказом існування Бога, і зобразив ДНК на одній зі своїх картин.

Отже, інтенсивний мозковий штурм, зроблений вченими, завершився повним успіхом! В історичному масштабі відкриття структури ДНК можна порівняти з відкриттям структури атома. Якщо з'ясування будови атома призвело до появи квантової фізики, то відкриття структури ДНК дало початок молекулярної біології.

Якими ж виявилися головні фізичні параметри ДНК людини - цієї головної його молекули? Діаметр подвійної спіралі дорівнює 2 нанометрів (1 нм = 10 -9 м); відстань між сусідніми парами підстав ( «сходинками») становить 0,34 нм; один поворот спіралі складається з 10 пар основ. Послідовність пар нуклеотидів в ДНК нерегулярна, але самі пари укладені в молекулі як в кристалі. Це дало підставу характеризувати молекулу ДНК як лінійний апериодический кристал. Число окремих молекул ДНК в клітині дорівнює числу хромосом. Довжина такої молекули найбільшою за розміром хромосомі 1 людину становить близько 8 см. Подібних гігантських полімерів поки не виявлено ні в природі, ні серед штучно синтезованих хімічних сполук. У людини довжина всіх молекул ДНК, що містяться у всіх хромосомах одній клітці, становить приблизно 2 метри. Отже, довжина молекул ДНК в мільярд разів більше їх товщини. Так як організм дорослої людини складається приблизно з 5х10 13 - 10 14 клітин, то загальна довжина всіх молекул ДНК в організмі дорівнює 10 11 км (це майже в тисячу разів більше відстані від Землі до Сонця). Ось така вона, сумарна ДНК всього лише одну людину!

Але не слід думати, що геном людини найбільший з усіх існуючих в природі. Наприклад, у саламандри і лілії довжина молекул ДНК, що містяться в одній клітці, в тридцять разів більше, ніж у людини.

Оскільки молекули ДНК мають гігантський розмір, їх можна виділити і побачити навіть в домашніх умовах. Ось як описується ця проста процедура в рекомендації для гуртка «Юний генетик». По-перше, треба взяти будь-які тканини тварин або рослинних організмів (наприклад, яблуко або шматок курки). Потім треба нарізати тканину на шматочки і покласти 100 г в звичайний міксер. Після додавання 1/8 чайної ложки солі і 200 мл холодної води вся суміш збивається на міксері протягом 15 секунд. Далі збита суміш проціджують через ситечко. В отриману м'якоть треба додати 1/6 від її кількості (це буде приблизно 2 столові ложки) миючого засобу (для посуду, наприклад) і добре розмішати. Через 5-10 хвилин рідина розливається по пробірках або будь-яким іншим скляним ємностей, щоб в кожній з них було заповнене не більш третини обсягу. Потім до неї додається по чуть-чуть або сік, вичавлений з ананаса, або розчин, який використовується для зберігання контактних лінз. Весь вміст струшується. Робити це треба дуже обережно, тому що якщо трясти занадто сильно, то гігантські молекули ДНК поламаються і після цього нічого не можна буде побачити очима. Далі в пробірку повільно вливається рівний обсяг етилового спирту, щоб він утворив шар поверх суміші. Якщо після цього покриття в пробірці скляною паличкою, на неї «намотається» в'язка і майже безбарвна маса, яка і являє собою препарат ДНК.

Після встановлення хімічної будови і просторової структури ДНК залишалося ще безліч питань, основним з яких полягав у тому, як же ДНК кодує білки, тобто, що вдає із себе генетичний код цієї молекули, яку «граматику» вона використовує? На це в першу чергу і були спрямовані подальші зусилля дослідників.

Отже, встановлено, що «буквами» в ДНКовом тексті служать нуклеотиди - елементарні ланки полімерної молекули ДНК. У ДНК всього 4 нуклеотиду (А, Т, Г, Ц). Отже, якщо порівняти кожен з цих нуклеотидів з окремою літерою, то алфавіт ДНКового тексту містить всього 4 «букви». Як же з цих "букв" формуються «слова» і «пропозиції»?

Білкові молекули всіх існуючих на землі організмів побудовані за все з 20 амінокислот. Відразу після створення моделі ДНК стало ясно, що існує якийсь код, переводить чотирибуквений ДНКовий текст в двадцатібуквенний амінокислотний текст. Елементарні розрахунки говорили про те, що число можливих поєднань, в яких чотири нуклеотиду можуть бути по-різному розташовані в «тексті», досягає астрономічних значень. Так, молекула ДНК, що складається, наприклад, всього з 100 пар нуклеотидів, може теоретично кодувати 4 100 різних білкових «текстів». Яка ж ситуація насправді?

Одним з перших в цьому намагався розібратися російський фізик Г. Гамов, який емігрував в той час в Америку. Наслухавшись численних розмов про ДНК і дізнавшись, що вона містить - як і карти - всього чотири «масті», Гамов вирішив «розкласти пасьянс» з метою зрозуміти пристрій генетичного коду. Йому відразу стало ясно, що код не може бути «двійковим», тобто одну амінокислоту в білку повинна кодувати НЕ двійка нуклеотидів - «літер», а як мінімум трійка. Справа в тому, що поєднання з 4 по 2 дає всього 16 комбінацій, а цього недостатньо для кодування всіх 20 амінокислот. Отже, міркував Гамов, код повинен бути принаймні трьохлітерним, тобто кожну амінокислоту повинна кодувати трійка «букв» в будь-якому поєднанні. На цьому він і зупинився, оскільки далі виникало безліч питань. Зокрема, такий: число поєднань з 4 по 3 одно 64, а амінокислот всього 20. Навіщо ж така надмірність в трибуквених коді?

У той час уже існував добре відомий шлях, який, зокрема, був проведений свого часу французом Жаном Шампольоном при дешифрування ієрогліфів древнього Єгипту. В якості основного підмоги для вирішення що стоїть перед ним завдання він використовував базальтову плиту, яку виявили під час військової компанії Наполеона в Єгипет і яка отримала назву Розеттський камінь. На плиті одночасно присутні два написи: одна була ієрогліфічна, а інша - зроблена грецькими буквами на грецькій мові. На щастя, і мову, і лист древніх греків були в той час вже добре відомі вченим. В результаті порівняння двох текстів Розеттського каменю призвело до розшифровки єгипетської ієрогліфіки. Цим шляхом і рушили вчені при розшифровці генетичного коду. Треба було порівняти два тексти: текст, записаний в ДНК, з текстом, записаним в білку. Однак спочатку вчені не вміли «читати» ДНК, а одного відомого в той час білкового тексту було недостатньо. Довелося штучно синтезувати різноманітні короткі фрагменти РНК і синтезувати на них в штучних системах фрагменти білка. Навесні 1961 року в Москві на Міжнародному біохімічному конгресі М. Ніренберг повідомив, що йому вдалося «прочитати» перше «слово» в ДНКовом тексті. Це була трійка букв - ААА (в РНК, відповідно, УУУ), тобто три аденіну, що стоять один за одним, - яка кодує амінокислоту фенілаланін в білку. Так було покладено початок розшифровці генетичного коду.

Такий шлях в кінцевому підсумку незабаром привів до повну розшифровку генетичного коду. Підтвердилося припущення Гамова, що код триплетний: одній амінокислоті в білках відповідає послідовність з 3 нуклеотидів в ДНК і РНК. Такі кодують трійки нуклеотидів - «слова» - отримали назву кодонів.

Нагадаємо, що ще Гамов зіткнувся з парадоксом: з чотирьох нуклеотидів може бути побудовано 64 різних кодонів, а для побудови білків використовується тільки 20 різних амінокислот. Рішення цього парадоксу виявилося в наступному. Більшість амінокислот може кодуватися кількома кодонами. Після з'ясування цієї обставини генетичний код назвали виродженим.

У таблиці 1 наведені кодони, але не в самій ДНК, а в РНК-посереднику (матричної РНК, або мРНК), що утворюється на ДНК, і відповідні їм амінокислоти в білках.

Крім того, як видно з таблиці, реально для кодування використовуються не всі можливі кодони. Три з цих «зайвих» кодонів виконують функцію стоп-сигналів, забезпечуючи припинення синтезу білкової ланцюга.

Якщо уважно подивитися на таблицю 1, то видно, що вирожденність генетичного коду носить не зовсім випадковий характер. Хоча код триплетний, основне навантаження несуть перші два нуклеотиди в кожному кодоні. Найчастіше в різних кодонах, що кодують одну і ту ж амінокислоту, відрізняється лише третій нуклеотид.

Таблиця 1. Генетичний словник. Вказані амінокислоти, що зустрічаються в білках, і відповідні їм кодони в комплементарної ДНК матричної РНК

генетична граматика

Генетичний код спочатку був розшифрований у таких простих організмів, як фаги і бактерії. Надалі виявилося, що він універсальний (за дуже рідкісним винятком) для геномів усіх існуючих нині живих організмах (від бактерій до людини). Невеликі відмінності, про які ми поговоримо далі, були виявлені при порівнянні ядерного і мітохондріального геномів.

Отже, як в звичному нам тексті книги, вся інформація записана в ДНК послідовністю розташування чотирьох складових її «букв» - нуклеотидів. Таким чином, ДНКовий текст написаний за допомогою А, Т, Ц, Г-алфавіту. При цьому тільки текст однієї з двох ланцюгів ДНК зазвичай кодує, а інша ланцюг, як правило, не кодують. Хоча відомо, що в кожному правилі є винятки. Якщо читач спробує написати цими чотирма літерами якісь російські слова, то у нього нічого не вийде. «Словом» в ДНКовом тексті, умовно кажучи, служить певне поєднання трьох нуклеотидів, якому відповідав би конкретна амінокислота в білку, що є також полімером. Таким чином, в клітці чотирма буквами записано два десятка «слів» (амінокислот - складових частин білків). І, нарешті, як «пропозиція» в ДНКовом тексті можна розглядати повний набір триплетів, що кодують певний білок, тобто ген. Таким чином, генетичний алфавіт складається всього з 4 букв, а генетичний словник з 20 слів. У зв'язку з цим згадаємо, що навіть словник Еллочки-людожерки з роману І. Ільфа та Є. Петрова «Дванадцять стільців» складався з 30 слів, а «Словник мови творів А. С. Пушкіна» налічує приблизно 20 тис. Слів.

Існує сувора закономірність: чим довше код (чим більше в ньому знаків), тим коротше тексти. Величезний за розмірами код є, наприклад, китайські ієрогліфи. В результаті цього ієрогліфічні тексти істотно більш короткі в порівнянні з іншими системами письма, в тому числі і нашої. Однак для створення генетичного коду природа вибрала всього 4 «букви». Такий код передбачає наявність довгих текстів, що і реалізувалося природою у вигляді створення гігантських молекул ДНК. При написанні повного «тексту» генома людини було потрібно близько 3,2 млрд. «Букв». Для порівняння: у священній книзі Буття, написаної на староєврейською мовою, міститься всього 78100 букв.

Схожі статті