Скільки сміття в нашій ДНК?
Геном риби фугу приблизно у вісім разів менше, ніж геном людини, і в 330 разів менше, ніж геном двоякодишної риби протоптер. Які «привиди» живуть на «кладовищах геномів», і скільки сміття в нашій з вами ДНК?
- Трохи молекулярної генетики
- Поміряємося генами?
- Удвічі розумніший мух
- Мінімальна миша
- Знахідка чи сміття?
- Каша їхала на котоциклі
- Реплікація
- Сміттєва фортеця
Відомий молекулярний біолог Девід Пенні з Центру молекулярної екології та еволюції Аллена Вілсона в новозеландському Університеті Массей якось сказав: «Я б дуже пишався роботою в групі, яка розробила геном кишкової палички. Однак я б ніколи не зізнався, що брав участь у проектуванні геному людини. У жодному університеті цей проект не змогли б настільки зіпсувати «. Тема про кількість сміття в нашій ДНК — одна з найбільш «гарячих» тем у науковому співтоваристві. Навколо цього питання серед вчених розгораються справжні словесні баталії.
Трохи молекулярної генетики
Нагадаємо, що в основі передачі спадкової інформації лежить двцепочкова молекула ДНК. Вона являє собою полімер з чотирьох типів мономерів (нуклеотидів): аденіна (A), тиміна (T), цитозина (С) і гуаніна (G) — і покладена в хромосоми. У людини 23 пари розташованих в ядрі хромосом (22 пари неполових і одна пара статевих). Вони і складають основу нашого геному (ще 37 генів містять кільцеві ДНК мітохондрій). Якби ми взяли одну клітку людини, пошили весь диплоїдний (парний) набір хромосом разом і витягнули в нитку, то отримали б молекулу довжиною в два метри, що складається з шести мільярдів пар підстав (нуклеотидів). Три мільярди від тата і три — від мами.
Людина розумна Homo sapiens
Геном імовірно на 90% складається зі сміття. Геном: 3 млрд пар підстав. Генів:20-25 тисяч
Найбільш вивчений тип функціональних послідовностей ДНК — гени, що кодують білки. З таких генів зчитується молекула РНК, яка потім грає роль матриці для синтезу білків і визначає їх амінокислотну послідовність. Кодуюча частина молекули РНК може бути розділена на трійки нуклеотидів (кодони), які або відповідають деякій амінокислоті, або визначають місце закінчення синтезу білка (стоп-кодони). Правило відповідності кодонів амінокислотам називається генетичним кодом. Наприклад, кодон GCC кодує амінокислоту аланін.
Поміряємося генами?
Плодова муха дрозофіла Drosophila melanogaster
Геном модельної мухи. Геном: 120 млн пар підстав. Генів: 13 500
Колись думали, що у такого складного організму, як людина, має бути дуже багато генів. Коли проект «Геном людини» підходив до завершення, вчені навіть влаштували тоталізатор: скільки генів буде виявлено?
Удвічі розумніший мух
Ідея тоталізатора з приводу числа людських генів прийшла в голову доктору Евану Бірні в барі при лабораторії в Колд-Спрінг-Харбор незадовго до завершення проекту «Геном людини». У міру наближення до фіналу, з 2000 по 2002 рік, ставки зросли з 1 долара до 20. У результаті банк розділили «на трьох»: Пол Дір з Британської ради з медичних досліджень, яку ще в 2000 році поставив на дату свого народження — 27.04.1962 — 27 462, Лі Роуен з Інституту системної біології в Сіетлі — в 2001 році вона поставила на число 25 947, і Олівер Джейлон з французької компанії Genoscope (26 500). Коли головного переможця — доктора Діра — запитали, як йому вдалося ще три роки тому, коли всі думали, що генів у людини не менше 50 000, вгадати число з такою точністю, він відповів: «Справа була в барі, глибокої ночі. Спостерігаючи за поведінкою питущих людей, я подумав, що воно мало відрізняється від поведінки мух-дрозофіл, у яких 13 500 генів, а тому мені здалося, що подвоєного числа мушиних генів людям цілком достатньо «.
Яке ж було їх здивування, коли виявилося, що кількість генів у людини і маленького круглого хробака Caenorhabditis elegans приблизно однакова. У черв’яка близько 20 000 генів, а у нас — 20… 25 тисяч.
Вільножива нематода Caenorhabditis elegans
Маленький модельний геном тварини. Геном: 100 млн пар підстав. Генів: ~20 000
Для «вінця творіння» факт досить образливий, особливо якщо врахувати, що існує багато організмів як з більшим за розміром геномом (геном двоякодишної риби протоптер, Protopterus aethiopicus, в 40 разів більше людського), так і з більшою кількістю генів (у рису — 32 ‑ 50 тисяч генів).
Двоякодишня риба протоптер Protopterus aethiopicusНайбільший
відомий геном. Геном: 133 млрд пар підстав. Генів: багато
Але насправді у людини менше 2% геному кодують якісь білки. Для чого ж потрібні інші 98%? Може, там ховається секрет нашої складності? Виявилося, що існують важливі некодуючі ділянки ДНК. Наприклад, це ділянки промоторів — послідовностей нуклеотидів, на які сідає фермент РНК-полімеразу і звідки починається синтез молекули РНК. Це ділянки пов’язування транскрипційних факторів — білків, що регулюють роботу генів. Це теломери, що захищають кінці хромосом, і центромери, необхідні для правильної розбіжності хромосом по різних полюсах клітин при діленні. Відомі деякі регуляторні молекули РНК (наприклад, мікроРНК, що перешкоджають синтезу білків відповідних генів на матричній РНК — копії гена-вихідника), а також молекули РНК, що входять до складу важливих ферментативних комплексів — наприклад, рибосом, які збирають з окремих амінокислот білки, пересуваючись по матричній РНК. Є й інші приклади важливих некодуючих ділянок ДНК.
Мімівірус Acanthamoeba polyphaga mimivirusНайбільший
відомий геном вірусу. Геном: 1 181 404 пар підстав. Генів: 979
Проте більша частина нашого геному нагадує пустелю: повторювані послідовності, останки «мертвих» вірусів, які колись давно вбудовувалися в геноми наших предків; так звані егоїстичні мобільні елементи — послідовності ДНК, здатні перескакувати з однієї ділянки геному в іншу; різні псевдогени — нуклеотидні послідовності, що втратили здатність кодувати білки в результаті мутацій, але все ще зберегли деякі ознаки генів. Це далеко не повний список «привидів», що мешкають на «кладовищі геному».
Вірус імунодефіциту людини (ВІЛ)
Швидко змінюється геном вірусу імунодефіциту людини. Геном: 9749 пар підстав (але вже мутував). Генів: 9, але вони кодують 18 білків’)’>
Вірус імунодефіциту людини (ВІЛ)
Швидко змінюється геном вірусу імунодефіциту людини. Геном: 9749 пар підстав (але вже мутував). Генів: 9, але вони кодують 18 білків
Мінімальна миша
Риба фугу Fugu rubripesНайменший
відомий геном хребта. Геном: 390 млн пар підстав. Генів: 20 ‑ 28 тисяч
Існує точка зору, що більша частина геному людини нефункціональна. У 2004 році журнал Nature опублікував статтю, що описувала мишей, з геному яких були вирізані значні фрагменти некодуючої ДНК розміром в 0,8 і навіть 1,5 млн нуклеотидів. Було показано, що ці миші не відрізняються від звичайних будовою тіла, розвитком, тривалістю життя або здатністю залишати потомство. Зрозуміло, якісь відмінності могли залишитися непоміченими, але в цілому це був серйозний аргумент на користь існування «сміттєвої ДНК», від якої можна позбутися без особливих наслідків. Звичайно, було б цікаво вирізати не пару мільйонів нуклеотидів, а мільярд, залишивши тільки передбачені послідовності генів і відомі функціональні елементи. Чи вдасться вивести подібну «мінімальну мишу», і чи зможе вона нормально існувати? Чи може людина обійтися геномом довжиною лише в півметра? Можливо, коли-небудь ми про це дізнаємося. Тим часом ще один важливий аргумент на користь існування сміттєвої ДНК — наявність досить близьких організмів з дуже різними розмірами геномів.
Геном риби фугу приблизно у вісім разів менше, ніж геном людини (хоча генів у ньому приблизно стільки ж), і в 330 разів менше, ніж геном вже згаданої риби протоптер. Якби кожен нуклеотид в геномі був функціональний, то незрозуміло, навіщо цибулі геном в п’ять разів більший, ніж у нас?
Цибуля ріпчаста Allium сера
Один з найбільших рослинних геномів. Геном: 16 млрд пар підстав. Генів: невідомо «)» >
Цибуля ріпчаста Allium сера
Один з найбільших рослинних геномів. Геном: 16 млрд пар підстав. Генів: невідомо
На колосальні відмінності в розмірах геномів подібних організмів звернув увагу еволюційний біолог Сусуму Оно. Вважається, що саме Воно ввів термін «сміттєва ДНК» (junk DNA). Ще в 1972 році, задовго до того, як був прочитаний геном людини, Воно висловило правдоподібні уявлення як про кількість генів у геномі людини, так і про кількість «сміття» в ньому. У своїй статті «Стільки сміттєвої ДНК у нашому геномі» він зазначає, що в геномі людини має бути близько 30 000 генів. Це число, на той момент зовсім не очевидне, виявилося дивно близько до реального, яке дізналися десятки років потому. Крім того, Оно наводить оцінку функціональної частки геному (6%), оголошуючи понад 90% геному людини сміттям.
Райан Грегорі,
фахівець з еволюційної біології та інтегративної геноміки, ад’юнкт-професор канадського Університету Гельфа в провінції Онтаріо:
«Луковий тест — хороша перевірка для будь-кого, хто думає, що кожен нуклеотид в людському геномі має певну функцію. Незалежно від того, які ці передбачувані функції, запитайте себе: навіщо звичайному ріпчастому луку потрібен геном приблизно в п’ять разів більше вашого? «
Знахідка чи сміття?
Виклик уявленню про існування сміттєвої ДНК кинув проект ENCODE — The Encyclopedia of DNA Elements, «Енциклопедія елементів ДНК» (перші його результати опубліковані в журналі Nature в 2012 році). Отримавши численні експериментальні дані про те, які частини геному людини взаємодіють з різними білками, беруть участь у транскрипції — синтезі РНК-копій генів для подальшої трансляції (синтезу білка з амінокислот на матриці інформаційної РНК) — або інших біохімічних процесах, автори дійшли висновку, що понад 80% геному людини так чи інакше функціональні. Зрозуміло, ця теза викликала бурхливе обговорення в науковому співтоваристві.
Резуховидка Таля Arabidopsis thaliana
Маленький модельний рослинний геном. Геном: 119 млн пар підстав. Генів: ~25 000′)»»>
Резуховидка Таля Arabidopsis thaliana
Маленький модельний рослинний геном. Геном: 119 млн пар підстав. Генів: ~25 000
Одна з найбільш іронічних статей, опублікована Деном Грауром, фахівцем з молекулярної еволюційної біоінформатики, професором Х’юстонського університету, і його колегами в 2013 році в журналі Genome biology and evolution, називається так: «Про безсмертя телевізорів: «функція» в геномі людини за позбавленою еволюції Євангелію від ENCODE «. Її автори зазначають, що окремі члени консорціуму ENCODE розходяться в тому, яка частина геному функціональна. Так, один з них незабаром уточнив в журналі Genomicron, що мова йде не про 80% функціональних послідовностей в геномі, а про 40%, а інший (у статті в Scientific American) і зовсім знизив показник до 20%, але при цьому продовжував наполягати, що термін «сміттєва ДНК» потрібно усунути з лексикону.
На думку авторів статті «Про безсмертя телевізорів», члени консорціуму ENCODE занадто вільно інтерпретують термін «функція». Наприклад, існують білки, які називають гістонами. Вони можуть зв’язувати молекулу ДНК і допомагають їй компактно вкладатися. Гістони можуть зазнавати певних хімічних модифікацій. Згідно з ENCODE, імовірна функція однієї з таких модифікацій гістонів — «перевага перебувати в 5′-конці генів» (5′-конець — це кінець гена, від якого рухаються ферменти ДНК-і РНК-полімерази при копіюванні ДНК або при транскрипції). «Приблизно так само можна сказати, що функція Білого дому — займати площу землі за адресою 1600, Пенсільванія-авеню, Вашингтон, округ Колумбія», — зазначають опоненти.
Антарктичні безкрилі комарі-дзвінці Belgica antarct^ Найменший
геном членистоногих. Геном: 99 млн пар підстав. Генів: ~14 000′)»»>
Антарктичні безкрилі комарі-дзвінці Belgica antarct^ Найменший
геном членистоногих. Геном: 99 млн пар підстав. Генів: ~14 000
Виникає проблема і з приписуванням функції ділянкам ДНК. Припустимо, що до певної ділянки ДНК здатний прикріплюватися важливий для функціонування клітини білок, і тому ENCODE приписує цій ділянці «функцію». Наприклад, певний транскрипційний фактор — білок, що ініціює синтез інформаційної (матричної) РНК — пов’язується з наступною послідовністю нуклеотидів: TATAAA. Розгляньмо дві ідентичні послідовності TATAAA в різних частинах геному. Після того як транскрипційний фактор пов’язується з першою послідовністю, починається синтез молекули РНК, що служить матрицею для синтезу іншого важливого білка. Мутації (заміни будь-якого з нуклеотидів) у цій послідовності призведуть до того, що РНК буде зчитуватися погано, білок не буде синтезований, і це, швидше за все, негативно позначиться на виживанні організму. Тому правильна послідовність TATAAA буде підтримуватися в даному місці генома за допомогою природного відбору, і в цьому випадку доречно говорити про наявність у неї функції.
Каша їхала на котоциклі
Іноді в ЗМІ можна почути некоректну фразу «генетичний код мутував». Але мутації відбуваються не в коді, а в молекулі ДНК (в геномі). У результаті змінюються нуклеотидні послідовності. Це можна порівняти із заміною літери в слові. Наприклад, фраза «Маша їхала на мотоциклі» перетворюється на фразу «Саша їхала на мотоциклі», якщо одна буква М «мутувала» в букву С. Зміна генетичного коду набагато серйозніша — це як зміна алфавіту. Уявімо, що в усьому тексті літера М раптово перетворилася на букву К. Тепер у нас «Каша їхала на котоциклі». Зрозуміло, що такі зміни призводять до значних наслідків і тому в природі відбуваються вкрай рідко. Але відбуваються! Наприклад, у деяких інфузорій один із стоп-кодонів може кодувати амінокислоту глутамін. Але це швидше виняток, ніж правило. У більшості організмів один і той же генетичний код: наприклад, у людини, у черв’яка або огірка. А ось геноми у цих організмів розрізняються дуже сильно. Той же алфавіт, але інший текст.
Інша послідовність TATAAA виникла в геномі з випадкових причин. Оскільки вона ідентична першій, з нею теж пов’язується транскрипційний фактор. Але ніякого гена поруч немає, тому зв’язування ні до чого не призводить. Якщо в цій ділянці виникне мутація, нічого не зміниться, організм не постраждає. У даному випадку говорити про функції другої ділянки TATAAA немає сенсу. Втім, може виявитися, що наявність в геномі великої кількості послідовностей TATAAA далеко від генів потрібно просто для того, щоб пов’язувати транскрипційний фактор і зменшувати його ефективну концентрацію. У такому разі відбір регулюватиме число таких послідовностей у геномі.
Щоб довести, що деяка ділянка ДНК функціонна, недостатньо показати, що в цій ділянці відбувається якийсь біологічний процес (наприклад, зв’язування ДНК). Члени консорціуму ENCODE пишуть, що функцією володіють ділянки ДНК, які залучені в транскрипцію. «Але чому потрібно акцентувати увагу на тому, що 74,7% геному транскрибується, в той час як можна сказати, що 100% геному бере участь у відтворюваному біохімічному процесі — реплікації!», — знову жартує Граур.
Реплікація
Реплікація (від лат. replicatio — відновлення) — процес синтезу дочірньої молекули дезоксирибонуклеїнової кислоти на матриці батьківської. При наступному поділі кожна з дочірніх клітин отримує по одній копії молекули ДНК, ідентичній ДНК вихідної материнської клітини. Реплікацію ДНК здійснює реплісома — складний ферментний комплекс, що складається з 15 ‑ 20 різних білків.
Хорошим критерієм функціональності ділянки ДНК є те, що мутації в ній досить шкідливі і значні зміни цієї ділянки не спостерігаються з покоління в покоління. Як визначити такі ділянки? Тут на допомогу і приходить біоінформатика, сучасна наука на стику біології та математики про аналіз послідовностей генів і білків. Ми можемо взяти геноми людини і миші і знайти в них всі схожі ділянки ДНК. Виявиться, що у цих двох видів якісь ділянки послідовностей нуклеотидів дуже схожі. Наприклад, гени, необхідні для синтезу рибосомальних білків, досить консервативні, тобто мутації в них досить шкідливі, щоб носії нових мутацій вимирали, не залишаючи потомства. Про такі гени кажуть, що вони перебувають під негативним відбором, що очищає від шкідливих мутацій. Інші ділянки геномів матимуть значні розбіжності між видами, що вказує на те, що мутації в цих ділянках, швидше за все, нешкідливі, а значить, їх функціональна роль невелика або не визначається конкретною послідовністю нуклеотидів. У низці робіт оцінили частку ділянок ДНК людини, які перебувають під тиском негативного відбору. Виявилося, що до них відносяться тільки близько 6,5 _ 10% геному, причому некодуючі ділянки, на відміну від кодуючих, набагато менше схильні до негативного відбору. Виходить, що з точки зору еволюційних критеріїв функціональні менше 10% геному людини. Зверніть увагу, як близький до цієї оцінки був Воно в 1972 році!
Сміттєва фортеця
Частково синтетична бактерія Mycoplasma laboratoriumСинтетичний
геном, в якому закодовані імена синтезували його вчених. Геном: 580 000 пар підстав. Генів: 381
Бактерія Hodgkinia cicadicolaНайменший
відомий геном бактерії. Бактерія-сімбіонт з нестандартним генетичним кодом. Геном: 144 000 пар підстав. Генів: 189
Але невже інші 90% геному людини — сміття, від якого краще позбутися? Не зовсім так. Є міркування, що великий розмір геному може бути корисний сам по собі. У бактерій реплікація геному служить серйозним обмежувальним фактором, що вимагає значних витрат енергії. Тому їхні геноми, як правило, маленькі, а від усього зайвого вони позбавляються. У великих організмів, як правило, реплікація ДНК клітин, що діляться, вносить не такий великий внесок у загальну кількість енерговитрат організму на тлі витрат на роботу мозку, м’язів, органів виділення, підтримки температури тіла тощо. Водночас великий геном може бути важливим джерелом генетичної різноманітності, збільшуючи шанси на появу нових функціональних ділянок з нефункціональних за рахунок мутацій, потенційно корисних у процесі еволюції. Мобільні елементи можуть переносити регуляторні елементи, створюючи генетичне розмаїття в регуляції роботи генів. Тобто організми з великими геномами теоретично можуть швидше адаптуватися до умов середовища, розплачуючись порівняно невеликими додатковими витратами на реплікацію більш великого геному. Подібний ефект ми не виявимо в окремого організму, але він може відігравати важливу роль на рівні популяції.
Наявність великого геному може також зменшувати ймовірність того, що який-небудь вірус вбудується у функціональний ген (що може призвести до поломки гена і в ряді випадків до раку). Іншими словами, не виключено, що природний відбір може діяти не тільки на підтримку конкретних послідовностей в геномі, але на збереження певних розмірів геному, нуклеотидного складу в деяких його ділянках тощо.
Втім, хоча ідея, що тільки 80% або навіть 20% геному людини функціональні — спірна, це зовсім не означає, що критиці підлягає весь проект ENCODE. У його рамках отримано величезну кількість даних про те, як різні білки зв’язуються з ДНК, інформації про регуляцію генів тощо. Ці дані становлять великий інтерес для фахівців. Але навряд чи найближчим часом вдасться позбутися «сміття» в геномі — як від концепції, так і від самих непотрібних послідовностей.
Автор дякує Євгену Дуєву та Юрію Панчину за допомогу в написанні статті.
Редакція висловлює подяку сайту «Біомолекула».
- Попередня
- Наступна