bogdan_63: (На работе)
[personal profile] bogdan_63
Оригинал взят у [livejournal.com profile] galicarnax в О повторах в геноме человека

То, что в геноме человека существует достаточно много повторов - участков ДНК, разбросанных по геному во множественных копиях - было известно еще лет 40 назад. Но весь масштаб происходящего был понят после полного секвенирования генома в 2000-х гг., когда выяснилось, что не менее чем на половину он состоит из повторов разного типа. Это, конечно, был сюрприз. Весь геном человека и без того весит 750 Мбайт - аккурат на одну CD-болванку. А тут еще оказывается, что его информация так избыточна...
Впрочем, обнаруженное количество генов тоже порадовало. Думали, что в геноме более сотни тысяч генов, а оказалось всего-то около 24 тысяч. Примерно столько же, сколько у червяка-нематоды (20 тыс.) и даже меньше, чем у травки арабидопсиса (26 тыс.). Ситуацию немного спасает альтернативный сплайсинг - примерно каждый второй ген человека кодирует не один белок, а сразу несколько (обычно родственных по функциям). Получается это комбинированием разных экзонов одного гена при сооружении мРНК. У червяка альтернативный сплайсинг тоже имеется, но используется реже, чем у человека. В итоге, при одном и том же числе генов количество разных типов белков у человека все же больше, чем у червяка. И это радует. Но вернемся к повторам.

Повторы есть практически во всех геномах. Особенно они изобильны у некоторых растений. Геном пшеницы состоит вообще на 90% из повторов
.

Повторяющиеся последовательности можно поделить на:
  1. Транспозоны - участки ДНК, которые могут передвигаться по геному. Передвигаются они с помощью специальных белков - транспозаз, которые в большинстве случаев закодированы в самих транспозонах. Длина транспозонов - от сотен до нескольких тысяч нуклеотидов.
  2. Сегментные дупликации. Это большие блоки хромосом, длиной от десятков тысяч до десятков миллионов нуклеотидов, которые присутствуют в двух-трех копиях в геноме. Их последовательности идентичны между собой на 80-100%. Например, в геноме человека имеется кусок длиной около 1.5 млн. оснований, повторяющийся один-в-один в хромосомах X и Y.
  3. Тандемные повторы. Это участки, в которых небольшая последовательность-шаблон (от двух до десятков оснований) повторяется тандемно, одна за другой, сотни и тысячи раз. Например: ...ATTGATTGATTGATTGATTGATTG... Особенно изобильны тандемные повторы в центромерах хромосом, где они несут структурную функцию.

Вот из чего состоит наш геном:

 
Дальше немного подробнее о транспозонах.

Передвижение транспозонов не следует понимать как постоянно происходящий в клетках процесс. В плане отдельных особей это редкое явление. Например, у человека каждая новая вставка Alu-повтора происходит примерно один раз на двести рождений. Однако в плане эволюции популяции распространение транспозонов может быть почти молниеносным, как показывает пример
P-элементов у дрозофил. Эти транспозоны расплодились в геноме несчастных мух, по всей видимости, где-то в середине 20 века.

Транспозоны можно разделить на два класса: ДНК-транспозоны и ретротранспозоны. ДНК-транспозоны вырезаются прямо из ДНК и вставляются в другое место. Таким образом, они передвигаются по принципу cut-and-paste. Сейчас, по всей видимости, они неактивны. Ретротранспозоны размножаются через РНК-посредник. Сначала с ДНК снимается копия в виде РНК, потом с РНК идет обратная транскрипция (отсюда "ретро") - создается копия ДНК в другом месте генома. Т.е. они передвигаются по принципу copy-and-paste.

Сами ретротранспозоны можно далее разделить на два класса - содержащие
длинные концевые повторы (LTR - long terminal repeats) и те, что без них. LTR-транспозоны имеют большое сходство с некоторыми ретровирусами, составляют около 8% генома человека и также сейчас почти не проявляют активности. Произошли ли они от вирусов, или вирусы от них - вопрос нерешенный. Вирусы, помимо белков-помощников, кодируют еще как минимум белки для своей оболочки.

Особенно интересны ретротранспозоны без LTR - именно они наиболее многочисленны. К тому же имеются однозначные данные о том, что они не только активны, но и могут приводить к генетическим заболеваниям, включая рак. У человека два основных типа таких транспозонов - L1 и Alu.

L1-элементы имеют длину около 6 тыс. оснований и кодируют два белка, с помощью которых они распространяются. Число их в геноме - около полмиллиона штук. Хотя активно из них менее ста (остальные инактивированы мутациями).

Alu-повторы имеют длину 280 оснований, а число их копий в геноме составляет около 1,1 миллиона. Alu-повторы имеются только в линии приматов. Предполагается, что они появились в результате дупликации гена 7SL RNA (он кодирует РНК, входящую в состав молекулярного комплекса
SRP, который распознает определенные белки и доставляет их в нужное место в клете - в общем, делает полезное дело), т.к. последовательности нуклеотидов достаточно схожи. Alu не кодируют белки и для передвижения по геному используют, как предполагается, белки элементов L1.

По малым вариациям в нуклеотидной последовательности L1- и Alu-повторы разделяют на кучу подсемейств. Необычной находкой является то, что эти подсемейства не образуют типичные филогенетические связи с разветвлениями, как гены или виды, когда два новых подсемейства происходят от одного предкового. Вместо этого они образуют линейную иерархию, в которой каждое подсемейство представляет собой единственное промежуточное звено между дочерним и родительским. Одно из таких подсемейств - Alu Yb - распространилось до 2000 копий исключительно в геноме человека за последние несколько миллионов лет, т.к. в геномах всех остальных приматов оно отсутствует. Но как именно повлияли Alu- и L1-элементы на эволюцию человека, и связаны ли они вообще с "очеловечиванием" - вопрос открытый.

Напоследок еще одно интересное наблюдение. Полгода назад я написал про универсальный, но малоизвестный феномен
второго правила Чаргаффа
. Согласно этому правилу, любой олигонуклеотид представлен примерно в одинаковых количествах в обеих цепочках ДНК. Так вот, любой транспозон - это тоже олигонуклеотид. Поэтому их тоже должно быть примерно одиаковое количество на обеих цепочках. И действительно, например, в первой хромосоме прямых Alu-повторов у меня насчиталось 41421, комплементарных - 41441. Т.е. разница составляет всего 20 штучек, при общем числе в десятки тысяч. Для других хромосом разница также составляет 0.01-0.1% (разумеется, все Alu-повторы идентифицировать трудно, т.к. они могу содержать уже значительные отличия от канонической последовательности). Но это тот случай, когда не совсем понятно - это статистическая тривиальность или какая-то закономерность. Если бы не существовало второго правила Чаргаффа, это была бы, скорее всего, статистическая тривиальность. Но правило есть и оно само по себе нетривиально. При этом по наиболее распространенной гипотезе это правило объясняется случайными инверсиями. Но тогда непонятно - что заставляет транспозоны распределяться между цепочками ДНК настолько равномерно, чтобы не нарушать это правило?

А вот так выглядит наш геном если его представить не линейно, а в виде развертки, как в телевизоре или текстовом редакторе - строка заканчивается и ДНК-овый текст продолжается со следующей строки и т.п. На кликабельном рисунке показано примерно 2% первой хромосомы. Каждая точка - это одно основание. T - зеленые точки, C - желтые, А - красные, G - синие. Черная полоса - несеквенированная область. Число оснований в каждой строке - 1405. Над черной полосой видны в виде столбиков тандемные повторы.
 

А это тот же самый участок, на котором обозначено положение Alu-повторов (зеленые линии) и кодирующих экзонов (желтые). Каждая зеленая линия имеет длину 280 оснований.



This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting

December 2021

S M T W T F S
    1234
567891011
12131415161718
19202122232425
262728293031 

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 15th, 2025 03:41 am
Powered by Dreamwidth Studios