bogdan_63: (На работе)
[personal profile] bogdan_63
Оригинал взят у [livejournal.com profile] galicarnax в О повторах в геноме человека

То, что в геноме человека существует достаточно много повторов - участков ДНК, разбросанных по геному во множественных копиях - было известно еще лет 40 назад. Но весь масштаб происходящего был понят после полного секвенирования генома в 2000-х гг., когда выяснилось, что не менее чем на половину он состоит из повторов разного типа. Это, конечно, был сюрприз. Весь геном человека и без того весит 750 Мбайт - аккурат на одну CD-болванку. А тут еще оказывается, что его информация так избыточна...
Впрочем, обнаруженное количество генов тоже порадовало. Думали, что в геноме более сотни тысяч генов, а оказалось всего-то около 24 тысяч. Примерно столько же, сколько у червяка-нематоды (20 тыс.) и даже меньше, чем у травки арабидопсиса (26 тыс.). Ситуацию немного спасает альтернативный сплайсинг - примерно каждый второй ген человека кодирует не один белок, а сразу несколько (обычно родственных по функциям). Получается это комбинированием разных экзонов одного гена при сооружении мРНК. У червяка альтернативный сплайсинг тоже имеется, но используется реже, чем у человека. В итоге, при одном и том же числе генов количество разных типов белков у человека все же больше, чем у червяка. И это радует. Но вернемся к повторам.

Повторы есть практически во всех геномах. Особенно они изобильны у некоторых растений. Геном пшеницы состоит вообще на 90% из повторов
.

Повторяющиеся последовательности можно поделить на:
  1. Транспозоны - участки ДНК, которые могут передвигаться по геному. Передвигаются они с помощью специальных белков - транспозаз, которые в большинстве случаев закодированы в самих транспозонах. Длина транспозонов - от сотен до нескольких тысяч нуклеотидов.
  2. Сегментные дупликации. Это большие блоки хромосом, длиной от десятков тысяч до десятков миллионов нуклеотидов, которые присутствуют в двух-трех копиях в геноме. Их последовательности идентичны между собой на 80-100%. Например, в геноме человека имеется кусок длиной около 1.5 млн. оснований, повторяющийся один-в-один в хромосомах X и Y.
  3. Тандемные повторы. Это участки, в которых небольшая последовательность-шаблон (от двух до десятков оснований) повторяется тандемно, одна за другой, сотни и тысячи раз. Например: ...ATTGATTGATTGATTGATTGATTG... Особенно изобильны тандемные повторы в центромерах хромосом, где они несут структурную функцию.

Вот из чего состоит наш геном:

 
Дальше немного подробнее о транспозонах.

Передвижение транспозонов не следует понимать как постоянно происходящий в клетках процесс. В плане отдельных особей это редкое явление. Например, у человека каждая новая вставка Alu-повтора происходит примерно один раз на двести рождений. Однако в плане эволюции популяции распространение транспозонов может быть почти молниеносным, как показывает пример
P-элементов у дрозофил. Эти транспозоны расплодились в геноме несчастных мух, по всей видимости, где-то в середине 20 века.

Транспозоны можно разделить на два класса: ДНК-транспозоны и ретротранспозоны. ДНК-транспозоны вырезаются прямо из ДНК и вставляются в другое место. Таким образом, они передвигаются по принципу cut-and-paste. Сейчас, по всей видимости, они неактивны. Ретротранспозоны размножаются через РНК-посредник. Сначала с ДНК снимается копия в виде РНК, потом с РНК идет обратная транскрипция (отсюда "ретро") - создается копия ДНК в другом месте генома. Т.е. они передвигаются по принципу copy-and-paste.

Сами ретротранспозоны можно далее разделить на два класса - содержащие
длинные концевые повторы (LTR - long terminal repeats) и те, что без них. LTR-транспозоны имеют большое сходство с некоторыми ретровирусами, составляют около 8% генома человека и также сейчас почти не проявляют активности. Произошли ли они от вирусов, или вирусы от них - вопрос нерешенный. Вирусы, помимо белков-помощников, кодируют еще как минимум белки для своей оболочки.

Особенно интересны ретротранспозоны без LTR - именно они наиболее многочисленны. К тому же имеются однозначные данные о том, что они не только активны, но и могут приводить к генетическим заболеваниям, включая рак. У человека два основных типа таких транспозонов - L1 и Alu.

L1-элементы имеют длину около 6 тыс. оснований и кодируют два белка, с помощью которых они распространяются. Число их в геноме - около полмиллиона штук. Хотя активно из них менее ста (остальные инактивированы мутациями).

Alu-повторы имеют длину 280 оснований, а число их копий в геноме составляет около 1,1 миллиона. Alu-повторы имеются только в линии приматов. Предполагается, что они появились в результате дупликации гена 7SL RNA (он кодирует РНК, входящую в состав молекулярного комплекса
SRP, который распознает определенные белки и доставляет их в нужное место в клете - в общем, делает полезное дело), т.к. последовательности нуклеотидов достаточно схожи. Alu не кодируют белки и для передвижения по геному используют, как предполагается, белки элементов L1.

По малым вариациям в нуклеотидной последовательности L1- и Alu-повторы разделяют на кучу подсемейств. Необычной находкой является то, что эти подсемейства не образуют типичные филогенетические связи с разветвлениями, как гены или виды, когда два новых подсемейства происходят от одного предкового. Вместо этого они образуют линейную иерархию, в которой каждое подсемейство представляет собой единственное промежуточное звено между дочерним и родительским. Одно из таких подсемейств - Alu Yb - распространилось до 2000 копий исключительно в геноме человека за последние несколько миллионов лет, т.к. в геномах всех остальных приматов оно отсутствует. Но как именно повлияли Alu- и L1-элементы на эволюцию человека, и связаны ли они вообще с "очеловечиванием" - вопрос открытый.

Напоследок еще одно интересное наблюдение. Полгода назад я написал про универсальный, но малоизвестный феномен
второго правила Чаргаффа
. Согласно этому правилу, любой олигонуклеотид представлен примерно в одинаковых количествах в обеих цепочках ДНК. Так вот, любой транспозон - это тоже олигонуклеотид. Поэтому их тоже должно быть примерно одиаковое количество на обеих цепочках. И действительно, например, в первой хромосоме прямых Alu-повторов у меня насчиталось 41421, комплементарных - 41441. Т.е. разница составляет всего 20 штучек, при общем числе в десятки тысяч. Для других хромосом разница также составляет 0.01-0.1% (разумеется, все Alu-повторы идентифицировать трудно, т.к. они могу содержать уже значительные отличия от канонической последовательности). Но это тот случай, когда не совсем понятно - это статистическая тривиальность или какая-то закономерность. Если бы не существовало второго правила Чаргаффа, это была бы, скорее всего, статистическая тривиальность. Но правило есть и оно само по себе нетривиально. При этом по наиболее распространенной гипотезе это правило объясняется случайными инверсиями. Но тогда непонятно - что заставляет транспозоны распределяться между цепочками ДНК настолько равномерно, чтобы не нарушать это правило?

А вот так выглядит наш геном если его представить не линейно, а в виде развертки, как в телевизоре или текстовом редакторе - строка заканчивается и ДНК-овый текст продолжается со следующей строки и т.п. На кликабельном рисунке показано примерно 2% первой хромосомы. Каждая точка - это одно основание. T - зеленые точки, C - желтые, А - красные, G - синие. Черная полоса - несеквенированная область. Число оснований в каждой строке - 1405. Над черной полосой видны в виде столбиков тандемные повторы.
 

А это тот же самый участок, на котором обозначено положение Alu-повторов (зеленые линии) и кодирующих экзонов (желтые). Каждая зеленая линия имеет длину 280 оснований.



June 2017

S M T W T F S
     1 2 3
4 5 678910
11121314151617
18192021222324
252627282930 

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Oct. 17th, 2017 07:44 am
Powered by Dreamwidth Studios