Contribution of the intron retained in the Nxf1 gene transcript to the phylogeny of the order Chiroptera

Cover Page


Cite item

Full Text

Open Access Open Access
Restricted Access Access granted
Restricted Access Subscription or Fee Access

Abstract

This work is devoted to the possibilities of using a specific intron-containing block of the Nxf1 gene in phylogenetic studies.

Our attention was drawn to the conservative intron of the Nxf1 (nuclear export factor) gene. This intron is a part of an evolutionarily conserved block formed with flanking 110 bp and 37 bp exons, similar in representatives of various taxonomic groups. This evolutionary conservative block in our previous works was designated “cassette intron”. The Nxf1 genes are found in all representatives of Opisthokonta, and may be a convenient object for phylogenetic studies.

The Nxf1 gene sequences of seventeen representatives of the order Chiroptera obtained from publicly available databases (ensembl, ncbi). Alignment algorithm: MUSCLE. Programs: MEGA-X version 10.1.7, IQTree, Mesquite, MrBayes, and FigTree.v1.4.4. Estimation methods: Maximum Likelihood and Bayes Inference.

The use of Nxf1 gene sequences that include only exons or only introns leads to unequal loss of accuracy in establishing evolutionary relationships in comparison with the model based on the complete gene sequence. Sequences involving all exons plus a cassette intron give the same result as the complete Nxf1 gene sequence.

The obtained results indicate the importance of the cassette intron in the evolution of the Nxf1 gene of Chiroptera.

Full Text

Ген Nxf1 — наиболее древний представитель эволюционно-консервативного мультигенного семейства Nxf (nuclear export factor) [1], он кодирует белок, который за счет взаимодействия с различными кофакторами обеспечивает ядерно-цитоплазматический экспорт мРНК, причем в этом процессе ему отводится критически важная роль [1–3]. В случае нокдауна Nxf1 наблюдается полная остановка роста клетки и накопление поли-(A)-мРНК в ядре [4]. Размер семейства Nxf может варьировать, включая от одного до пяти генов-паралогов у разных представителей группы Unikonta, а ген Nxf1 как наиболее консервативный является основоположником генного семейства. Отмечается тенденция к увеличению числа генов-паралогов у высокоорганизованных эукариот [1]. Предположительно, паралоги выполняют специализированные функции [5], в том числе доказана тканеспецифичность отдельных паралогов [1, 6]. Существование генов-паралогов — не единственный механизм расширения спектра функций генов в рамках этого семейства. У Drosophila melanogaster функции паралогов могут исполнять специализированные транскрипты гена Nxf1 [5, 7]. Увеличение числа интронов способствует повышению вариативности транскриптов, обеспечивая эволюционное преимущество за счет увеличения вариантов сплайсинга [8].

Одна из характерных эволюционно-консервативных особенностей гена Nxf1 и его ортологов у различных представителей Opisthokonta — наличие интрон-содержащего транскрипта, возникающего в результате альтернативного сплайсинга [9]. Примечательно, что сохранение интрона считается наиболее редким [10] и наименее изученным [11] типом альтернативного сплайсинга. Несмотря на то что функциональное значение сохранения интрона ранее оставалось недооцененным, в настоящее время установлен значительный вклад этого явления. Сохранение интрона является независимым механизмом регуляции работы генов и может дополнять другие типы посттранскрипционной регуляции экспрессии генов, такие как альтернативный сплайсинг экзонов, что было показано, например, при исследовании эритроцитов [11, 12]. Таким образом, можно считать, что сохранение интрона как механизм, позволяющий увеличить сложность процессов регуляции генов, способствует также и увеличению адаптационного потенциала организма.

Доказано существование интрон-содержащего транскрипта у мышей [6], человека [13] и дрозофилы [5]. При этом также установлен факт преобладания интрон-содержащего транскрипта в тканях головы Drosophila melanogaster [5]. Было также отмечено присутствие интрон-содержащего транскрипта в неокортикальных нейронах и в нейронах гиппокампа у крыс [14]. Примечателен тот факт, что этот интрон, вместе с окружающими его экзонами, образует эволюционно-консервативный интрон-экзонный блок, который принимает вид: экзон 110 п. н. – интрон – экзон 37 п. н., схожий у представителей различных таксономических групп. Этот интрон было предложено называть «кассетным» [9]. В генах Nxf1 позвоночных — это интрон 10, а в генах Nxf1 дрозофилид — интрон 5. [9]. Участки геномной последовательности, участвующие в альтернативном сплайсинге, демонстрируют повышенные уровни геномной консервативности по сравнению с конститутивно сплайсируемыми экзонами [10]. Последовательность кассетного интрона гена Nxf1 можно отнести именно к такому типу последовательностей [9]. В сохраняемом интроне содержится преждевременный стоп-кодон. Транскрипты с сохраненным интроном в норме подвергаются NMD (Nonsense Mediated Decay). Кроме того, транскрипты, содержащие преждевременный стоп-кодон, сохраняются с более низкой частотой, предположительно, это может быть связано с наличием отбора в отношении потенциала кодирования (selective pressure for coding potential) [15], однако высокое содержание в цитоплазме транскрипта гена NXF1, сохраняющего интрон, позволяет предположить наличие механизмов, позволяющих избегать NMD [16]. Эту функцию у позвоночных могут исполнять CTE (Constitutive Transport Element), проявляющий сходство с вирусной последовательностью и обеспечивающий ядерный экспорт несплайсированной РНК [13], а у дрозофилид поли-(A)-последовательности [9]. Это особые консервативные участки последовательности интрона. Наличие различных механизмов, способствующих сохранению интрон-содержащего транскрипта, включающего преждевременный стоп-кодон у позвоночных и дрозофилид, позволяет предположить конвергентную эволюцию последовательности гена Nxf1.

В настоящее время интрон-содержащие последовательности широко используются в молекулярной филогенетике [17–19]. Использование данных последовательностей на практике часто сопряжено с рядом методических трудностей, но многие из них были успешно преодолены [20]. Тем не менее поиск генов, пригодных для использования в качестве филогенетических маркеров, все еще остается актуальной задачей. Мы предполагаем, что использование определенных последовательностей различных участков гена Nxf1 в этом качестве может иметь определенные перспективы.

В данном исследовании выбор в пользу филогении отряда Chiroptera был сделан по ряду причин. Филогения Chiroptera представляет интерес в том числе и для эпидемиологических исследований, так как среди представителей спорных групп есть переносчики опасных вирусов [21]. В этом плане ген Nxf1 представляет отдельный интерес в качестве объекта, поскольку доказано, что он важен в переносе вирусных РНК [22], кроме того, установлено его участие в переносе РНК вируса Эболы [23], основные распространители которого — представители Chiroptera. Как отмечалось в статье N.M. Foley и соавт. [21], более четкое понимание филогении Chiroptera может иметь значение для эпидемиологов при прогнозировании переноса SARS-подобных вирусов.

В качестве материалов использовали восемь вариантов последовательности генов Nxf1 (рис. 1) 17 представителей отряда Chiroptera, полученные из общедоступных баз данных. В табл. 1 представлены ссылки на анализируемые последовательности NCBI.

 

Таблица 1. Виды, задействованные в ходе эксперимента

Table 1. List of species used in the experiment

Семейство

Вид

Номер депонирования (accession number) в NCBI

Homo*

Homo sapiens

NC_000011.10:c62805440-62792130

Rattus*

Rattus norvegicus

NC_051336.1:205655442-205668637

Phyllostomidae

Artibeus jamaicensis

NW_023542419.1:890903-901045

Phyllostomidae

Desmodus rotundus

NW_020093552.1:c2039064-2029125

Vespertilionidae

Eptesicus fuscus

NW_007370967.1:192470-202877

Hipposideridae

Hipposideros armiger

NW_017731443.1:3872791-3884027

Miniopteridae

Miniopterus natalensis

NW_015504634.1:775345-784658

Molossidae

Molossus molossus

NW_023425348.1:c89303232-89290032

Vespertilionidae

Myotis brandtii

NW_005353800.1:c360404-351295

Vespertilionidae

Myotis davidii

NW_006297142.1:c1278961-1266477

Vespertilionidae

Myotis lucifugus

NW_005871779.1:34512-44765

Vespertilionidae

Myotis myotis

NW_023416332.1:224423-235058

Phyllostomidae

Phyllostomus discolor

NC_040908.2:c164004956-163994433

Vespertilionidae

Pipistrellus kuhlii

NW_023425561.1:c1148265-1132082

Pteropodidae

Pteropus alecto

NW_006435764.1:7215211-7225001

Pteropodidae

Pteropus vampyrus

NW_011888925.1:c1209758-1199949

Rhinolophidae

Rhinolophus ferrumequinum

NC_046294.1:8038466-8048415

Pteropodidae

Rousettus aegyptiacus

NW_023416308.1:c114932923-114923249

Phyllostomidae

Sturnira hondurensis

NW_023514227.1:c335816-325631

*Виды, использованные в качестве представителей внешних групп.

 

Методы выравнивания нуклеотидных последовательностей

Выравнивание нуклеотидных последовательностей проводили в программе MEGA-X [24] версии 10.1.7 с помощью алгоритма MUSCLE [25] с использованием настроек по умолчанию (GAP Open-400, 16 итераций). В качестве метода кластеризации использовали UPGMA [26].

По результатам выравнивания, вручную с опорой на модель интрон-экзонной структуры гена Hs Nxf1, воссоздавали модель интрон-экзонной структуры гена Nxf1 исследуемых рукокрылых.

С учетом известной интрон-экзонной структуры последовательности гена Nxf1 анализировали восемь вариантов последовательностей (рис. 1).

 

Рис. 1. Варианты последовательностей, используемых в эксперименте. 1 — Полная последовательность гена; 2 — последовательность, содержащая только экзоны; 3 — последовательность, содержащая только экзоны и интрон 10; 4 — последовательность, содержащая только интрон 10 и окружающие его экзоны (10 и 11); 5 — последовательность, соответствующая интрону 10 (кассетному интрону); 6 — последовательность, соответствующая экзонам 10 и 11; 7 — последовательность гена, исключающая только интрон 10 (кассетный интрон); 8 — последовательность, включающая только интроны, кроме интрона 10 (кассетного интрона). В составе последовательностей учтены некодирующие экзоны 5' и 3' концов

Fig. 1. Variants of the sequence used in the experiment. 1 — Full-gene sequence; 2 — exons only; 3 — exons and intron 10; 4 — intron 10 and exons 10, 11; 5 — intron 10 (cassette intron); 6 — exons 10, 11; 7 — excluding intron 10 (cassette intron); 8 — only introns, except intron 10 (cassette intron). Non-coding exons at the 5' and 3' ends are including in sequences

 

На основании каждого из восьми вариантов последовательностей, с целью проследить изменение точности филогенетической реконструкции, были построены филогенетические деревья.

Филогенетический анализ нуклеотидных последовательностей

Для построения филогенетических деревьев и их последующего редактирования применяли программы: MEGA-X [24], Mesquite [27], MrBayes [28] и FigTree.v1.4.4. [29], а также методы максимального правдоподобия (Maximum Likelihood) и Байеса (Bayes Inference).

При построении филогенетических деревьев по методу максимального правдоподобия (Maximum Likelihood) использовали программу IQTree [30]. Оптимальная эволюционная модель подбиралась для каждого множественного выравнивания, соответствующего одному из восьми вариантов последовательностей с помощью алгоритма ModelFinder [31]. Лучшую схему моделей нуклеотидных замен определяли по трем параметрам: Akaike Information Criterion (AIC) [32], Corrected Akaike Information Criterion (AICc), Bayesian Information Criterion (BIC) [33]. Основным параметром выступал BIC. Оптимальные модели представлены в табл. 2.

 

Таблица 2. Оптимальные модели замен для метода максимального правдоподобия (Maximum Likelihood), полученные с помощью алгоритма ModelFinder на основе критерия BIC

Table 2. The best evolutionary models for each variant of sequence were found by ModelFinder. The choice was made in favor of models that minimize the Bayesian information criterion (BIC)

Множественное выравнивание варианта последовательности

Модель замен (Substitution model)

1. Полная последовательность гена

TIM+F+I+G4

2. Только экзоны

TIM3e+G4

3. Только экзоны + интрон 10

K3Pu+F+G4 [34]

4. Только экзон 10, интрон 10 и экзон 11

K3Pu+F+G4

5. Только интрон 10

K3Pu+F+G4

6. Только экзоны 10 и 11

K2P+G4 [35]

7. Все, кроме интрона 10

K3Pu+F+I+G4

8. Только интроны, кроме интрона 10

TPM3+F+G4

 

Для статистической поддержки максимального правдоподобия в программе IQ-Tree были использованы два коэффициента: SH-like approximate likelihood ratio test (SH-aLRT, 1000 репликаций) [36] и сверхбыстрый бутстреп (UfBoot, 500 псевдореплик) [37, 38].

Метод Байеса при построении филогенетических деревьев предполагает иной набор моделей замен. Параметры для MrBayes задавались с помощью программы Mesquite [27]. Мы применили модель GTR+I+G (General time reversible — GTR) [39, 40], учитывалось шесть видов замещения и комбинация модели неизменяющихся сайтов (Proportion of Invariable Sites) с гамма-моделью (+I+G, rates = invgamma) [37]). При оценке филогенетической реконструкции достоверными считали коэффициенты поддержки более 80 для SH-like aLRT [38, 41] и более 95 — для UfBoot [42]. При оценке филогенетических реконструкций, полученных с помощью метода Байеса, достоверными были значения апостериорной вероятности более 80 % и более 90 %.

Филогенетический анализ видов отряда Chiroptera

Характеристика выравниваний. Для проведения выравнивания последовательностей применены настройки по умолчанию: GAP Open-400, 16 итераций. Характеристика выравниваний представлена в табл. 3.

 

Таблица 3. Характеристика множественных выравниваний

Table 3. The multiple alignments characteristic

Вариант последовательности

Пары оснований, п. н.

Консервативные сайты, п. н.

Вариабельные сайты, п. н.

Информативные сайты, п. н.

Однонуклеотидные вариации (SNP = SNV), п. н.

1. Полная последовательность гена

31570

5833

10373

4219

4692

2. Только экзоны

1976

1202

655

401

254

3. Только экзоны + интрон 10

4168

2230

1491

849

638

4. Только экзон 10, интрон 10 и экзон 11

2326

1118

895

477

409

5. Только интрон 10

2177

1018

846

443

396

6. Только экзоны 10 и 11

147

95

52

32

20

7. Все, кроме интрона 10

29185

5031

9261

3656

4053

8. Только интроны, кроме интрона 10

24081

4241

7771

3023

2917

 

Полная последовательность гена Nxf1

На 2019–2020 гг. в базах данных GenBank установлены последовательности гена Nxf1 различной степени полноты для 17 представителей отряда Chiroptera, относящихся к семи различным семействам: Phyllostomidae, Vespertilionidae, Miniopteridae, Molossidae, Hipposideridae, Rhinolophidae, Pteropodidae. Кроме того, в качестве внешних групп, на филогенетическом дереве изображены отряд приматы, представленный Homo sapience, и отряд грызуны, представленный Rattus norvegicus.

Все филогенетические деревья, полученные на основе полной последовательности гена Nxf1, имеют высокий уровень поддержки топологии, максимально возможный или близкий к нему. Общий характер ветвления, подробно описанный на примере последовательности полного гена, остается неизменным в большинстве случаев. Полученная схема поддерживает разделение на клады Yinpterochiroptera и Yangochiroptera (рис. 2) [43, 44]. Yinpterochiroptera подразделяется на две ветви, первая — представлена семейством Phyllostomidae (Artibeus jamaicensis, Desmodus rotundus, Phyllostomus discolor, Sturnira hondurensis), а вторая — образована тремя монофилитическими семействами (Vespertilionidae, Miniopteridae, Molossidae), при этом Molossidae занимает базальное, по отношению к Vespertilionidae и Miniopteridae, положение, что согласуется с данными литературы [45, 46]. Стоит отметить, что на настоящий момент нет единого мнения, какая из этих групп должна занимать базальное положение, например, в более поздней работе [47] было высказано предположение, что ранее всех обособилась группа Miniopteridae, однако сами авторы подчеркивают, что в виду особенностей дизайна эксперимента полученная схема дает лишь приблизительную оценку филогенетических отношений внутри отряда. Семейства Miniopteridae и Molossidae представлены каждое одним видом (Miniopterus natalensis и Molossus molossus соответственно), в то время как Vespertilionidae — шестью (Myotis brandtii, Myotis davidii, Myotis lucifugus, Myotis myotis, Pipistrellus kuhlii, Eptesicus kuhli). В пределах семейства также наблюдается разделение на три рода (Myotis, Eptesocus и Pipistrellus). Хотя в нашем исследовании набор представителей семейства Vespertilionidae ограничен и представлены не все рода, наблюдается сходство с результатами филогенетического анализа данного семейства, проведенного на большей выборке видов при использовании митохондриальной ДНК [48]. Результаты этого анализа подтверждают монофилию Vespertilioninae. По нашим данным, группа Yinpterochiroptera, в свою очередь, делится на две клады. Клада Rhinolophoidea представлена двумя видами, относящимися к двум разным семействам (Rhinolophidae, Rhinolophus ferrumequinum и Hipposideridae, Hipposideros armiger), и Pteropodoidae, представленная тремя видами (Pteropus alecto, Pteropus vampyrus и Rousettus aegyptiacus), относящимися к одному семейству Pteropodidae.

Вариант последовательности гена, содержащей только экзоны

Топология, построенная на основе варианта последовательности гена, исключающей интроны, в целом, соответствует варианту, полученному на основе полной последовательности гена, за исключением резкого падения коэффициента поддержки в узле Vespertilionidae/Miniopteridae — SH-Like aLTR/Bootstrap = 59,5/54 по сравнению с SH-Like aLTR/Bootstrap = 99,4/100 в случае топологии, построенной на основе последовательности полного гена (рис. 3). Это позволяет относить этот узел к неразрешенным. Отмечается также небольшое снижение точности в других узлах, но значения коэффициентов поддержки и апостериорной вероятности все еще стабильно остаются достаточно высокими и не опускаются ниже 80 % в случае методов максимального правдоподобия и 0,95 для значения апостериорной вероятности, так что эти изменения можно считать несущественными.

Вариант последовательности гена, содержащей только экзоны и интрон 10

Топология, построенная на основе варианта последовательности гена, где сохранен только кассетный интрон (Приложение 1), соответствует варианту, полученному на основе полной последовательности (рис. 2), и выгодно отличается от топологии, построенной на основе варианта последовательности гена, не включающей интроны (рис. 3), поскольку значение коэффициента поддержки в узле Vespertilionidae/Miniopteridae, который оставался неразрешенным при использовании варианта последовательности, не включающей интроны, остается крайне высоким для методов максимального правдоподобия (SH-Like aLTR/Bootstrap = 94,2/100), а значение апостериорной вероятности по Байесу равно единице.

 

Рис. 2. Филогенетическое дерево, построенное на основе полных последовательностей гена Nxf1 различных представителей отряда Chiroptera с помощью методов максимального правдоподобия и Байеса. Коэффициенты поддержки обозначены как SH-Like aLTR/Bootstrap и значение апостериорной вероятности по Байесу. Цветом выделены области дерева, соответствующие крупным семействам, внутри которых порядок ветвления остается неизменным во всех рассматриваемых схемах или причины его нарушения установлены и отдельные узлы можно считать разрешенными. Приведенные выше обозначения общие для этого и всех последующих рисунков

Fig. 2. Phylogenetic tree based on the full-gene sequence variant of the Chiroptera’s Nxf1 gene. The tree was constructed by maximum likelihood and Bayesian methods. Support ratios are denoted as SH-Like aLTR/Bootstrap and the Bayesian posterior value. Large families are color coded. The branch order within highlighted areas remains unchanged in all considered schemes or the reasons for its violation are determined and individual nodes can be considered allowed. The above designations are common to this and all following figures

 

Рис. 3. Филогенетическое дерево, построенное на основе варианта последовательности гена Nxf1, содержащей только экзоны, для различных представителей отряда Chiroptera, с помощью методов максимального правдоподобия и Байеса

Fig. 3. Phylogenetic tree based on the “only exons” sequence variant of the Chiroptera’s Nxf1 gene

 

Вариант последовательности, содержащей только интрон 10 и окружающие его экзоны (10 и 11)

Топология, построенная на основе варианта последовательности, соответствующей эволюционно-консервативному блоку, образованному кассетным интроном и окружающими его экзонами, отличается от варианта, полученного на основе полной последовательности гена, за исключением двух узлов, которые остаются неразрешенными (рис. 4). Схема все еще поддерживает разделение на Yinpterochiroptera и Yangochiroptera, однако установить порядок ветвления в пределах Yinpterochiroptera, опираясь на полученные данные, не представляется возможным, поскольку узел, отображающий разделение Yinpterochiroptera на две клады Rhinolophoidea и Pteropodoidae, имеет низкое значение поддержки (39.5/57/0.67). Случаи подобного падения точности при определении положения групп, находящихся в основании филогенетического дерева при использовании интронных и интрон-содержащих последовательностей, отмечались и в других исследованиях [49] и, предположительно, связаны с более высокой скоростью эволюции таких последовательностей.

Вариант последовательности, соответствующей интрону 10 (кассетному интрону)

Топология отличается от варианта, полученного на основе полной последовательности гена. Не поддерживает разделение на Yinpterochiroptera и Yangochiroptera, Rhinolophoidea определяется как парафилитическая по отношению к Pteropodidae с низким уровнем поддержки (SH-Like aLTR/Bootstrap = 61,4/70 и 0,70), из чего следует, что на основе этого варианта последовательности не представляется возможным определить принадлежность Rhinolophoidea к Yinpterochiroptera или Yangochiroptera. Порядок ветвления в пределах рода Myotis пришел в соответствие с полученным для топологии, основанной на полной последовательности гена, однако значения поддержки все еще недостаточно высокие (SH-Like aLTR/Bootstrap = 25,4/55 и 0,71), чтобы можно было считать эту ветвь разрешенной (Приложение 2).

Вариант последовательности, соответствующей экзонам 10 и 11

Схемы, построенные на основе варианта последовательности, соответствующей экзонам 10 и 11, не имели достаточного филогенетического сигнала, по-видимому, это связанно с малой длинной (147 п. н.) этой последовательности, также, вероятно, ее значительная консервативность препятствует получению адекватной топологии (Приложение 3). Поскольку варианты последовательности, соответствующие кассетному интрону и кассетному интрону с экзонами 10 и 11, имеют минимальные отличия, и адекватной топологии, построенной лишь на основе последовательности этих экзонов, получить не удалось, в дальнейшем эти варианты обсуждаться не будут.

Вариант последовательности гена, исключающей только интрон 10 (кассетный интрон)

Топология, построенная на основе варианта последовательности гена, исключающей кассетный интрон (Приложение 4), соответствует схемам, построенным на основе полной последовательности гена (рис. 2), и варианта последовательности, где из интронов сохранен только кассетный (Приложение 1). Характер ветвления совпадает, значения поддержки в каждом отдельном узле высокие.

Вариант последовательности, включающей только интроны, кроме интрона 10 (кассетного интрона)

Топология, построенная на основе варианта последовательности, включающей только интроны, за исключением кассетного (Приложение 5), демонстрирует сходство с топологиями, построенными на основе варианта последовательности, соответствующей эволюционно-консервативному блоку, образованному кассетным интроном и фланкирующими его экзонами (рис. 4), а также варианта последовательности, соответствующей кассетному интрону (Приложение 2). Так же как в двух описанных выше случаях, не удается разрешить разделение в пределах Yinpterochiroptera, узел, отображающий разделение на клады Rhinolophoidea и Pteropodoidae, имеет низкое значение поддержки (50.2/50/0.72).

 

Рис. 4. Филогенетическое дерево, построенное на основе варианта последовательности гена Nxf1, содержащей только интрон 10 и окружающие его экзоны (10 и 11), для различных представителей отряда Chiroptera, с помощью методов максимального правдоподобия и Байеса

Fig. 4. Phylogenetic tree based on the “intron 10 and exons 10, 11” sequence variant of the Chiroptera’s Nxf1 gene

 

Интроны несут определенный филогенетический сигнал, и их присутствие в исходной последовательности влияет на точность конечной схемы

Топологии, построенные на основе последовательности полного гена, варианта последовательности гена, где представлены все экзоны и только кассетный интрон, а также варианта последовательности гена, исключающей только кассетный интрон, проявляют значительное сходство. Полученные филогенетические деревья не имеют неразрешенных узлов и в значительной степени соответствуют современным представлениям о систематике Chiroptera. Стоит отметить, что схемы, построенные на основе последовательностей, включающих как экзоны, так и интроны, оказались наиболее точными, в то время как на схеме, полученной при использовании варианта последовательности гена, исключающей интроны, был получен неразрешенный узел Vespertilioidae/Molossidae. Примечательно, что кассетный интрон имеет влияние на точность схемы, сопоставимое по своей силе с суммарным влиянием всех остальных интронов гена.

Интронные и экзонные последовательности имеют качественные отличия по своему филогенетическому сигналу

При использовании варианта последовательности, соответствующей кассетному интрону, а также варианта последовательности, включающей только интроны, за исключением кассетного, не удается установить положение группы Rhinolophoidea, однако узел Vespertilioidae/Molossidae, который оставался неразрешенным при использовании варианта последовательности, исключающей интроны, сохраняет высокие значения поддержки во всех топологиях, основанных на вариантах последовательностей, включающих интроны. В свою очередь на схеме, основанной на варианте последовательности гена, исключающей интроны, положение группы Rhinolophoidea определяется корректно с достаточным уровнем поддержки. На основании полученных результатов можно констатировать факт снижения точности схем, причем наблюдаются качественные различия — неразрешенные узлы на филогенетических деревьях не совпадают, из чего следует вывод о качественных различиях между филогенетическими сигналами интронных и экзонных последовательностей. Филогенетический сигнал последовательностей, соответствующих эволюционно-консервативному блоку, образованному кассетным интроном и фланкрирующими его экзонами, кассетному интрону, а также всем интронам, кроме кассетного, имеет качественные отличия от филогенетического сигнала варианта последовательности гена, исключающей интроны. В случае трех вариантов последовательностей, где учитывался филогенетический сигнал интронов, мы получили надежное разрешение узла Vespertilioidae/Molossidae, достаточно близких семейств. Это считается основанием для предположения, что интрон-содержащие последовательности особенно важно учитывать при работе с близкородственными группами. В свою очередь, вариант последовательности, исключающей интроны, позволял надежно определить положение группы Rhinolophoidea, чего не удавалось сделать, основываясь исключительно на вариантах интрон-содержащих последовательностей. Однако стоит отметить, что этот результат характерен и для комбинированных вариантов, сочетающих как интронные, так и экзонные последовательности, что свидетельствует в пользу предпочтительного использования именно комбинированных вариантов.

Стоит также отметить, что схема, построенная на основе исключительно последовательности кассетного интрона, по своей точности не уступает схеме, основанной на последовательности всех интронов гена, за исключением кассетного. Таким образом, филогенетический сигнал кассетного интрона сопоставим с совокупным вкладом всех интронов гена, о чем можно также судить, сопоставляя филогенетические деревья, основанные на варианте последовательности, исключающей все интроны, кроме кассетного, и варианте последовательности, где исключен только кассетный интрон.

Полученные результаты могут свидетельствовать о значимости кассетного интрона в эволюции гена Nxf1 у Chiroptera.

ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ

Вклад авторов. Все авторы внесли существенный вклад в разработку концепции, проведение исследования и подготовку статьи, прочли и одобрили финальную версию перед публикацией. Вклад авторов: Д.Д. Бондарук — написание основного текста статьи, биоинформатическая обработка материалов, анализ полученных результатов, обсуждение результатов; Е.В. Голубкова — руководство, редактирование текста, обсуждение результатов; Л.А. Мамон — общее руководство, редактирование текста, обсуждение результатов.

Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией настоящей статьи.

Источник финансирования. Авторы заявляют об отсутствии внешнего финансирования при проведении исследования.

ADDITIONAL INFORMATION

Author contribution. Thereby, all authors made a substantial contribution to the conception of the work, acquisition, analysis, interpretation of data for the work, drafting and revising the work, final approval of the version to be published and agree to be accountable for all aspects of the work. Contribution of each author: D.D. Bondaruk — writing the main text of the article, bioinformatic processing of materials, analysis of the results, discussion of the results; E.V. Golubkova — guidance, text editing, discussion of the results; L.A. Mamon — general guidance, text editing, discussion of the results.

Competing interests. The authors declare that they have no competing interests.

Funding source. This study was not supported by any external sources of funding.

 

Приложение 1. Филогенетическое дерево, построенное на основе варианта последовательности, содержащей только экзоны и интрон 10 гена Nxf1 различных представителей отряда Chiroptera, с помощью методов максимального правдоподобия и Байеса

Примечание. Коэффициенты поддержки обозначены как SH-Like aLTR/Bootstrap и значение апостериорной вероятности по Байесу. Цветом выделены области дерева, соответствующие крупным семействам, внутри которых порядок ветвления остается неизменным во всех рассматриваемых филогенетических деревьях или причины его нарушения установлены и отдельные узлы можно считать разрешенными. Приведенные выше обозначения общие для этого и всех последующих рисунков.

Appendix 1. Phylogenetic tree based on the “exons and intron 10” sequence variant of the Chiroptera’s Nxf1 gene

Note. Support ratios are denoted as SH-Like aLTR/Bootstrap and the Bayesian posterior value. Large families are color coded. The branch order within highlighted areas remains unchanged in all considered schemes or the reasons for its violation are determined and individual nodes can be considered allowed. The above designations are common to this and all subsequent figures.

 

Приложение 2. Филогенетическое дерево, построенное на основе варианта последовательности, содержащей только интрон 10 гена Nxf1 различных представителей отряда Chiroptera, с помощью методов максимального правдоподобия и Байеса

Appendix 2. Phylogenetic tree based on the “only intron 10 (cassette intron)” sequence variant of the Chiroptera’s Nxf1 gene

 

Приложение 3. Филогенетическое дерево, построенное на основе варианта последовательности, содержащей только экзоны 10 и 11 гена Nxf1 различных представителей отряда Chiroptera, с помощью методов максимального правдоподобия и Байеса

Appendix 3. Phylogenetic tree based on the “exons 10, 11” sequence variant of the Chiroptera’s Nxf1 gene

 

Приложение 4. Филогенетическое дерево, построенное на основе варианта последовательности гена Nxf1, исключающей интрон 10, различных представителей отряда Chiroptera, с помощью методов максимального правдоподобия и Байеса

Appendix 4. Phylogenetic tree based on the “excluding intron 10 (cassette intron)” sequence variant of the Chiroptera’s Nxf1 gene

 

Приложение 5. Филогенетическое дерево, построенное на основе варианта последовательности, содержащей только интроны гена Nxf1, за исключением интрона 10, различных представителей отряда Chiroptera, с помощью методов максимального правдоподобия и Байеса

Appendix 5. Phylogenetic tree based on the “only introns, except intron 10 (cassette intron)” sequence variant of the Chiroptera’s Nxf1 gene

×

About the authors

Dmitrii D. Bondaruk

Saint-Petersburg State University

Author for correspondence.
Email: D.D.Bondaruk@yandex.ru
ORCID iD: 0000-0003-0265-5759
SPIN-code: 8162-8441

Postgraduate student

Russian Federation, Saint-Petersburg

Elena V. Golubkova

Saint Petersburg State University

Email: elena_golubkova@mail.ru
ORCID iD: 0000-0002-9528-5760
SPIN-code: 7386-1230
Scopus Author ID: 6602650894

Cand. Sci. (Biol.), Associate Professor, Department of Genetics and Biotechnology

Russian Federation, Saint Petersburg

Lyudmila A. Mamon

Saint Petersburg State University

Email: mamon@lm2010.spb.edu
ORCID iD: 0000-0001-5338-0703
SPIN-code: 7780-6907

Dr. Sci. (Biol.), Professor, Department of Genetics and Biotechnology

Russian Federation, Saint Petersburg

References

  1. Herold A, Suyama M, Rodrigues JP, et al. TAP (NXF1) belongs to a multigene family of putative RNA export factors with a conserved modular architecture. Mol Cell Biol. 2000;20(23):8996–9008. doi: 10.1128/MCB.20.23.8996-9008.2000
  2. Herold A, Teixeira L, Izaurralde E. Genome-wide analysis of nuclear mRNA export pathways in Drosophila. EMBO J. 2003;22(10):2472–2483. doi: 10.1093/emboj/cdg233
  3. Delaleau M, Borden KLB. Multiple Export Mechanisms for mRNAs. Cells. 2015;4(3):452–473. doi: 10.3390/cells4030452
  4. Herold A, Klymenko T, Izaurralde E. NXF1/p15 heterodimers are essential for mRNA nuclear export in Drosophila. RNA. 2001;7(12):1768–1780.
  5. Ivankova N, Tretyakova I, Lyozin GT, et al. Alternative transcripts expressed by small bristles, the Drosophila melanogaster nxf1 gene. Gene. 2010;458(1–2):11–19. doi: 10.1016/j.gene.2010.02.013
  6. Sasaki M, Takeda E, Takano K, et al. Molecular cloning and functional characterization of mouse Nxf family gene products. Genomics. 2005;85(5):641–653. doi: 10.1016/j.ygeno.2005.01.003
  7. Mamon L, Ginanova V, Kliver S, et al. Organ-specific transcripts as a source of gene multifunctionality: lessons learned from the Drosophila melanogaster sbr (Dm nxf1) gene. Biol Commun. 2019;64(2). doi: 10.21638/spbu03.2019.206
  8. Kim E, Magen A, Ast G. Different levels of alternative splicing among eukaryotes. Nucleic Acids Res. 2007;35(1):125–131. doi: 10.1093/nar/gkl924
  9. Mamon LA, Kliver SF, Prosovskaya AO, et al. The intron-containing transcript: an evolutionarily conserved characteristic of genes orthologous to nxf1 (Nuclear eXport Factor 1). Ecological genetics. 2013;11(3):3–13. (In Russ.) doi: 10.17816/ecogen1133-13
  10. Sugnet CW, Kent WJ, Ares M Jr, Haussler D. Transcriptome and genome conservation of alternative splicing events in humans and mice. Pac Symp Biocomput. 2004:66–77. doi: 10.1142/9789812704856_0007
  11. Schmitz U, Pinello N, Jia F, et al. Intron retention enhances gene regulatory complexity in vertebrates. Genome Biol. 2017;18:216. doi: 10.1186/s13059-017-1339-3
  12. Pimentel H, Parra M, Gee SL, et al. A dynamic intron retention program enriched in RNA processing genes regulates gene expression during terminal erythropoiesis. Nucleic Acids Res. 2016;44(2):838–851. doi: 10.1093/nar/gkv1168
  13. Li Y, Bor Y-c, Misawa Y, et al. An intron with a constitutive transport element is retained in a Tap messenger RNA. Nature. 2006;443:234–237. doi: 10.1038/nature05107
  14. Li Y, Bor Y-c, Fitzgerald MP, et al. An NXF1 mRNA with a retained intron is expressed in hippocampal and neocortical neurons and is translated into a protein that functions as an Nxf1 cofactor. Mol Biol Cell. 2016;27(24):3791–3946. doi: 10.1091/mbc.E16-07-0515
  15. Galante PAF, Sakabe NJ, Kirschbaum-Slager N, de Souza SJ. Detection and evaluation of intron retention events in the human transcriptome. RNA. 2004;10(5):757–765. doi: 10.1261/rna.5123504
  16. Michael IP, Kurlender L, Memari N, et al. Intron retention: a common splicing event within the human kallikrein gene family. Clin Chem. 2005;51(3):506–515. doi: 10.1373/clinchem.2004.042341
  17. Chen M-Y, Liang D, Zhang P. Phylogenomic Resolution of the Phylogeny of Laurasiatherian Mammals: Exploring Phylogenetic Signals within Coding and Noncoding Sequences. Genome Biol EVol. 2017;9(8):1998–2012. doi: 10.1093/gbe/evx147
  18. Jarvis ED, Mirarab S, Aberer AJ, et al. Whole-genome analyses resolve early branches in the tree of life of modern birds. Science. 2014;346(6215):1320–1331. doi: 10.1126/science.1253451
  19. Yu L, Luan P-T, Jin W, et al. Phylogenetic utility of nuclear introns in interfamilial relationships of Caniformia (order Carnivora). Syst Biol. 2011;60(2):175–187. doi: 10.1093/sysbio/syq090
  20. Creer S. Choosing and using introns in molecular phylogenetics. Evol Bioinform. 2007;3:99–108. doi: 10.1177/117693430700300011
  21. Foley NM, Thong VD, Soisook P, et al. How and why overcome the impediments to resolution: lessons from rhinolophid and hipposiderid bats. Mol Biol EVol. 2015;32(2):313–333. doi: 10.1093/molbev/msu329
  22. Aibara S, Katahira J, Valkov E, Stewart M. The principal mRNA nuclear export factor NXF1: NXT1 forms a symmetric binding platform that facilitates export of retroviral CTE-RNA. Nucleic Acids Res. 2015;43(3):1883–1893. doi: 10.1093/nar/gkv032
  23. Wendt L, Brandt J, Bodmer BS, et al. The Ebola Virus Nucleoprotein Recruits the Nuclear RNA Export Factor NXF1 into Inclusion Bodies to Facilitate Viral Protein Expression. Cells. 2020;9(1):187. doi: 10.3390/cells9010187
  24. Kumar S, Stecher G, Li M, et al. MEGA X: Molecular Evolutionary Genetics Analysis across computing platforms. Mol Biol EVol. 2018;35(6):1547–1549. doi: 10.1093/molbev/msy096
  25. Edgar RC. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 2004;32(5):1792–1797. doi: 10.1093/nar/gkh340
  26. Michener CD, Sokal RR. A quantitative approach to a problem in classification. Evolution. 1957;11(2):130–162. doi: 10.1111/j.1558-5646.1957.tb02884.x
  27. mesquiteproject.org [Internet]. Maddison WP, Maddison DR. Mesquite: a modular system for evolutionary analysis. Version 3.70. 2021. Available from: http://www.mesquiteproject.org
  28. Huelsenbeck JP, Ronquist F. MrBayes 3: Bayesian inference of phylogenetic trees. Bioinformatics. 2001;17(8):754–755. doi: 10.1093/bioinformatics/17.8.754
  29. FigTree [Internet]. Molecular evolution, phylogenetics and epidemiology. 2022. Available from: http://tree.bio.ed.ac.uk/software/figtree/. Accessed June 20, 2022.
  30. Trifinopoulos J, Nguyen L-T, von Haeseler A, Minh BQ. W-IQ-TREE: a fast online phylogenetic tool for maximum likelihood analysis. Nucleic Acids Res. 2016;44(W1): W232–W235. doi: 10.1093/nar/gkw256
  31. Kalyaanamoorthy S, Minh BQ, Wong TKF, et al. ModelFinder: fast model selection for accurate phylogenetic estimates. Nat Methods. 2017;14:587–589. doi: 10.1038/nmeth.4285
  32. Akaike H. A new look at the statistical model identification. IEEE Transactions on Automatic Control. 1974;19(6):716–723. doi: 10.1109/TAC.1974.1100705
  33. Schwarz G. Estimating the dimension of a model. Ann Stat. 1978;6(2):461–464. doi: 10.1214/aos/1176344136
  34. Kimura M. Estimation of evolutionary distances between homologous nucleotide sequences. PNAS. 1981;78(1):454–458. doi: 10.1073/pnas.78.1.454
  35. Kimura M. A simple method for estimating evolutionary rates of base substitutions through comparative studies of nucleotide sequences. J Mol EVol. 1980;16:111–120. doi: 10.1007/BF01731581
  36. Guindon S, Dufayard J-F, Lefort V, et al. New Algorithms and Methods to Estimate Maximum-Likelihood Phylogenies: Assessing the Performance of PhyML 3.0. Syst Biol. 2010;59(3):307–321. doi: 10.1093/sysbio/syq010
  37. Minh BQ, Nguyen MAT, von Haeseler A. Ultrafast Approximation for Phylogenetic Bootstrap. Mol Biol EVol. 2013;30(5):1188–1195. doi: 10.1093/molbev/mst024
  38. Hoang DT, Chernomor O, von Haeseler A, et al. UFBoot2: Improving the Ultrafast Bootstrap Approximation. Mol Biol EVol. 2018;35(2):518–522. doi: 10.1093/molbev/msx281
  39. Rodríguez F, Oliver JL, Marín A, Medina JR. The general stochastic model of nucleotide substitution. J Theor Biol. 1990;142(4): 485–501. doi: 10.1016/s0022–5193(05)80104-3
  40. Lanave C, Preparata G, Sacone C, Serio G. A new method for calculating evolutionary substitution rates. J Mol EVol. 1984;20:86–93. doi: 10.1007/BF02101990
  41. Gu X, Fu YX, Li WH. Maximum likelihood estimation of the heterogeneity of substitution rate among nucleotide sites. Mol Biol EVol. 1995;12(4):546–557. doi: 10.1093/oxfordjournals.molbev.a040235
  42. Lemoine F, Domelevo Entfellner J-B, Wilkinson E, et al. Renewing Felsenstein’s phylogenetic bootstrap in the era of big data. Nature. 2018;556:452–456. doi: 10.1038/s41586-018-0043-0
  43. Tsagkogeorga G, Parker J, Stupka E, et al. Phylogenomic analyses elucidate the evolutionary relationships of bats. Curr Biol. 2013;23(22):2262–2267. doi: 10.1016/j.cub.2013.09.014
  44. Lei M, Dong D. Phylogenomic analyses of bat subordinal relationships based on transcriptome data. Sci Rep. 2016;6:27726. doi: 10.1038/srep27726
  45. Farkašová H, Hron T, Pačes J, et al. Discovery of an endogenous Deltaretrovirus in the genome of long-fingered bats (Chiroptera: Miniopteridae). PNAS. 2017;114(12):3145–3150. doi: 10.1073/pnas.1621224114
  46. Miller-Butterworth CM, Murphy WJ, O’Brien SJ, et al. A Family Matter: Conclusive Resolution of the Taxonomic Position of the Long-Fingered Bats, Miniopterus. Mol Biol EVol. 2007;24(7):1553–1561. doi: 10.1093/molbev/msm076
  47. Agnarsson I, Zambrana-Torrelio CM, Flores-Saldana NP, May-Collado LJ. A time-calibrated species-level phylogeny of bats (Chiroptera, Mammalia). PLoS Curr. 2011;3: RRN1212. doi: 10.1371/currents.RRN1212
  48. Roehrs ZP, Lack JB, Van Den Bussche RA. Tribal phylogenetic relationships within Vespertilioninae (Chiroptera: Vespertilionidae) based on mitochondrial and nuclear sequence data. J Mammal. 2010;91(5):1073–1092. doi: 10.1644/09-MAMM-A-325.1
  49. Zhang Q, Edwards SV. The evolution of intron size in amniotes: a role for powered flight? Genome Biol EVol. 2012;4(10):1033–1043. doi: 10.1093/gbe/evs070

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Fig. 1. Variants of the sequence used in the experiment. 1 — Full-gene sequence; 2 — exons only; 3 — exons and intron 10; 4 — intron 10 and exons 10, 11; 5 — intron 10 (cassette intron); 6 — exons 10, 11; 7 — excluding intron 10 (cassette intron); 8 — only introns, except intron 10 (cassette intron). Non-coding exons at the 5' and 3' ends are including in sequences

Download (181KB)
3. Fig. 2. Phylogenetic tree based on the full-gene sequence variant of the Chiroptera’s Nxf1 gene. The tree was constructed by maximum likelihood and Bayesian methods. Support ratios are denoted as SH-Like aLTR/Bootstrap and the Bayesian posterior value. Large families are color coded. The branch order within highlighted areas remains unchanged in all considered schemes or the reasons for its violation are determined and individual nodes can be considered allowed. The above designations are common to this and all following figures

Download (268KB)
4. Fig. 3. Phylogenetic tree based on the “only exons” sequence variant of the Chiroptera’s Nxf1 gene

Download (256KB)
5. Fig. 4. Phylogenetic tree based on the “intron 10 and exons 10, 11” sequence variant of the Chiroptera’s Nxf1 gene

Download (264KB)
6. Appendix 1. Phylogenetic tree based on the “exons and intron 10” sequence variant of the Chiroptera’s Nxf1 gene

Download (369KB)
7. Appendix 2. Phylogenetic tree based on the “only intron 10 (cassette intron)” sequence variant of the Chiroptera’s Nxf1 gene

Download (255KB)
8. Appendix 3. Phylogenetic tree based on the “exons 10, 11” sequence variant of the Chiroptera’s Nxf1 gene

Download (273KB)
9. Appendix 4. Phylogenetic tree based on the “excluding intron 10 (cassette intron)” sequence variant of the Chiroptera’s Nxf1 gene

Download (229KB)
10. Appendix 5. Phylogenetic tree based on the “only introns, except intron 10 (cassette intron)” sequence variant of the Chiroptera’s Nxf1 gene

Download (194KB)

Copyright (c) 2022 Bondaruk D.D., Golubkova E.V., Mamon L.A.

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ПИ № ФС 77 - 65617 от 04.05.2016.


This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies