Contribution of the intron retained in the Nxf1 gene transcript to the phylogeny of the order Chiroptera
- Authors: Bondaruk D.D.1, Golubkova E.V.2, Mamon L.A.2
-
Affiliations:
- Saint-Petersburg State University
- Saint Petersburg State University
- Issue: Vol 20, No 2 (2022)
- Pages: 73-88
- Section: Genetic basis of ecosystems evolution
- URL: https://journals.eco-vector.com/ecolgenet/article/view/90940
- DOI: https://doi.org/10.17816/ecogen90940
- ID: 90940
Cite item
Abstract
This work is devoted to the possibilities of using a specific intron-containing block of the Nxf1 gene in phylogenetic studies.
Our attention was drawn to the conservative intron of the Nxf1 (nuclear export factor) gene. This intron is a part of an evolutionarily conserved block formed with flanking 110 bp and 37 bp exons, similar in representatives of various taxonomic groups. This evolutionary conservative block in our previous works was designated “cassette intron”. The Nxf1 genes are found in all representatives of Opisthokonta, and may be a convenient object for phylogenetic studies.
The Nxf1 gene sequences of seventeen representatives of the order Chiroptera obtained from publicly available databases (ensembl, ncbi). Alignment algorithm: MUSCLE. Programs: MEGA-X version 10.1.7, IQTree, Mesquite, MrBayes, and FigTree.v1.4.4. Estimation methods: Maximum Likelihood and Bayes Inference.
The use of Nxf1 gene sequences that include only exons or only introns leads to unequal loss of accuracy in establishing evolutionary relationships in comparison with the model based on the complete gene sequence. Sequences involving all exons plus a cassette intron give the same result as the complete Nxf1 gene sequence.
The obtained results indicate the importance of the cassette intron in the evolution of the Nxf1 gene of Chiroptera.
Full Text
Ген Nxf1 — наиболее древний представитель эволюционно-консервативного мультигенного семейства Nxf (nuclear export factor) [1], он кодирует белок, который за счет взаимодействия с различными кофакторами обеспечивает ядерно-цитоплазматический экспорт мРНК, причем в этом процессе ему отводится критически важная роль [1–3]. В случае нокдауна Nxf1 наблюдается полная остановка роста клетки и накопление поли-(A)-мРНК в ядре [4]. Размер семейства Nxf может варьировать, включая от одного до пяти генов-паралогов у разных представителей группы Unikonta, а ген Nxf1 как наиболее консервативный является основоположником генного семейства. Отмечается тенденция к увеличению числа генов-паралогов у высокоорганизованных эукариот [1]. Предположительно, паралоги выполняют специализированные функции [5], в том числе доказана тканеспецифичность отдельных паралогов [1, 6]. Существование генов-паралогов — не единственный механизм расширения спектра функций генов в рамках этого семейства. У Drosophila melanogaster функции паралогов могут исполнять специализированные транскрипты гена Nxf1 [5, 7]. Увеличение числа интронов способствует повышению вариативности транскриптов, обеспечивая эволюционное преимущество за счет увеличения вариантов сплайсинга [8].
Одна из характерных эволюционно-консервативных особенностей гена Nxf1 и его ортологов у различных представителей Opisthokonta — наличие интрон-содержащего транскрипта, возникающего в результате альтернативного сплайсинга [9]. Примечательно, что сохранение интрона считается наиболее редким [10] и наименее изученным [11] типом альтернативного сплайсинга. Несмотря на то что функциональное значение сохранения интрона ранее оставалось недооцененным, в настоящее время установлен значительный вклад этого явления. Сохранение интрона является независимым механизмом регуляции работы генов и может дополнять другие типы посттранскрипционной регуляции экспрессии генов, такие как альтернативный сплайсинг экзонов, что было показано, например, при исследовании эритроцитов [11, 12]. Таким образом, можно считать, что сохранение интрона как механизм, позволяющий увеличить сложность процессов регуляции генов, способствует также и увеличению адаптационного потенциала организма.
Доказано существование интрон-содержащего транскрипта у мышей [6], человека [13] и дрозофилы [5]. При этом также установлен факт преобладания интрон-содержащего транскрипта в тканях головы Drosophila melanogaster [5]. Было также отмечено присутствие интрон-содержащего транскрипта в неокортикальных нейронах и в нейронах гиппокампа у крыс [14]. Примечателен тот факт, что этот интрон, вместе с окружающими его экзонами, образует эволюционно-консервативный интрон-экзонный блок, который принимает вид: экзон 110 п. н. – интрон – экзон 37 п. н., схожий у представителей различных таксономических групп. Этот интрон было предложено называть «кассетным» [9]. В генах Nxf1 позвоночных — это интрон 10, а в генах Nxf1 дрозофилид — интрон 5. [9]. Участки геномной последовательности, участвующие в альтернативном сплайсинге, демонстрируют повышенные уровни геномной консервативности по сравнению с конститутивно сплайсируемыми экзонами [10]. Последовательность кассетного интрона гена Nxf1 можно отнести именно к такому типу последовательностей [9]. В сохраняемом интроне содержится преждевременный стоп-кодон. Транскрипты с сохраненным интроном в норме подвергаются NMD (Nonsense Mediated Decay). Кроме того, транскрипты, содержащие преждевременный стоп-кодон, сохраняются с более низкой частотой, предположительно, это может быть связано с наличием отбора в отношении потенциала кодирования (selective pressure for coding potential) [15], однако высокое содержание в цитоплазме транскрипта гена NXF1, сохраняющего интрон, позволяет предположить наличие механизмов, позволяющих избегать NMD [16]. Эту функцию у позвоночных могут исполнять CTE (Constitutive Transport Element), проявляющий сходство с вирусной последовательностью и обеспечивающий ядерный экспорт несплайсированной РНК [13], а у дрозофилид поли-(A)-последовательности [9]. Это особые консервативные участки последовательности интрона. Наличие различных механизмов, способствующих сохранению интрон-содержащего транскрипта, включающего преждевременный стоп-кодон у позвоночных и дрозофилид, позволяет предположить конвергентную эволюцию последовательности гена Nxf1.
В настоящее время интрон-содержащие последовательности широко используются в молекулярной филогенетике [17–19]. Использование данных последовательностей на практике часто сопряжено с рядом методических трудностей, но многие из них были успешно преодолены [20]. Тем не менее поиск генов, пригодных для использования в качестве филогенетических маркеров, все еще остается актуальной задачей. Мы предполагаем, что использование определенных последовательностей различных участков гена Nxf1 в этом качестве может иметь определенные перспективы.
В данном исследовании выбор в пользу филогении отряда Chiroptera был сделан по ряду причин. Филогения Chiroptera представляет интерес в том числе и для эпидемиологических исследований, так как среди представителей спорных групп есть переносчики опасных вирусов [21]. В этом плане ген Nxf1 представляет отдельный интерес в качестве объекта, поскольку доказано, что он важен в переносе вирусных РНК [22], кроме того, установлено его участие в переносе РНК вируса Эболы [23], основные распространители которого — представители Chiroptera. Как отмечалось в статье N.M. Foley и соавт. [21], более четкое понимание филогении Chiroptera может иметь значение для эпидемиологов при прогнозировании переноса SARS-подобных вирусов.
В качестве материалов использовали восемь вариантов последовательности генов Nxf1 (рис. 1) 17 представителей отряда Chiroptera, полученные из общедоступных баз данных. В табл. 1 представлены ссылки на анализируемые последовательности NCBI.
Таблица 1. Виды, задействованные в ходе эксперимента
Table 1. List of species used in the experiment
Семейство | Вид | Номер депонирования (accession number) в NCBI |
Homo* | Homo sapiens | NC_000011.10:c62805440-62792130 |
Rattus* | Rattus norvegicus | NC_051336.1:205655442-205668637 |
Phyllostomidae | Artibeus jamaicensis | NW_023542419.1:890903-901045 |
Phyllostomidae | Desmodus rotundus | NW_020093552.1:c2039064-2029125 |
Vespertilionidae | Eptesicus fuscus | NW_007370967.1:192470-202877 |
Hipposideridae | Hipposideros armiger | NW_017731443.1:3872791-3884027 |
Miniopteridae | Miniopterus natalensis | NW_015504634.1:775345-784658 |
Molossidae | Molossus molossus | NW_023425348.1:c89303232-89290032 |
Vespertilionidae | Myotis brandtii | NW_005353800.1:c360404-351295 |
Vespertilionidae | Myotis davidii | NW_006297142.1:c1278961-1266477 |
Vespertilionidae | Myotis lucifugus | NW_005871779.1:34512-44765 |
Vespertilionidae | Myotis myotis | NW_023416332.1:224423-235058 |
Phyllostomidae | Phyllostomus discolor | NC_040908.2:c164004956-163994433 |
Vespertilionidae | Pipistrellus kuhlii | NW_023425561.1:c1148265-1132082 |
Pteropodidae | Pteropus alecto | NW_006435764.1:7215211-7225001 |
Pteropodidae | Pteropus vampyrus | NW_011888925.1:c1209758-1199949 |
Rhinolophidae | Rhinolophus ferrumequinum | NC_046294.1:8038466-8048415 |
Pteropodidae | Rousettus aegyptiacus | NW_023416308.1:c114932923-114923249 |
Phyllostomidae | Sturnira hondurensis | NW_023514227.1:c335816-325631 |
*Виды, использованные в качестве представителей внешних групп. |
Методы выравнивания нуклеотидных последовательностей
Выравнивание нуклеотидных последовательностей проводили в программе MEGA-X [24] версии 10.1.7 с помощью алгоритма MUSCLE [25] с использованием настроек по умолчанию (GAP Open-400, 16 итераций). В качестве метода кластеризации использовали UPGMA [26].
По результатам выравнивания, вручную с опорой на модель интрон-экзонной структуры гена Hs Nxf1, воссоздавали модель интрон-экзонной структуры гена Nxf1 исследуемых рукокрылых.
С учетом известной интрон-экзонной структуры последовательности гена Nxf1 анализировали восемь вариантов последовательностей (рис. 1).
Рис. 1. Варианты последовательностей, используемых в эксперименте. 1 — Полная последовательность гена; 2 — последовательность, содержащая только экзоны; 3 — последовательность, содержащая только экзоны и интрон 10; 4 — последовательность, содержащая только интрон 10 и окружающие его экзоны (10 и 11); 5 — последовательность, соответствующая интрону 10 (кассетному интрону); 6 — последовательность, соответствующая экзонам 10 и 11; 7 — последовательность гена, исключающая только интрон 10 (кассетный интрон); 8 — последовательность, включающая только интроны, кроме интрона 10 (кассетного интрона). В составе последовательностей учтены некодирующие экзоны 5' и 3' концов
Fig. 1. Variants of the sequence used in the experiment. 1 — Full-gene sequence; 2 — exons only; 3 — exons and intron 10; 4 — intron 10 and exons 10, 11; 5 — intron 10 (cassette intron); 6 — exons 10, 11; 7 — excluding intron 10 (cassette intron); 8 — only introns, except intron 10 (cassette intron). Non-coding exons at the 5' and 3' ends are including in sequences
На основании каждого из восьми вариантов последовательностей, с целью проследить изменение точности филогенетической реконструкции, были построены филогенетические деревья.
Филогенетический анализ нуклеотидных последовательностей
Для построения филогенетических деревьев и их последующего редактирования применяли программы: MEGA-X [24], Mesquite [27], MrBayes [28] и FigTree.v1.4.4. [29], а также методы максимального правдоподобия (Maximum Likelihood) и Байеса (Bayes Inference).
При построении филогенетических деревьев по методу максимального правдоподобия (Maximum Likelihood) использовали программу IQTree [30]. Оптимальная эволюционная модель подбиралась для каждого множественного выравнивания, соответствующего одному из восьми вариантов последовательностей с помощью алгоритма ModelFinder [31]. Лучшую схему моделей нуклеотидных замен определяли по трем параметрам: Akaike Information Criterion (AIC) [32], Corrected Akaike Information Criterion (AICc), Bayesian Information Criterion (BIC) [33]. Основным параметром выступал BIC. Оптимальные модели представлены в табл. 2.
Таблица 2. Оптимальные модели замен для метода максимального правдоподобия (Maximum Likelihood), полученные с помощью алгоритма ModelFinder на основе критерия BIC
Table 2. The best evolutionary models for each variant of sequence were found by ModelFinder. The choice was made in favor of models that minimize the Bayesian information criterion (BIC)
Множественное выравнивание варианта последовательности | Модель замен (Substitution model) |
1. Полная последовательность гена | TIM+F+I+G4 |
2. Только экзоны | TIM3e+G4 |
3. Только экзоны + интрон 10 | K3Pu+F+G4 [34] |
4. Только экзон 10, интрон 10 и экзон 11 | K3Pu+F+G4 |
5. Только интрон 10 | K3Pu+F+G4 |
6. Только экзоны 10 и 11 | K2P+G4 [35] |
7. Все, кроме интрона 10 | K3Pu+F+I+G4 |
8. Только интроны, кроме интрона 10 | TPM3+F+G4 |
Для статистической поддержки максимального правдоподобия в программе IQ-Tree были использованы два коэффициента: SH-like approximate likelihood ratio test (SH-aLRT, 1000 репликаций) [36] и сверхбыстрый бутстреп (UfBoot, 500 псевдореплик) [37, 38].
Метод Байеса при построении филогенетических деревьев предполагает иной набор моделей замен. Параметры для MrBayes задавались с помощью программы Mesquite [27]. Мы применили модель GTR+I+G (General time reversible — GTR) [39, 40], учитывалось шесть видов замещения и комбинация модели неизменяющихся сайтов (Proportion of Invariable Sites) с гамма-моделью (+I+G, rates = invgamma) [37]). При оценке филогенетической реконструкции достоверными считали коэффициенты поддержки более 80 для SH-like aLRT [38, 41] и более 95 — для UfBoot [42]. При оценке филогенетических реконструкций, полученных с помощью метода Байеса, достоверными были значения апостериорной вероятности более 80 % и более 90 %.
Филогенетический анализ видов отряда Chiroptera
Характеристика выравниваний. Для проведения выравнивания последовательностей применены настройки по умолчанию: GAP Open-400, 16 итераций. Характеристика выравниваний представлена в табл. 3.
Таблица 3. Характеристика множественных выравниваний
Table 3. The multiple alignments characteristic
Вариант последовательности | Пары оснований, п. н. | Консервативные сайты, п. н. | Вариабельные сайты, п. н. | Информативные сайты, п. н. | Однонуклеотидные вариации (SNP = SNV), п. н. |
1. Полная последовательность гена | 31570 | 5833 | 10373 | 4219 | 4692 |
2. Только экзоны | 1976 | 1202 | 655 | 401 | 254 |
3. Только экзоны + интрон 10 | 4168 | 2230 | 1491 | 849 | 638 |
4. Только экзон 10, интрон 10 и экзон 11 | 2326 | 1118 | 895 | 477 | 409 |
5. Только интрон 10 | 2177 | 1018 | 846 | 443 | 396 |
6. Только экзоны 10 и 11 | 147 | 95 | 52 | 32 | 20 |
7. Все, кроме интрона 10 | 29185 | 5031 | 9261 | 3656 | 4053 |
8. Только интроны, кроме интрона 10 | 24081 | 4241 | 7771 | 3023 | 2917 |
Полная последовательность гена Nxf1
На 2019–2020 гг. в базах данных GenBank установлены последовательности гена Nxf1 различной степени полноты для 17 представителей отряда Chiroptera, относящихся к семи различным семействам: Phyllostomidae, Vespertilionidae, Miniopteridae, Molossidae, Hipposideridae, Rhinolophidae, Pteropodidae. Кроме того, в качестве внешних групп, на филогенетическом дереве изображены отряд приматы, представленный Homo sapience, и отряд грызуны, представленный Rattus norvegicus.
Все филогенетические деревья, полученные на основе полной последовательности гена Nxf1, имеют высокий уровень поддержки топологии, максимально возможный или близкий к нему. Общий характер ветвления, подробно описанный на примере последовательности полного гена, остается неизменным в большинстве случаев. Полученная схема поддерживает разделение на клады Yinpterochiroptera и Yangochiroptera (рис. 2) [43, 44]. Yinpterochiroptera подразделяется на две ветви, первая — представлена семейством Phyllostomidae (Artibeus jamaicensis, Desmodus rotundus, Phyllostomus discolor, Sturnira hondurensis), а вторая — образована тремя монофилитическими семействами (Vespertilionidae, Miniopteridae, Molossidae), при этом Molossidae занимает базальное, по отношению к Vespertilionidae и Miniopteridae, положение, что согласуется с данными литературы [45, 46]. Стоит отметить, что на настоящий момент нет единого мнения, какая из этих групп должна занимать базальное положение, например, в более поздней работе [47] было высказано предположение, что ранее всех обособилась группа Miniopteridae, однако сами авторы подчеркивают, что в виду особенностей дизайна эксперимента полученная схема дает лишь приблизительную оценку филогенетических отношений внутри отряда. Семейства Miniopteridae и Molossidae представлены каждое одним видом (Miniopterus natalensis и Molossus molossus соответственно), в то время как Vespertilionidae — шестью (Myotis brandtii, Myotis davidii, Myotis lucifugus, Myotis myotis, Pipistrellus kuhlii, Eptesicus kuhli). В пределах семейства также наблюдается разделение на три рода (Myotis, Eptesocus и Pipistrellus). Хотя в нашем исследовании набор представителей семейства Vespertilionidae ограничен и представлены не все рода, наблюдается сходство с результатами филогенетического анализа данного семейства, проведенного на большей выборке видов при использовании митохондриальной ДНК [48]. Результаты этого анализа подтверждают монофилию Vespertilioninae. По нашим данным, группа Yinpterochiroptera, в свою очередь, делится на две клады. Клада Rhinolophoidea представлена двумя видами, относящимися к двум разным семействам (Rhinolophidae, Rhinolophus ferrumequinum и Hipposideridae, Hipposideros armiger), и Pteropodoidae, представленная тремя видами (Pteropus alecto, Pteropus vampyrus и Rousettus aegyptiacus), относящимися к одному семейству Pteropodidae.
Вариант последовательности гена, содержащей только экзоны
Топология, построенная на основе варианта последовательности гена, исключающей интроны, в целом, соответствует варианту, полученному на основе полной последовательности гена, за исключением резкого падения коэффициента поддержки в узле Vespertilionidae/Miniopteridae — SH-Like aLTR/Bootstrap = 59,5/54 по сравнению с SH-Like aLTR/Bootstrap = 99,4/100 в случае топологии, построенной на основе последовательности полного гена (рис. 3). Это позволяет относить этот узел к неразрешенным. Отмечается также небольшое снижение точности в других узлах, но значения коэффициентов поддержки и апостериорной вероятности все еще стабильно остаются достаточно высокими и не опускаются ниже 80 % в случае методов максимального правдоподобия и 0,95 для значения апостериорной вероятности, так что эти изменения можно считать несущественными.
Вариант последовательности гена, содержащей только экзоны и интрон 10
Топология, построенная на основе варианта последовательности гена, где сохранен только кассетный интрон (Приложение 1), соответствует варианту, полученному на основе полной последовательности (рис. 2), и выгодно отличается от топологии, построенной на основе варианта последовательности гена, не включающей интроны (рис. 3), поскольку значение коэффициента поддержки в узле Vespertilionidae/Miniopteridae, который оставался неразрешенным при использовании варианта последовательности, не включающей интроны, остается крайне высоким для методов максимального правдоподобия (SH-Like aLTR/Bootstrap = 94,2/100), а значение апостериорной вероятности по Байесу равно единице.
Рис. 2. Филогенетическое дерево, построенное на основе полных последовательностей гена Nxf1 различных представителей отряда Chiroptera с помощью методов максимального правдоподобия и Байеса. Коэффициенты поддержки обозначены как SH-Like aLTR/Bootstrap и значение апостериорной вероятности по Байесу. Цветом выделены области дерева, соответствующие крупным семействам, внутри которых порядок ветвления остается неизменным во всех рассматриваемых схемах или причины его нарушения установлены и отдельные узлы можно считать разрешенными. Приведенные выше обозначения общие для этого и всех последующих рисунков
Fig. 2. Phylogenetic tree based on the full-gene sequence variant of the Chiroptera’s Nxf1 gene. The tree was constructed by maximum likelihood and Bayesian methods. Support ratios are denoted as SH-Like aLTR/Bootstrap and the Bayesian posterior value. Large families are color coded. The branch order within highlighted areas remains unchanged in all considered schemes or the reasons for its violation are determined and individual nodes can be considered allowed. The above designations are common to this and all following figures
Рис. 3. Филогенетическое дерево, построенное на основе варианта последовательности гена Nxf1, содержащей только экзоны, для различных представителей отряда Chiroptera, с помощью методов максимального правдоподобия и Байеса
Fig. 3. Phylogenetic tree based on the “only exons” sequence variant of the Chiroptera’s Nxf1 gene
Вариант последовательности, содержащей только интрон 10 и окружающие его экзоны (10 и 11)
Топология, построенная на основе варианта последовательности, соответствующей эволюционно-консервативному блоку, образованному кассетным интроном и окружающими его экзонами, отличается от варианта, полученного на основе полной последовательности гена, за исключением двух узлов, которые остаются неразрешенными (рис. 4). Схема все еще поддерживает разделение на Yinpterochiroptera и Yangochiroptera, однако установить порядок ветвления в пределах Yinpterochiroptera, опираясь на полученные данные, не представляется возможным, поскольку узел, отображающий разделение Yinpterochiroptera на две клады Rhinolophoidea и Pteropodoidae, имеет низкое значение поддержки (39.5/57/0.67). Случаи подобного падения точности при определении положения групп, находящихся в основании филогенетического дерева при использовании интронных и интрон-содержащих последовательностей, отмечались и в других исследованиях [49] и, предположительно, связаны с более высокой скоростью эволюции таких последовательностей.
Вариант последовательности, соответствующей интрону 10 (кассетному интрону)
Топология отличается от варианта, полученного на основе полной последовательности гена. Не поддерживает разделение на Yinpterochiroptera и Yangochiroptera, Rhinolophoidea определяется как парафилитическая по отношению к Pteropodidae с низким уровнем поддержки (SH-Like aLTR/Bootstrap = 61,4/70 и 0,70), из чего следует, что на основе этого варианта последовательности не представляется возможным определить принадлежность Rhinolophoidea к Yinpterochiroptera или Yangochiroptera. Порядок ветвления в пределах рода Myotis пришел в соответствие с полученным для топологии, основанной на полной последовательности гена, однако значения поддержки все еще недостаточно высокие (SH-Like aLTR/Bootstrap = 25,4/55 и 0,71), чтобы можно было считать эту ветвь разрешенной (Приложение 2).
Вариант последовательности, соответствующей экзонам 10 и 11
Схемы, построенные на основе варианта последовательности, соответствующей экзонам 10 и 11, не имели достаточного филогенетического сигнала, по-видимому, это связанно с малой длинной (147 п. н.) этой последовательности, также, вероятно, ее значительная консервативность препятствует получению адекватной топологии (Приложение 3). Поскольку варианты последовательности, соответствующие кассетному интрону и кассетному интрону с экзонами 10 и 11, имеют минимальные отличия, и адекватной топологии, построенной лишь на основе последовательности этих экзонов, получить не удалось, в дальнейшем эти варианты обсуждаться не будут.
Вариант последовательности гена, исключающей только интрон 10 (кассетный интрон)
Топология, построенная на основе варианта последовательности гена, исключающей кассетный интрон (Приложение 4), соответствует схемам, построенным на основе полной последовательности гена (рис. 2), и варианта последовательности, где из интронов сохранен только кассетный (Приложение 1). Характер ветвления совпадает, значения поддержки в каждом отдельном узле высокие.
Вариант последовательности, включающей только интроны, кроме интрона 10 (кассетного интрона)
Топология, построенная на основе варианта последовательности, включающей только интроны, за исключением кассетного (Приложение 5), демонстрирует сходство с топологиями, построенными на основе варианта последовательности, соответствующей эволюционно-консервативному блоку, образованному кассетным интроном и фланкирующими его экзонами (рис. 4), а также варианта последовательности, соответствующей кассетному интрону (Приложение 2). Так же как в двух описанных выше случаях, не удается разрешить разделение в пределах Yinpterochiroptera, узел, отображающий разделение на клады Rhinolophoidea и Pteropodoidae, имеет низкое значение поддержки (50.2/50/0.72).
Рис. 4. Филогенетическое дерево, построенное на основе варианта последовательности гена Nxf1, содержащей только интрон 10 и окружающие его экзоны (10 и 11), для различных представителей отряда Chiroptera, с помощью методов максимального правдоподобия и Байеса
Fig. 4. Phylogenetic tree based on the “intron 10 and exons 10, 11” sequence variant of the Chiroptera’s Nxf1 gene
Интроны несут определенный филогенетический сигнал, и их присутствие в исходной последовательности влияет на точность конечной схемы
Топологии, построенные на основе последовательности полного гена, варианта последовательности гена, где представлены все экзоны и только кассетный интрон, а также варианта последовательности гена, исключающей только кассетный интрон, проявляют значительное сходство. Полученные филогенетические деревья не имеют неразрешенных узлов и в значительной степени соответствуют современным представлениям о систематике Chiroptera. Стоит отметить, что схемы, построенные на основе последовательностей, включающих как экзоны, так и интроны, оказались наиболее точными, в то время как на схеме, полученной при использовании варианта последовательности гена, исключающей интроны, был получен неразрешенный узел Vespertilioidae/Molossidae. Примечательно, что кассетный интрон имеет влияние на точность схемы, сопоставимое по своей силе с суммарным влиянием всех остальных интронов гена.
Интронные и экзонные последовательности имеют качественные отличия по своему филогенетическому сигналу
При использовании варианта последовательности, соответствующей кассетному интрону, а также варианта последовательности, включающей только интроны, за исключением кассетного, не удается установить положение группы Rhinolophoidea, однако узел Vespertilioidae/Molossidae, который оставался неразрешенным при использовании варианта последовательности, исключающей интроны, сохраняет высокие значения поддержки во всех топологиях, основанных на вариантах последовательностей, включающих интроны. В свою очередь на схеме, основанной на варианте последовательности гена, исключающей интроны, положение группы Rhinolophoidea определяется корректно с достаточным уровнем поддержки. На основании полученных результатов можно констатировать факт снижения точности схем, причем наблюдаются качественные различия — неразрешенные узлы на филогенетических деревьях не совпадают, из чего следует вывод о качественных различиях между филогенетическими сигналами интронных и экзонных последовательностей. Филогенетический сигнал последовательностей, соответствующих эволюционно-консервативному блоку, образованному кассетным интроном и фланкрирующими его экзонами, кассетному интрону, а также всем интронам, кроме кассетного, имеет качественные отличия от филогенетического сигнала варианта последовательности гена, исключающей интроны. В случае трех вариантов последовательностей, где учитывался филогенетический сигнал интронов, мы получили надежное разрешение узла Vespertilioidae/Molossidae, достаточно близких семейств. Это считается основанием для предположения, что интрон-содержащие последовательности особенно важно учитывать при работе с близкородственными группами. В свою очередь, вариант последовательности, исключающей интроны, позволял надежно определить положение группы Rhinolophoidea, чего не удавалось сделать, основываясь исключительно на вариантах интрон-содержащих последовательностей. Однако стоит отметить, что этот результат характерен и для комбинированных вариантов, сочетающих как интронные, так и экзонные последовательности, что свидетельствует в пользу предпочтительного использования именно комбинированных вариантов.
Стоит также отметить, что схема, построенная на основе исключительно последовательности кассетного интрона, по своей точности не уступает схеме, основанной на последовательности всех интронов гена, за исключением кассетного. Таким образом, филогенетический сигнал кассетного интрона сопоставим с совокупным вкладом всех интронов гена, о чем можно также судить, сопоставляя филогенетические деревья, основанные на варианте последовательности, исключающей все интроны, кроме кассетного, и варианте последовательности, где исключен только кассетный интрон.
Полученные результаты могут свидетельствовать о значимости кассетного интрона в эволюции гена Nxf1 у Chiroptera.
ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ
Вклад авторов. Все авторы внесли существенный вклад в разработку концепции, проведение исследования и подготовку статьи, прочли и одобрили финальную версию перед публикацией. Вклад авторов: Д.Д. Бондарук — написание основного текста статьи, биоинформатическая обработка материалов, анализ полученных результатов, обсуждение результатов; Е.В. Голубкова — руководство, редактирование текста, обсуждение результатов; Л.А. Мамон — общее руководство, редактирование текста, обсуждение результатов.
Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией настоящей статьи.
Источник финансирования. Авторы заявляют об отсутствии внешнего финансирования при проведении исследования.
ADDITIONAL INFORMATION
Author contribution. Thereby, all authors made a substantial contribution to the conception of the work, acquisition, analysis, interpretation of data for the work, drafting and revising the work, final approval of the version to be published and agree to be accountable for all aspects of the work. Contribution of each author: D.D. Bondaruk — writing the main text of the article, bioinformatic processing of materials, analysis of the results, discussion of the results; E.V. Golubkova — guidance, text editing, discussion of the results; L.A. Mamon — general guidance, text editing, discussion of the results.
Competing interests. The authors declare that they have no competing interests.
Funding source. This study was not supported by any external sources of funding.
Приложение 1. Филогенетическое дерево, построенное на основе варианта последовательности, содержащей только экзоны и интрон 10 гена Nxf1 различных представителей отряда Chiroptera, с помощью методов максимального правдоподобия и Байеса
Примечание. Коэффициенты поддержки обозначены как SH-Like aLTR/Bootstrap и значение апостериорной вероятности по Байесу. Цветом выделены области дерева, соответствующие крупным семействам, внутри которых порядок ветвления остается неизменным во всех рассматриваемых филогенетических деревьях или причины его нарушения установлены и отдельные узлы можно считать разрешенными. Приведенные выше обозначения общие для этого и всех последующих рисунков.
Appendix 1. Phylogenetic tree based on the “exons and intron 10” sequence variant of the Chiroptera’s Nxf1 gene
Note. Support ratios are denoted as SH-Like aLTR/Bootstrap and the Bayesian posterior value. Large families are color coded. The branch order within highlighted areas remains unchanged in all considered schemes or the reasons for its violation are determined and individual nodes can be considered allowed. The above designations are common to this and all subsequent figures.
Приложение 2. Филогенетическое дерево, построенное на основе варианта последовательности, содержащей только интрон 10 гена Nxf1 различных представителей отряда Chiroptera, с помощью методов максимального правдоподобия и Байеса
Appendix 2. Phylogenetic tree based on the “only intron 10 (cassette intron)” sequence variant of the Chiroptera’s Nxf1 gene
Приложение 3. Филогенетическое дерево, построенное на основе варианта последовательности, содержащей только экзоны 10 и 11 гена Nxf1 различных представителей отряда Chiroptera, с помощью методов максимального правдоподобия и Байеса
Appendix 3. Phylogenetic tree based on the “exons 10, 11” sequence variant of the Chiroptera’s Nxf1 gene
Приложение 4. Филогенетическое дерево, построенное на основе варианта последовательности гена Nxf1, исключающей интрон 10, различных представителей отряда Chiroptera, с помощью методов максимального правдоподобия и Байеса
Appendix 4. Phylogenetic tree based on the “excluding intron 10 (cassette intron)” sequence variant of the Chiroptera’s Nxf1 gene
Приложение 5. Филогенетическое дерево, построенное на основе варианта последовательности, содержащей только интроны гена Nxf1, за исключением интрона 10, различных представителей отряда Chiroptera, с помощью методов максимального правдоподобия и Байеса
Appendix 5. Phylogenetic tree based on the “only introns, except intron 10 (cassette intron)” sequence variant of the Chiroptera’s Nxf1 gene
About the authors
Dmitrii D. Bondaruk
Saint-Petersburg State University
Author for correspondence.
Email: D.D.Bondaruk@yandex.ru
ORCID iD: 0000-0003-0265-5759
SPIN-code: 8162-8441
Postgraduate student
Russian Federation, Saint-PetersburgElena V. Golubkova
Saint Petersburg State University
Email: elena_golubkova@mail.ru
ORCID iD: 0000-0002-9528-5760
SPIN-code: 7386-1230
Scopus Author ID: 6602650894
Cand. Sci. (Biol.), Associate Professor, Department of Genetics and Biotechnology
Russian Federation, Saint PetersburgLyudmila A. Mamon
Saint Petersburg State University
Email: mamon@lm2010.spb.edu
ORCID iD: 0000-0001-5338-0703
SPIN-code: 7780-6907
Dr. Sci. (Biol.), Professor, Department of Genetics and Biotechnology
Russian Federation, Saint PetersburgReferences
- Herold A, Suyama M, Rodrigues JP, et al. TAP (NXF1) belongs to a multigene family of putative RNA export factors with a conserved modular architecture. Mol Cell Biol. 2000;20(23):8996–9008. doi: 10.1128/MCB.20.23.8996-9008.2000
- Herold A, Teixeira L, Izaurralde E. Genome-wide analysis of nuclear mRNA export pathways in Drosophila. EMBO J. 2003;22(10):2472–2483. doi: 10.1093/emboj/cdg233
- Delaleau M, Borden KLB. Multiple Export Mechanisms for mRNAs. Cells. 2015;4(3):452–473. doi: 10.3390/cells4030452
- Herold A, Klymenko T, Izaurralde E. NXF1/p15 heterodimers are essential for mRNA nuclear export in Drosophila. RNA. 2001;7(12):1768–1780.
- Ivankova N, Tretyakova I, Lyozin GT, et al. Alternative transcripts expressed by small bristles, the Drosophila melanogaster nxf1 gene. Gene. 2010;458(1–2):11–19. doi: 10.1016/j.gene.2010.02.013
- Sasaki M, Takeda E, Takano K, et al. Molecular cloning and functional characterization of mouse Nxf family gene products. Genomics. 2005;85(5):641–653. doi: 10.1016/j.ygeno.2005.01.003
- Mamon L, Ginanova V, Kliver S, et al. Organ-specific transcripts as a source of gene multifunctionality: lessons learned from the Drosophila melanogaster sbr (Dm nxf1) gene. Biol Commun. 2019;64(2). doi: 10.21638/spbu03.2019.206
- Kim E, Magen A, Ast G. Different levels of alternative splicing among eukaryotes. Nucleic Acids Res. 2007;35(1):125–131. doi: 10.1093/nar/gkl924
- Mamon LA, Kliver SF, Prosovskaya AO, et al. The intron-containing transcript: an evolutionarily conserved characteristic of genes orthologous to nxf1 (Nuclear eXport Factor 1). Ecological genetics. 2013;11(3):3–13. (In Russ.) doi: 10.17816/ecogen1133-13
- Sugnet CW, Kent WJ, Ares M Jr, Haussler D. Transcriptome and genome conservation of alternative splicing events in humans and mice. Pac Symp Biocomput. 2004:66–77. doi: 10.1142/9789812704856_0007
- Schmitz U, Pinello N, Jia F, et al. Intron retention enhances gene regulatory complexity in vertebrates. Genome Biol. 2017;18:216. doi: 10.1186/s13059-017-1339-3
- Pimentel H, Parra M, Gee SL, et al. A dynamic intron retention program enriched in RNA processing genes regulates gene expression during terminal erythropoiesis. Nucleic Acids Res. 2016;44(2):838–851. doi: 10.1093/nar/gkv1168
- Li Y, Bor Y-c, Misawa Y, et al. An intron with a constitutive transport element is retained in a Tap messenger RNA. Nature. 2006;443:234–237. doi: 10.1038/nature05107
- Li Y, Bor Y-c, Fitzgerald MP, et al. An NXF1 mRNA with a retained intron is expressed in hippocampal and neocortical neurons and is translated into a protein that functions as an Nxf1 cofactor. Mol Biol Cell. 2016;27(24):3791–3946. doi: 10.1091/mbc.E16-07-0515
- Galante PAF, Sakabe NJ, Kirschbaum-Slager N, de Souza SJ. Detection and evaluation of intron retention events in the human transcriptome. RNA. 2004;10(5):757–765. doi: 10.1261/rna.5123504
- Michael IP, Kurlender L, Memari N, et al. Intron retention: a common splicing event within the human kallikrein gene family. Clin Chem. 2005;51(3):506–515. doi: 10.1373/clinchem.2004.042341
- Chen M-Y, Liang D, Zhang P. Phylogenomic Resolution of the Phylogeny of Laurasiatherian Mammals: Exploring Phylogenetic Signals within Coding and Noncoding Sequences. Genome Biol EVol. 2017;9(8):1998–2012. doi: 10.1093/gbe/evx147
- Jarvis ED, Mirarab S, Aberer AJ, et al. Whole-genome analyses resolve early branches in the tree of life of modern birds. Science. 2014;346(6215):1320–1331. doi: 10.1126/science.1253451
- Yu L, Luan P-T, Jin W, et al. Phylogenetic utility of nuclear introns in interfamilial relationships of Caniformia (order Carnivora). Syst Biol. 2011;60(2):175–187. doi: 10.1093/sysbio/syq090
- Creer S. Choosing and using introns in molecular phylogenetics. Evol Bioinform. 2007;3:99–108. doi: 10.1177/117693430700300011
- Foley NM, Thong VD, Soisook P, et al. How and why overcome the impediments to resolution: lessons from rhinolophid and hipposiderid bats. Mol Biol EVol. 2015;32(2):313–333. doi: 10.1093/molbev/msu329
- Aibara S, Katahira J, Valkov E, Stewart M. The principal mRNA nuclear export factor NXF1: NXT1 forms a symmetric binding platform that facilitates export of retroviral CTE-RNA. Nucleic Acids Res. 2015;43(3):1883–1893. doi: 10.1093/nar/gkv032
- Wendt L, Brandt J, Bodmer BS, et al. The Ebola Virus Nucleoprotein Recruits the Nuclear RNA Export Factor NXF1 into Inclusion Bodies to Facilitate Viral Protein Expression. Cells. 2020;9(1):187. doi: 10.3390/cells9010187
- Kumar S, Stecher G, Li M, et al. MEGA X: Molecular Evolutionary Genetics Analysis across computing platforms. Mol Biol EVol. 2018;35(6):1547–1549. doi: 10.1093/molbev/msy096
- Edgar RC. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 2004;32(5):1792–1797. doi: 10.1093/nar/gkh340
- Michener CD, Sokal RR. A quantitative approach to a problem in classification. Evolution. 1957;11(2):130–162. doi: 10.1111/j.1558-5646.1957.tb02884.x
- mesquiteproject.org [Internet]. Maddison WP, Maddison DR. Mesquite: a modular system for evolutionary analysis. Version 3.70. 2021. Available from: http://www.mesquiteproject.org
- Huelsenbeck JP, Ronquist F. MrBayes 3: Bayesian inference of phylogenetic trees. Bioinformatics. 2001;17(8):754–755. doi: 10.1093/bioinformatics/17.8.754
- FigTree [Internet]. Molecular evolution, phylogenetics and epidemiology. 2022. Available from: http://tree.bio.ed.ac.uk/software/figtree/. Accessed June 20, 2022.
- Trifinopoulos J, Nguyen L-T, von Haeseler A, Minh BQ. W-IQ-TREE: a fast online phylogenetic tool for maximum likelihood analysis. Nucleic Acids Res. 2016;44(W1): W232–W235. doi: 10.1093/nar/gkw256
- Kalyaanamoorthy S, Minh BQ, Wong TKF, et al. ModelFinder: fast model selection for accurate phylogenetic estimates. Nat Methods. 2017;14:587–589. doi: 10.1038/nmeth.4285
- Akaike H. A new look at the statistical model identification. IEEE Transactions on Automatic Control. 1974;19(6):716–723. doi: 10.1109/TAC.1974.1100705
- Schwarz G. Estimating the dimension of a model. Ann Stat. 1978;6(2):461–464. doi: 10.1214/aos/1176344136
- Kimura M. Estimation of evolutionary distances between homologous nucleotide sequences. PNAS. 1981;78(1):454–458. doi: 10.1073/pnas.78.1.454
- Kimura M. A simple method for estimating evolutionary rates of base substitutions through comparative studies of nucleotide sequences. J Mol EVol. 1980;16:111–120. doi: 10.1007/BF01731581
- Guindon S, Dufayard J-F, Lefort V, et al. New Algorithms and Methods to Estimate Maximum-Likelihood Phylogenies: Assessing the Performance of PhyML 3.0. Syst Biol. 2010;59(3):307–321. doi: 10.1093/sysbio/syq010
- Minh BQ, Nguyen MAT, von Haeseler A. Ultrafast Approximation for Phylogenetic Bootstrap. Mol Biol EVol. 2013;30(5):1188–1195. doi: 10.1093/molbev/mst024
- Hoang DT, Chernomor O, von Haeseler A, et al. UFBoot2: Improving the Ultrafast Bootstrap Approximation. Mol Biol EVol. 2018;35(2):518–522. doi: 10.1093/molbev/msx281
- Rodríguez F, Oliver JL, Marín A, Medina JR. The general stochastic model of nucleotide substitution. J Theor Biol. 1990;142(4): 485–501. doi: 10.1016/s0022–5193(05)80104-3
- Lanave C, Preparata G, Sacone C, Serio G. A new method for calculating evolutionary substitution rates. J Mol EVol. 1984;20:86–93. doi: 10.1007/BF02101990
- Gu X, Fu YX, Li WH. Maximum likelihood estimation of the heterogeneity of substitution rate among nucleotide sites. Mol Biol EVol. 1995;12(4):546–557. doi: 10.1093/oxfordjournals.molbev.a040235
- Lemoine F, Domelevo Entfellner J-B, Wilkinson E, et al. Renewing Felsenstein’s phylogenetic bootstrap in the era of big data. Nature. 2018;556:452–456. doi: 10.1038/s41586-018-0043-0
- Tsagkogeorga G, Parker J, Stupka E, et al. Phylogenomic analyses elucidate the evolutionary relationships of bats. Curr Biol. 2013;23(22):2262–2267. doi: 10.1016/j.cub.2013.09.014
- Lei M, Dong D. Phylogenomic analyses of bat subordinal relationships based on transcriptome data. Sci Rep. 2016;6:27726. doi: 10.1038/srep27726
- Farkašová H, Hron T, Pačes J, et al. Discovery of an endogenous Deltaretrovirus in the genome of long-fingered bats (Chiroptera: Miniopteridae). PNAS. 2017;114(12):3145–3150. doi: 10.1073/pnas.1621224114
- Miller-Butterworth CM, Murphy WJ, O’Brien SJ, et al. A Family Matter: Conclusive Resolution of the Taxonomic Position of the Long-Fingered Bats, Miniopterus. Mol Biol EVol. 2007;24(7):1553–1561. doi: 10.1093/molbev/msm076
- Agnarsson I, Zambrana-Torrelio CM, Flores-Saldana NP, May-Collado LJ. A time-calibrated species-level phylogeny of bats (Chiroptera, Mammalia). PLoS Curr. 2011;3: RRN1212. doi: 10.1371/currents.RRN1212
- Roehrs ZP, Lack JB, Van Den Bussche RA. Tribal phylogenetic relationships within Vespertilioninae (Chiroptera: Vespertilionidae) based on mitochondrial and nuclear sequence data. J Mammal. 2010;91(5):1073–1092. doi: 10.1644/09-MAMM-A-325.1
- Zhang Q, Edwards SV. The evolution of intron size in amniotes: a role for powered flight? Genome Biol EVol. 2012;4(10):1033–1043. doi: 10.1093/gbe/evs070