Диагностика наследственных опухолевых синдромов методом высокопроизводительного секвенирования. Опыт создания базы данных

Обложка


Цитировать

Полный текст

Аннотация

Обоснование. Ежегодно в Российской Федерации регистрируются более 500 тыс. новых случаев злокачественных новообразований, из них более 50 тыс. обусловлено наследственными формами. Своевременная диагностика данных форм позволит выявлять онкологические заболевания на ранних стадиях и своевременно проводить лечебно-профилактические мероприятия.

Цель исследования — профилактика и ранняя диагностика наследственных форм онкологических заболеваний путем создания базы данных и разработки программного обеспечения для анализа данных таргетного высокопроизводительного секвенирования.

Методы. В исследование вошли 636 образцов ДНК, полученных от пациентов, у которых установлено онкологическое заболевание с высокой вероятностью наследственной природы или отягощенное семейным анамнезом. ДНК выделяли из лимфоцитов периферической крови. Подготовку библиотек ДНК осуществляли с использованием панели зондов KAPA Hyper (Roche). Панель включала в себя зонды для таргетного обогащения кодирующей части 44 генов. Высокопроизводительное секвенирование проводили на платформе MiSeq (Illumina).

Результаты. Выявлено 65 патогенных/вероятно патогенных вариантов нуклеотидной последовательности у 96 пациентов в генах ATM, BLM, BRCA1, BRCA2, CHEK2, EPCAM, MEN1, MLH1, MSH2, MSH3, MSH6, MUTYH, PALB2, TP53. Выявлено также 2858 вариантов нуклеотидной последовательности с неизвестным клиническим значением.

Заключение. Создана локальная база данных генетических вариантов, содержащая клинико-анамнестические данные. В настоящий момент в базу депонировано 4763 варианта нуклеотидной последовательности, из них 2522 — уникальные варианты, выявленные у 1 пациента.

Полный текст

ОБОСНОВАНИЕ

Среди всех случаев онкологических заболеваний 75% являются спорадическими, т.е. возникают случайным образом и связаны преимущественно с факторами внешней среды (солнечная радиация, загрязнение окружающей среды) и образом жизни (курение, злоупотребление вредными продуктами питания, ожирение, малоподвижный образ жизни). В 25% случаев диагностируют семейные формы злокачественных опухолей. Среди семейных форм выделяют наследственные формы, при которых был диагностирован патогенный вариант в протоонкогенах, либо генах-протекторах онкологических заболеваний [1].

Наследственные онкологические синдромы в странах Европы и Северной Америки изучаются достаточно давно. Существует большое количество работ, посвященных поиску герминальных нарушений при наследственном раке толстой кишки (синдром Линча, полипозы). Описано более 50 патогенных мутаций в исландских, французских, канадских, африканских, американских, польских и латиноамериканских популяционных группах [2, 3]. Выявлены драйверные мутации при раке молочной железы (РМЖ) и раке яичников в крупных исследованиях популяций евреев-ашкенази, скандинавских народов (норвежцы, финны). Менее масштабные исследования проводили в Бразилии [4]. В странах Азиатского региона (Бангладеш, материковый Китай, Гонконг, Индонезия, Япония, Корея, Малайзия, Филиппины, Сингапур, Таиланд, Вьетнам и этнические азиаты Канады и США) выявляется 7–10% РМЖ в составе наследственных синдромов [5]. Группа ученых из США провела масштабное исследование мутаций, ответственных за развитие наследственных РМЖ, рака яичников, синдрома Линча. Проанализировано 25 генов с изучением семейных историй, включающих диагноз на момент исследования и анамнез заболеваний в прошлом. У 6,8% (17 000) обследованных лиц из 252 223 включенных в исследование была обнаружена по меньшей мере одна патогенная мутация [6]. В России также проводятся исследования популяционной частоты клинически значимых вариантов при онкологических заболеваниях [7]. Такая работа наглядно демонстрирует необходимость применения комплексного метода диагностики генетических нарушений, основанного не только на общепризнанных данных о популяционной частоте и устоявшихся описаниях наследственных синдромов, но и на анализе более широкой выборки генов у лиц группы риска с целью определения собственной популяционной частоты и создания национального реестра мутаций.

Цель исследования — профилактика и ранняя диагностика наследственных форм онкологических заболеваний путем создания базы данных и разработки программного обеспечения для анализа данных таргетного высокопроизводительного секвенирования.

МЕТОДЫ

Клинико-анамнестическая характеристика образцов

В данное исследование были включены 636 образцов цельной крови от пациентов с диагнозом РМЖ, в том числе двусторонний, рак яичников, толстой кишки, желудка, тела матки, меланомы, рак почки, поджелудочной железы, опухоли головного мозга, лимфома Ходжкина, десмоид, опухоли желчных протоков, первично-множественные злокачественные новообразования и др. Средний возраст пациентов на момент манифестации заболевания составил 42,8±9,3 года.

Дизайн панели зондов для таргетного секвенирования кодирующих участков генов

Для создания таргетной панели нами были отобраны 44 гена (APC, ATM, AXIN2, BARD1, BLM, BMPR1A, BRCA1, BRCA2, BRIP1, CDH1, CDKN2A, CHEK2, DICER1, EPCAM, GALNT12, GREM1, MEN1, MLH1, MLH3, MSH2, MSH3, MSH6, MUTYH, NBN, NF1, NTHL1, PALB2, PMS2, POLD1, POLE, PTCH1, PTCH2, PTEN, RAD51C, RAD51D, RET, SMAD4, STK11, SUFU, TP53, TSC1, TSC2, VHL, WT1), ассоциированных с развитием основных опухолевых синдромов. Далее с помощью онлайн-сервиса HyperDesign от компании Roche (США) был проведен биоинформатический дизайн панели ДНК-зондов, включающий кодирующие участки данных генов, сайты сплайсинга, 5’-UTR области.

Подготовка ДНК-библиотек и высокопроизводительное секвенирование

Выделение ДНК из лимфоцитов проводили с помощью набора QIAamp DNA Blood Mini Kit (Qiagen, Германия). Пробоподготовку библиотек осуществляли с помощью набора KAPA HyperPrep Kit (Roche) по стандартному протоколу. Гибридизацию с таргетной панелью проводили также по стандартному протоколу Hyper (Roche). В качестве секвенирующей платформы была использована система MiSeq (Illumina, США), версия химии MiSeq Reagent Kit v2 500-cycles, позволяющая анализировать за один запуск до 96 библиотек.

Биоинформатическая обработка данных секвенирования

Генерация FastQ-файлов выполнялась с использованием программного обеспечения Illumina v2.4. Дальнейшая обработка данных проведена с использованием алгоритма, включающего выравнивание прочтений на референсную последовательность генома человека GRCh38 с помощью программного пакета BWA (burrows-wheeler-alignment), сортировку по координате, дедупликацию и повторное выравнивание с помощью сервиса Picard-tools, выявление вариантов нуклеотидной последовательности и фильтрацию вариантов по качеству с помощью GATK v4.1.8.1. Аннотацию выявленных вариантов по всем транскриптам для каждого гена из базы RefSeq, оценку популяционных частот с использованием выборки проектов Genome aggregation database (gnomAD), Exome Aggregation Consortium (ExAC), оценку влияния с применением ряда методов предсказания патогенности замен (SIFT, PolyPhen2-HDIV, PolyPhen2-HVAR), а также методов расчета эволюционной консервативности позиции (PhyloP, PhastCons) проводили при помощи программы OpenCravat. Классификация вариантов нуклеотидной последовательности проводилась на основании рекомендаций по интерпретации результатов высокопроизводительного секвенирования (NGS) American College of Medical Genetics and Genomics (ACMG) и сервиса Varsome.

Этическая экспертиза

Письменное информированное согласие было получено от всех пробандов, участвующих в исследовании. Все образцы были обезличены до получения исследовательской группой. В данном исследовании не используются идентифицируемые биологические образцы и не приводятся какие-либо конфиденциальные данные. Следовательно, согласно правилам этического комитета и национальным нормам, этот проект не требует этического одобрения.

РЕЗУЛЬТАТЫ

В результате анализа выявлено 65 патогенных вариантов нуклеотидной последовательности у 96 пациентов в генах ATM, BLM, BRCA1, BRCA2, CHEK2, EPCAM, MEN1, MLH1, MSH2, MSH3, MSH6, MUTYH, PALB2, TP53 (табл. 1). Выявлено также 2858 вариантов нуклеотидной последовательности с неизвестным клиническим значением.

 

Таблица 1. Патогенные варианты нуклеотидной последовательности / Table 1. Pathogenic variants

Ген

Координата

кДНК

Белок

Кол-во

ATM

chr11:108312424G>T

c.5932G>T

p.Glu1978Ter

2

ATM

chr11:108235784delTTCT

c.450_453del

p.Ser151Ter

1

ATM

chr11:108335105T>C

c.8147T>C

p.Val2716Ala

1

BLM

chr15:90761015C>T

c.1642C>T

p.Gln548Ter

2

BLM

chr15:90763016C>T

c.1933C>T

p.Gln645Ter

1

BRCA1

chr17:43057063insG

c.5266dup

p.Gln1756ProfsTer74

17

BRCA1

chr17:43091496delT

c.4035del

p.Glu1346LysfsTer20

3

BRCA1

chr17:43071225G>C

c.4689C>G

p.Tyr1563Ter

2

BRCA1

chr17:43106487A>C

c.181T>G

p.Cys61Gly

2

BRCA1

chr17:43045767G>A

c.5503C>T

p.Arg1835Ter

1

BRCA1

chr17:43057078G>A

c.5251C>T

p.Arg1751Ter

1

BRCA1

chr17:43067608C>G

c.5074G>C

p.Asp1692His

1

BRCA1

chr17:43091772delAGAC

c.3756_3759del

p.Ser1253ArgfsTer10

1

BRCA1

chr17:43091827delTTTAC

c.3700_3704del

p.Val1234GlnfsTer8

1

BRCA1

chr17:43092280delAGCAT

c.3247_3251del

p.Met1083Ter

1

BRCA1

chr17:43093570insT

c.1961dup

p.Tyr655ValfsTer18

1

BRCA1

chr17:43094021delG

c.1510del

p.Arg504ValfsTer28

1

BRCA1

chr17:43094023delTTTAA

c.1504_1508del

p.Leu502AlafsTer2

1

BRCA1

chr17:43094731G>C

c.800C>G

p.Ser267Ter

1

BRCA1

chr17:43104242delA

c.321del

p.Phe107LeufsTer12

1

BRCA1

chr17:43115780C>G

c.81-1G>C

-

1

BRCA1

chr17:43124028delCT

c.68_69del

p.Glu23ValfsTer17

1

BRCA2

chr13:32337161delAAAC

c.2808_2811del

p.Ala938ProfsTer21

2

BRCA2

chr13:32340757delTAACT

c.6405_6409del

p.Asn2135LysfsTer3

2

BRCA2

chr13:32362596A>T

c.7879A>T

p.Ile2627Phe

2

BRCA2

chr13:32380136delA

c.9253del

p.Thr3085GlnfsTer19

2

BRCA2

chr13:32316528G>A

c.67+1G>A

-

1

BRCA2

chr13:32326104delT

c.429del

p.Val144LeufsTer8

1

BRCA2

chr13:32326143insT

c.468dup

p.Lys157Ter

1

BRCA2

chr13:32330933delT

c.700del

p.Ser234ProfsTer7

1

BRCA2

chr13:32332779delAAAG

c.1310_1313del

p.Lys437IlefsTer22

1

BRCA2

chr13:32336624delA

c.2272del

p.Ser758ValfsTer14

1

BRCA2

chr13:32337006delCAGA

c.2653_2656del

p.Asp885MetfsTer9

1

BRCA2

chr13:32337522delAAAA

c.3167_3170del

p.Gln1056ArgfsTer3

1

BRCA2

chr13:32339548delTC

c.5197_5198del

p.Ser1733ArgfsTer9

1

BRCA2

chr13:32339593insT

c.5238dup

p.Asn1747Ter

1

BRCA2

chr13:32339641delT

c.5286T>G

p.Tyr1762Ter

1

BRCA2

chr13:32340073delCT

c.5722_5723del

p.Leu1908ArgfsTer2

1

BRCA2

chr13:32340301delT

c.5946del

p.Ser1982ArgfsTer22

1

BRCA2

chr13:32340824C>T

c.6469C>T

p.Gln2157Ter

1

BRCA2

chr13:32340848delT

c.6494del

p.Leu2165TrpfsTer3

1

BRCA2

chr13:32357845G>A

c.7721G>A

p.Trp2574Ter

1

BRCA2

chr13:32370955G>A

c.8488-1G>A

-

1

BRCA2

chr13:32371044delAA

c.8578_8579del

p.Lys2860GlufsTer8

1

BRCA2

chr13:32380147T>C

c.9256+2T>C

-

1

CHEK2

chr22:28725242C>T

c.444+1G>A

-

2

CHEK2

chr22:28725254G>A

c.433C>T

p.Arg145Trp

2

CHEK2

chr22:28695134insT

c.1368dup

p.Glu457ArgfsTer33

1

EPCAM

chr2:47375237G>A

c.429G>A

p.Trp143Ter

1

MEN1

chr11:64810109T>C

c.1A>G

p. Met1Val

1

MLH1

chr3:37047632delGAA

c.1852_1854del

p.Lys618del

2

MLH1

chr3:37042331G>A

c.1731G>A

p.Ser577Ser

1

MSH2

chr2:47414411delT

c.939del

p.Gln314ArgfsTer17

1

MSH3

chr5:80813614G>T

c.2686G>T

p.Gly896Ter

1

MSH6

chr2:47799403insGT

c.1421_1422dup

p.Gln475CysfsTer7

1

MUTYH

chr1:45331556C>T

c.1103G>A

p.Gly368Asp

6

MUTYH

chr1:45332310C>T

c.705G>A

p.Trp235Ter

1

MUTYH

chr1:45332780G>A

c.475C>T

p.Gln159Ter

1

PALB2

chr16:23637886delACAA

c.172_175del

p.Gln60ArgfsTer7

2

PALB2

chr16:23636036delTC

c.509_510del

p.Arg170IlefsTer14

1

TP53

chr17:7674220C>T

c.743G>A

p.Arg248Gln

1

TP53

chr17:7674872T>C

c.659A>G

p.Tyr220Cys

1

TP53

chr17:7675124T>C

c.488A>G

p.Tyr163Cys

1

TP53

chr17:7675139C>T

c.473G>A

p.Arg158His

1

TP53

chr17:7673821G>A

c.799C>T

p.Arg267Trp

1

 

ОБСУЖДЕНИЕ

Наиболее часто встречались патогенные варианты в генах BRCA1 и BRCA2 — у 37 и 27 пациентов соответственно. Самый распространенный вариант c.5266dup, p.Gln1756ProfsTer в гене BRCA1, также известный как 5382insC, был выявлен у 17 пациентов с РМЖ, двусторонним РМЖ, раком яичников, что соответствует данным, полученным ранее другими исследовательскими группами [7]. В гене BRCA2 мажорных мутаций на основании полученных данных выделить не удается. Из всех выявленных патогенных вариантов в генах BRCA1 и BRCA2 лишь 4 входят в стандартные панели распространенных тест-систем в России.

У нескольких пациентов выявлено также сочетание двух патогенных вариантов: у пациентки с РМЖ выявлены мутации c.321del, p.Phe107LeufsTer в гене BRCA1 и c.1933C>T, p.Gln645Ter в гене BLM; у пациентки с диагнозом первично-множественных злокачественных новообразований (рак щитовидной железы, РМЖ, рак маточной трубы) выявлены мутации c.5503C>T, p.Arg1835Ter в гене BRCA1 и c.172_175del, p.Gln60ArgfsTer в гене PALB2; у пациентки с диагнозом первично-множественных злокачественных новообразований (рак эндометрия, РМЖ) выявлены мутации c.1421_1422dup, p.Gln475CysfsTer в гене MSH6 и c.7879A>T, p.Ile2627Phe в гене BRCA2. У 9 пациентов выявлено сочетание мутации в генах BRCA1, BRCA2, MLH1, MSH3, EPCAM с вариантом c.470T>C, p.Ile157Thr в гене CHEK2. У пациентов с диагнозом РМЖ и РМЖ в сочетании с лейомиосаркомой были выявлены патогенные варианты в гене TP53. Все вышеперечисленное подчеркивает актуальность исследования кодирующей последовательности данных генов, в том числе при проведении предварительной ПЦР-диагностики.

ЗАКЛЮЧЕНИЕ

Создана локальная база данных генетических вариантов, и соответствующих им клинико-анамнестических данных. По мере дополнения базы данных новыми данными секвенирования будет проводиться дальнейшая статистическая и клиническая характеристика выявленных генетических вариантов. В перспективе накопленные данные могут быть использованы как для анализа эпидемиологии онкологических заболеваний, так и разработки тест-систем, актуальных для российской популяции.

ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ

Вклад авторов. Строганова А.М., Рябая О.О., Данишевич А.М. — сбор образцов и клинико-анамнестическая характеристика; Хахина А.О., Закаморная А.И. — экспериментальная часть работы; Абрамов И.С., Лисица Т.С., Мацвай А.Д., Шипулин Г.А. — планирование и контроль экспериментов, обработка данных, написание и рецензирование статьи. Авторы подтверждают соответствие своего авторства международным критериям ICMJE (все авторы внесли существенный вклад в разработку концепции, проведение исследования и подготовку статьи, прочли и одобрили финальную версию перед публикацией).

Author contribution. Stroganova A.M., Ryabaya O.O., Danishevich A.M. — collection of samples and anamnestic characteristics; Khakhina A.O., Zakamornaya A.I. — the experimental part; Abramov I.S., Lisitsa T.S., Matsvai A.D., Shipulin G.A. — planning and control of experiments, data processing, writing and reviewing the article. The authors made a substantial contribution to the conception of the work, acquisition, analysis, interpretation of data for the work, drafting and revising the work, final approval of the version to be published and agreeing to be accountable for all aspects of the work.

Источник финансирования. Исследование выполнено в рамках государственного задания № 388-00102-20-01/388-00154-21-00.

Funding source.

The study was done with a support of the state assignment № 388-00102-20-01/ 388-00154-21-00

Конфликт интересов. Авторы данной статьи подтвердили отсутствие конфликта интересов, о котором необходимо сообщить.

Competing interests. The authors declare that they have no competing interests.

×

Об авторах

Иван Сергеевич Абрамов

Центр стратегического планирования и управления медико-биологическими рисками здоровью Федерального медико-биологического агентства

Автор, ответственный за переписку.
Email: IAbramov@cspmz.ru
ORCID iD: 0000-0002-6954-1564
SPIN-код: 1436-3601
Россия, 119121, Москва, ул. Погодинская, д. 10, с. 1

Татьяна Сергеевна Лисица

Центр стратегического планирования и управления медико-биологическими рисками здоровью Федерального медико-биологического агентства

Email: Tlisitsa@cspmz.ru
ORCID iD: 0000-0002-6212-7627
SPIN-код: 2289-4331
Россия, 119121, Москва, ул. Погодинская, д. 10, с. 1

Анна Михайловна Строганова

Национальный медицинский исследовательский центр онкологии имени Н.Н. Блохина

Email: stroganova_am@mail.ru
ORCID iD: 0000-0002-7297-5240
SPIN-код: 5295-3338

к.м.н.

Россия, Москва

Оксана Олеговна Рябая

Национальный медицинский исследовательский центр онкологии имени Н.Н. Блохина

Email: oxa2601@yandex.ru
ORCID iD: 0000-0001-6295-3497
SPIN-код: 4865-5850

к.б.н.

Россия, Москва

Анастасия Михайловна Данишевич

Московский клинический научно-практический центр имени А.С. Логинова Департамента здравоохранения Москвы

Email: danisham7@gmail.com
ORCID iD: 0000-0002-3573-8342
SPIN-код: 3195-1760
Россия, Москва

Анастасия Олеговна Хахина

Центр стратегического планирования и управления медико-биологическими рисками здоровью Федерального медико-биологического агентства

Email: AKhakhina@cspmz.ru
ORCID iD: 0000-0002-0723-9765
SPIN-код: 2922-9674
Россия, 119121, Москва, ул. Погодинская, д. 10, с. 1

Анастасия Ивановна Закаморная

Центр стратегического планирования и управления медико-биологическими рисками здоровью Федерального медико-биологического агентства

Email: AZakamornaya@cspmz.ru
ORCID iD: 0000-0001-5151-0236
SPIN-код: 6263-9686
Россия, 119121, Москва, ул. Погодинская, д. 10, с. 1

Алина Дмитриевна Мацвай

Центр стратегического планирования и управления медико-биологическими рисками здоровью Федерального медико-биологического агентства

Email: AMatsvay@cspmz.ru
ORCID iD: 0000-0002-6301-9169
SPIN-код: 2679-3183
Россия, 119121, Москва, ул. Погодинская, д. 10, с. 1

Герман Александрович Шипулин

Центр стратегического планирования и управления медико-биологическими рисками здоровью Федерального медико-биологического агентства

Email: shipulin@cspmz.ru
ORCID iD: 0000-0002-3668-6601
SPIN-код: 1908-9098
Россия, 119121, Москва, ул. Погодинская, д. 10, с. 1

Список литературы

  1. Имянитов Е.Н. Общие представления о наследственных опухолевых синдромах // Практическая онкология. 2014. Т. 15, № 3. С. 101–106. [Imyanitov EN. General ideas about hereditary tumor syndromes. Practical Oncology. 2014;15(3):101–106. (In Russ).]
  2. Biller LH, Syngal S, Yurgelun MB. Recent advances in Lynch syndrome. Fam Cancer. 2019;18(2):211–219. doi: 10.1007/s10689-018-00117-1
  3. Haraldsdottir S, Rafnar F, Frankel WL, et al. Comprehensive population-wide analysis of Lynch syndrome in Iceland reveals founder mutations in MSH6 and PMS2. Nat Commun. 2017;8(1):14755. doi: 10.1038/ncomms14755
  4. Felix GE, Abe-Sandes C, Machado-Lopes TM, et al. Germline mutations in BRCA1, BRCA2, CHEK2 and TP53 in patients at high-risk for HBOC: characterizing a Northeast Brazilian Population. Hum Genome Var. 2014;1:14012. doi: 10.1038/hgv.2014.12
  5. Kwong A, Shin VY, Ho JC, et al. Comprehensive spectrum of BRCA1 and BRCA2 deleterious mutations in breast cancer in Asian countries. J Med Genet. 2016;53(1):15–23. doi: 10.1136/jmedgenet-2015-103132
  6. Rosenthal ET, Bernhisel R, Brown K, et al. Clinical testing with a panel of 25 genes associated with increased cancer risk results in a significant increase in clinically significant findings across a broad range of cancer histories. Cancer Genet. 2017; 218-219:58–68. doi: 10.1016/j.cancergen.2017.09.003
  7. Никитин А.Г., Бровкина О.И., Ходырев Д.С., и др. Опыт создания публичной базы данных мутаций oncoBRCA: биоинформационные проблемы и решения // Клиническая практика. 2020. Т. 11, № 1. С. 21–29. [Nikitin AG, Brovkina OI, Khodyrev DS, et al. The experience of creating a public database of oncoBRCA mutations: bioinformatic problems and solutions. Journal of Clinical Practice. 2020;11(1):21–29. (In Russ).] doi: 10.17816/clinpract25860

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Абрамов И.С., Лисица Т.С., Строганова А.М., Рябая О.О., Данишевич А.М., Хахина А.О., Закаморная А.И., Мацвай А.Д., Шипулин Г.А., 2021

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ПИ № ФС 77 - 38032 от 11 ноября 2009 года.


Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах