Diagnostics of hereditary cancer syndromes by ngs. A database creation experience

Cover Page


Cite item

Full Text

Abstract

Background: More than 500 thousand new cases of malignant neoplasms are registered annually in the Russian Federation, of which more than 50 thousand new cases are due to hereditary forms. Improving the diagnosis of these diseases will make it possible to detect tumors at the early stages and take timely preventive and therapeutic measures.

Aims: Creation of a database and development of a software for the NGS data analysis for the prevention and early diagnosis of hereditary forms of oncological diseases.

Methods: The present study used 636 DNA samples obtained from cancer patients with a high hereditary risk or a burdened family history. DNA was isolated from blood lymphocytes. DNA libraries were prepared with a KAPA Target Enrichment Panel (Roche). The panel included probes for targeted enrichment of the coding region of 44 genes. NGS was performed on the MiSeq platform (Illumina).

Results: We identified 65 pathogenic/ probably pathogenic nucleotide sequence variants in 96 patients in the ATM, BLM, BRCA1, BRCA2, CHEK2, EPCAM, MEN1, MLH1, MSH2, MSH3, MSH6, MUTYH, PALB2, TP53 genes. We also identified 2858 nucleotide sequence variants of unknown clinical significance. Conclusions: We have created a local database that contains both genetic variants and clinical and anamnestic data. The database contains 4763 nucleotide sequence variants at the moment, among which 2522 are unique variants identified in a single patient.

Full Text

ОБОСНОВАНИЕ

Среди всех случаев онкологических заболеваний 75% являются спорадическими, т.е. возникают случайным образом и связаны преимущественно с факторами внешней среды (солнечная радиация, загрязнение окружающей среды) и образом жизни (курение, злоупотребление вредными продуктами питания, ожирение, малоподвижный образ жизни). В 25% случаев диагностируют семейные формы злокачественных опухолей. Среди семейных форм выделяют наследственные формы, при которых был диагностирован патогенный вариант в протоонкогенах, либо генах-протекторах онкологических заболеваний [1].

Наследственные онкологические синдромы в странах Европы и Северной Америки изучаются достаточно давно. Существует большое количество работ, посвященных поиску герминальных нарушений при наследственном раке толстой кишки (синдром Линча, полипозы). Описано более 50 патогенных мутаций в исландских, французских, канадских, африканских, американских, польских и латиноамериканских популяционных группах [2, 3]. Выявлены драйверные мутации при раке молочной железы (РМЖ) и раке яичников в крупных исследованиях популяций евреев-ашкенази, скандинавских народов (норвежцы, финны). Менее масштабные исследования проводили в Бразилии [4]. В странах Азиатского региона (Бангладеш, материковый Китай, Гонконг, Индонезия, Япония, Корея, Малайзия, Филиппины, Сингапур, Таиланд, Вьетнам и этнические азиаты Канады и США) выявляется 7–10% РМЖ в составе наследственных синдромов [5]. Группа ученых из США провела масштабное исследование мутаций, ответственных за развитие наследственных РМЖ, рака яичников, синдрома Линча. Проанализировано 25 генов с изучением семейных историй, включающих диагноз на момент исследования и анамнез заболеваний в прошлом. У 6,8% (17 000) обследованных лиц из 252 223 включенных в исследование была обнаружена по меньшей мере одна патогенная мутация [6]. В России также проводятся исследования популяционной частоты клинически значимых вариантов при онкологических заболеваниях [7]. Такая работа наглядно демонстрирует необходимость применения комплексного метода диагностики генетических нарушений, основанного не только на общепризнанных данных о популяционной частоте и устоявшихся описаниях наследственных синдромов, но и на анализе более широкой выборки генов у лиц группы риска с целью определения собственной популяционной частоты и создания национального реестра мутаций.

Цель исследования — профилактика и ранняя диагностика наследственных форм онкологических заболеваний путем создания базы данных и разработки программного обеспечения для анализа данных таргетного высокопроизводительного секвенирования.

МЕТОДЫ

Клинико-анамнестическая характеристика образцов

В данное исследование были включены 636 образцов цельной крови от пациентов с диагнозом РМЖ, в том числе двусторонний, рак яичников, толстой кишки, желудка, тела матки, меланомы, рак почки, поджелудочной железы, опухоли головного мозга, лимфома Ходжкина, десмоид, опухоли желчных протоков, первично-множественные злокачественные новообразования и др. Средний возраст пациентов на момент манифестации заболевания составил 42,8±9,3 года.

Дизайн панели зондов для таргетного секвенирования кодирующих участков генов

Для создания таргетной панели нами были отобраны 44 гена (APC, ATM, AXIN2, BARD1, BLM, BMPR1A, BRCA1, BRCA2, BRIP1, CDH1, CDKN2A, CHEK2, DICER1, EPCAM, GALNT12, GREM1, MEN1, MLH1, MLH3, MSH2, MSH3, MSH6, MUTYH, NBN, NF1, NTHL1, PALB2, PMS2, POLD1, POLE, PTCH1, PTCH2, PTEN, RAD51C, RAD51D, RET, SMAD4, STK11, SUFU, TP53, TSC1, TSC2, VHL, WT1), ассоциированных с развитием основных опухолевых синдромов. Далее с помощью онлайн-сервиса HyperDesign от компании Roche (США) был проведен биоинформатический дизайн панели ДНК-зондов, включающий кодирующие участки данных генов, сайты сплайсинга, 5’-UTR области.

Подготовка ДНК-библиотек и высокопроизводительное секвенирование

Выделение ДНК из лимфоцитов проводили с помощью набора QIAamp DNA Blood Mini Kit (Qiagen, Германия). Пробоподготовку библиотек осуществляли с помощью набора KAPA HyperPrep Kit (Roche) по стандартному протоколу. Гибридизацию с таргетной панелью проводили также по стандартному протоколу Hyper (Roche). В качестве секвенирующей платформы была использована система MiSeq (Illumina, США), версия химии MiSeq Reagent Kit v2 500-cycles, позволяющая анализировать за один запуск до 96 библиотек.

Биоинформатическая обработка данных секвенирования

Генерация FastQ-файлов выполнялась с использованием программного обеспечения Illumina v2.4. Дальнейшая обработка данных проведена с использованием алгоритма, включающего выравнивание прочтений на референсную последовательность генома человека GRCh38 с помощью программного пакета BWA (burrows-wheeler-alignment), сортировку по координате, дедупликацию и повторное выравнивание с помощью сервиса Picard-tools, выявление вариантов нуклеотидной последовательности и фильтрацию вариантов по качеству с помощью GATK v4.1.8.1. Аннотацию выявленных вариантов по всем транскриптам для каждого гена из базы RefSeq, оценку популяционных частот с использованием выборки проектов Genome aggregation database (gnomAD), Exome Aggregation Consortium (ExAC), оценку влияния с применением ряда методов предсказания патогенности замен (SIFT, PolyPhen2-HDIV, PolyPhen2-HVAR), а также методов расчета эволюционной консервативности позиции (PhyloP, PhastCons) проводили при помощи программы OpenCravat. Классификация вариантов нуклеотидной последовательности проводилась на основании рекомендаций по интерпретации результатов высокопроизводительного секвенирования (NGS) American College of Medical Genetics and Genomics (ACMG) и сервиса Varsome.

Этическая экспертиза

Письменное информированное согласие было получено от всех пробандов, участвующих в исследовании. Все образцы были обезличены до получения исследовательской группой. В данном исследовании не используются идентифицируемые биологические образцы и не приводятся какие-либо конфиденциальные данные. Следовательно, согласно правилам этического комитета и национальным нормам, этот проект не требует этического одобрения.

РЕЗУЛЬТАТЫ

В результате анализа выявлено 65 патогенных вариантов нуклеотидной последовательности у 96 пациентов в генах ATM, BLM, BRCA1, BRCA2, CHEK2, EPCAM, MEN1, MLH1, MSH2, MSH3, MSH6, MUTYH, PALB2, TP53 (табл. 1). Выявлено также 2858 вариантов нуклеотидной последовательности с неизвестным клиническим значением.

 

Таблица 1. Патогенные варианты нуклеотидной последовательности / Table 1. Pathogenic variants

Ген

Координата

кДНК

Белок

Кол-во

ATM

chr11:108312424G>T

c.5932G>T

p.Glu1978Ter

2

ATM

chr11:108235784delTTCT

c.450_453del

p.Ser151Ter

1

ATM

chr11:108335105T>C

c.8147T>C

p.Val2716Ala

1

BLM

chr15:90761015C>T

c.1642C>T

p.Gln548Ter

2

BLM

chr15:90763016C>T

c.1933C>T

p.Gln645Ter

1

BRCA1

chr17:43057063insG

c.5266dup

p.Gln1756ProfsTer74

17

BRCA1

chr17:43091496delT

c.4035del

p.Glu1346LysfsTer20

3

BRCA1

chr17:43071225G>C

c.4689C>G

p.Tyr1563Ter

2

BRCA1

chr17:43106487A>C

c.181T>G

p.Cys61Gly

2

BRCA1

chr17:43045767G>A

c.5503C>T

p.Arg1835Ter

1

BRCA1

chr17:43057078G>A

c.5251C>T

p.Arg1751Ter

1

BRCA1

chr17:43067608C>G

c.5074G>C

p.Asp1692His

1

BRCA1

chr17:43091772delAGAC

c.3756_3759del

p.Ser1253ArgfsTer10

1

BRCA1

chr17:43091827delTTTAC

c.3700_3704del

p.Val1234GlnfsTer8

1

BRCA1

chr17:43092280delAGCAT

c.3247_3251del

p.Met1083Ter

1

BRCA1

chr17:43093570insT

c.1961dup

p.Tyr655ValfsTer18

1

BRCA1

chr17:43094021delG

c.1510del

p.Arg504ValfsTer28

1

BRCA1

chr17:43094023delTTTAA

c.1504_1508del

p.Leu502AlafsTer2

1

BRCA1

chr17:43094731G>C

c.800C>G

p.Ser267Ter

1

BRCA1

chr17:43104242delA

c.321del

p.Phe107LeufsTer12

1

BRCA1

chr17:43115780C>G

c.81-1G>C

-

1

BRCA1

chr17:43124028delCT

c.68_69del

p.Glu23ValfsTer17

1

BRCA2

chr13:32337161delAAAC

c.2808_2811del

p.Ala938ProfsTer21

2

BRCA2

chr13:32340757delTAACT

c.6405_6409del

p.Asn2135LysfsTer3

2

BRCA2

chr13:32362596A>T

c.7879A>T

p.Ile2627Phe

2

BRCA2

chr13:32380136delA

c.9253del

p.Thr3085GlnfsTer19

2

BRCA2

chr13:32316528G>A

c.67+1G>A

-

1

BRCA2

chr13:32326104delT

c.429del

p.Val144LeufsTer8

1

BRCA2

chr13:32326143insT

c.468dup

p.Lys157Ter

1

BRCA2

chr13:32330933delT

c.700del

p.Ser234ProfsTer7

1

BRCA2

chr13:32332779delAAAG

c.1310_1313del

p.Lys437IlefsTer22

1

BRCA2

chr13:32336624delA

c.2272del

p.Ser758ValfsTer14

1

BRCA2

chr13:32337006delCAGA

c.2653_2656del

p.Asp885MetfsTer9

1

BRCA2

chr13:32337522delAAAA

c.3167_3170del

p.Gln1056ArgfsTer3

1

BRCA2

chr13:32339548delTC

c.5197_5198del

p.Ser1733ArgfsTer9

1

BRCA2

chr13:32339593insT

c.5238dup

p.Asn1747Ter

1

BRCA2

chr13:32339641delT

c.5286T>G

p.Tyr1762Ter

1

BRCA2

chr13:32340073delCT

c.5722_5723del

p.Leu1908ArgfsTer2

1

BRCA2

chr13:32340301delT

c.5946del

p.Ser1982ArgfsTer22

1

BRCA2

chr13:32340824C>T

c.6469C>T

p.Gln2157Ter

1

BRCA2

chr13:32340848delT

c.6494del

p.Leu2165TrpfsTer3

1

BRCA2

chr13:32357845G>A

c.7721G>A

p.Trp2574Ter

1

BRCA2

chr13:32370955G>A

c.8488-1G>A

-

1

BRCA2

chr13:32371044delAA

c.8578_8579del

p.Lys2860GlufsTer8

1

BRCA2

chr13:32380147T>C

c.9256+2T>C

-

1

CHEK2

chr22:28725242C>T

c.444+1G>A

-

2

CHEK2

chr22:28725254G>A

c.433C>T

p.Arg145Trp

2

CHEK2

chr22:28695134insT

c.1368dup

p.Glu457ArgfsTer33

1

EPCAM

chr2:47375237G>A

c.429G>A

p.Trp143Ter

1

MEN1

chr11:64810109T>C

c.1A>G

p. Met1Val

1

MLH1

chr3:37047632delGAA

c.1852_1854del

p.Lys618del

2

MLH1

chr3:37042331G>A

c.1731G>A

p.Ser577Ser

1

MSH2

chr2:47414411delT

c.939del

p.Gln314ArgfsTer17

1

MSH3

chr5:80813614G>T

c.2686G>T

p.Gly896Ter

1

MSH6

chr2:47799403insGT

c.1421_1422dup

p.Gln475CysfsTer7

1

MUTYH

chr1:45331556C>T

c.1103G>A

p.Gly368Asp

6

MUTYH

chr1:45332310C>T

c.705G>A

p.Trp235Ter

1

MUTYH

chr1:45332780G>A

c.475C>T

p.Gln159Ter

1

PALB2

chr16:23637886delACAA

c.172_175del

p.Gln60ArgfsTer7

2

PALB2

chr16:23636036delTC

c.509_510del

p.Arg170IlefsTer14

1

TP53

chr17:7674220C>T

c.743G>A

p.Arg248Gln

1

TP53

chr17:7674872T>C

c.659A>G

p.Tyr220Cys

1

TP53

chr17:7675124T>C

c.488A>G

p.Tyr163Cys

1

TP53

chr17:7675139C>T

c.473G>A

p.Arg158His

1

TP53

chr17:7673821G>A

c.799C>T

p.Arg267Trp

1

 

ОБСУЖДЕНИЕ

Наиболее часто встречались патогенные варианты в генах BRCA1 и BRCA2 — у 37 и 27 пациентов соответственно. Самый распространенный вариант c.5266dup, p.Gln1756ProfsTer в гене BRCA1, также известный как 5382insC, был выявлен у 17 пациентов с РМЖ, двусторонним РМЖ, раком яичников, что соответствует данным, полученным ранее другими исследовательскими группами [7]. В гене BRCA2 мажорных мутаций на основании полученных данных выделить не удается. Из всех выявленных патогенных вариантов в генах BRCA1 и BRCA2 лишь 4 входят в стандартные панели распространенных тест-систем в России.

У нескольких пациентов выявлено также сочетание двух патогенных вариантов: у пациентки с РМЖ выявлены мутации c.321del, p.Phe107LeufsTer в гене BRCA1 и c.1933C>T, p.Gln645Ter в гене BLM; у пациентки с диагнозом первично-множественных злокачественных новообразований (рак щитовидной железы, РМЖ, рак маточной трубы) выявлены мутации c.5503C>T, p.Arg1835Ter в гене BRCA1 и c.172_175del, p.Gln60ArgfsTer в гене PALB2; у пациентки с диагнозом первично-множественных злокачественных новообразований (рак эндометрия, РМЖ) выявлены мутации c.1421_1422dup, p.Gln475CysfsTer в гене MSH6 и c.7879A>T, p.Ile2627Phe в гене BRCA2. У 9 пациентов выявлено сочетание мутации в генах BRCA1, BRCA2, MLH1, MSH3, EPCAM с вариантом c.470T>C, p.Ile157Thr в гене CHEK2. У пациентов с диагнозом РМЖ и РМЖ в сочетании с лейомиосаркомой были выявлены патогенные варианты в гене TP53. Все вышеперечисленное подчеркивает актуальность исследования кодирующей последовательности данных генов, в том числе при проведении предварительной ПЦР-диагностики.

ЗАКЛЮЧЕНИЕ

Создана локальная база данных генетических вариантов, и соответствующих им клинико-анамнестических данных. По мере дополнения базы данных новыми данными секвенирования будет проводиться дальнейшая статистическая и клиническая характеристика выявленных генетических вариантов. В перспективе накопленные данные могут быть использованы как для анализа эпидемиологии онкологических заболеваний, так и разработки тест-систем, актуальных для российской популяции.

ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ

Вклад авторов. Строганова А.М., Рябая О.О., Данишевич А.М. — сбор образцов и клинико-анамнестическая характеристика; Хахина А.О., Закаморная А.И. — экспериментальная часть работы; Абрамов И.С., Лисица Т.С., Мацвай А.Д., Шипулин Г.А. — планирование и контроль экспериментов, обработка данных, написание и рецензирование статьи. Авторы подтверждают соответствие своего авторства международным критериям ICMJE (все авторы внесли существенный вклад в разработку концепции, проведение исследования и подготовку статьи, прочли и одобрили финальную версию перед публикацией).

Author contribution. Stroganova A.M., Ryabaya O.O., Danishevich A.M. — collection of samples and anamnestic characteristics; Khakhina A.O., Zakamornaya A.I. — the experimental part; Abramov I.S., Lisitsa T.S., Matsvai A.D., Shipulin G.A. — planning and control of experiments, data processing, writing and reviewing the article. The authors made a substantial contribution to the conception of the work, acquisition, analysis, interpretation of data for the work, drafting and revising the work, final approval of the version to be published and agreeing to be accountable for all aspects of the work.

Источник финансирования. Исследование выполнено в рамках государственного задания № 388-00102-20-01/388-00154-21-00.

Funding source.

The study was done with a support of the state assignment № 388-00102-20-01/ 388-00154-21-00

Конфликт интересов. Авторы данной статьи подтвердили отсутствие конфликта интересов, о котором необходимо сообщить.

Competing interests. The authors declare that they have no competing interests.

×

About the authors

Ivan S. Abramov

Centre for Strategic Planning and Management of Biomedical Health Risks of the Federal Medical Biological Agency

Author for correspondence.
Email: IAbramov@cspmz.ru
ORCID iD: 0000-0002-6954-1564
SPIN-code: 1436-3601
Russian Federation, 10 bild. 1, Pogodinskaya street, 119121, Moscow

Tatyana S. Lisitsa

Centre for Strategic Planning and Management of Biomedical Health Risks of the Federal Medical Biological Agency

Email: Tlisitsa@cspmz.ru
ORCID iD: 0000-0002-6212-7627
SPIN-code: 2289-4331
Russian Federation, 10 bild. 1, Pogodinskaya street, 119121, Moscow

Anna M. Stroganova

N.N. Blokhin National Medical Research Center of Oncology

Email: stroganova_am@mail.ru
ORCID iD: 0000-0002-7297-5240
SPIN-code: 5295-3338

MD, Cand. Sci. (Med.)

Russian Federation, Moscow

Oxana O. Ryabaya

N.N. Blokhin National Medical Research Center of Oncology

Email: oxa2601@yandex.ru
ORCID iD: 0000-0001-6295-3497
SPIN-code: 4865-5850

Cand. Sci. (Biol.)

Russian Federation, Moscow

Anastasiya M. Danishevich

Moscow Clinical Scientific Center

Email: danisham7@gmail.com
ORCID iD: 0000-0002-3573-8342
SPIN-code: 3195-1760
Russian Federation, Moscow

Anastasia O. Khakhina

Centre for Strategic Planning and Management of Biomedical Health Risks of the Federal Medical Biological Agency

Email: AKhakhina@cspmz.ru
ORCID iD: 0000-0002-0723-9765
SPIN-code: 2922-9674
Russian Federation, 10 bild. 1, Pogodinskaya street, 119121, Moscow

Anastasiya I. Zakamornaya

Centre for Strategic Planning and Management of Biomedical Health Risks of the Federal Medical Biological Agency

Email: AZakamornaya@cspmz.ru
ORCID iD: 0000-0001-5151-0236
SPIN-code: 6263-9686
Russian Federation, 10 bild. 1, Pogodinskaya street, 119121, Moscow

Alina D. Matsvay

Centre for Strategic Planning and Management of Biomedical Health Risks of the Federal Medical Biological Agency

Email: AMatsvay@cspmz.ru
ORCID iD: 0000-0002-6301-9169
SPIN-code: 2679-3183
Russian Federation, 10 bild. 1, Pogodinskaya street, 119121, Moscow

German A. Shipulin

Centre for Strategic Planning and Management of Biomedical Health Risks of the Federal Medical Biological Agency

Email: shipulin@cspmz.ru
ORCID iD: 0000-0002-3668-6601
SPIN-code: 1908-9098
Russian Federation, 10 bild. 1, Pogodinskaya street, 119121, Moscow

References

  1. Имянитов Е.Н. Общие представления о наследственных опухолевых синдромах // Практическая онкология. 2014. Т. 15, № 3. С. 101–106. [Imyanitov EN. General ideas about hereditary tumor syndromes. Practical Oncology. 2014;15(3):101–106. (In Russ).]
  2. Biller LH, Syngal S, Yurgelun MB. Recent advances in Lynch syndrome. Fam Cancer. 2019;18(2):211–219. doi: 10.1007/s10689-018-00117-1
  3. Haraldsdottir S, Rafnar F, Frankel WL, et al. Comprehensive population-wide analysis of Lynch syndrome in Iceland reveals founder mutations in MSH6 and PMS2. Nat Commun. 2017;8(1):14755. doi: 10.1038/ncomms14755
  4. Felix GE, Abe-Sandes C, Machado-Lopes TM, et al. Germline mutations in BRCA1, BRCA2, CHEK2 and TP53 in patients at high-risk for HBOC: characterizing a Northeast Brazilian Population. Hum Genome Var. 2014;1:14012. doi: 10.1038/hgv.2014.12
  5. Kwong A, Shin VY, Ho JC, et al. Comprehensive spectrum of BRCA1 and BRCA2 deleterious mutations in breast cancer in Asian countries. J Med Genet. 2016;53(1):15–23. doi: 10.1136/jmedgenet-2015-103132
  6. Rosenthal ET, Bernhisel R, Brown K, et al. Clinical testing with a panel of 25 genes associated with increased cancer risk results in a significant increase in clinically significant findings across a broad range of cancer histories. Cancer Genet. 2017; 218-219:58–68. doi: 10.1016/j.cancergen.2017.09.003
  7. Никитин А.Г., Бровкина О.И., Ходырев Д.С., и др. Опыт создания публичной базы данных мутаций oncoBRCA: биоинформационные проблемы и решения // Клиническая практика. 2020. Т. 11, № 1. С. 21–29. [Nikitin AG, Brovkina OI, Khodyrev DS, et al. The experience of creating a public database of oncoBRCA mutations: bioinformatic problems and solutions. Journal of Clinical Practice. 2020;11(1):21–29. (In Russ).] doi: 10.17816/clinpract25860

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2021 Abramov I.S., Lisitsa T.S., Stroganova A.M., Ryabaya O.O., Danishevich A.M., Khakhina A.O., Zakamornaya A.I., Matsvay A.D., Shipulin G.A.

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ПИ № ФС 77 - 38032 от 11 ноября 2009 года.


This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies