NEURAL NETWORK MODELING OF THE DEPENDENCE OF GABA-AGONISTIC ACTIVITY OF CHEMICAL COMPOUNDS ON THE ENERGY SPECTRUM OF MULTIPLE DOCING


Cite item

Full Text

Abstract

Simple and multiple docking into the GABAa receptor of its known agonists has been carried out. For these compounds, the energies of simple docking into the GABA binding site and the energy spectra of multiple docking throughout the entire volume of the GABAa receptor were calculated. A model of the dependence of the level of GABAa agonistic activity of chemical compounds on the energy of their simple docking into the GABA binding site has been formed. A neural network model of the dependence of the level of GABAa agonistic activity on the energy spectrum of multiple docking of chemical compounds has been constructed. It is shown that the predictive accuracy of the neural network model based on multiple docking significantly exceeds the predictive accuracy of the model based on simple docking.

Full Text

В нашей предыдущей работе [1] было показано, что спектр энергий докинга химических соединений в множество пространств релевантного белка является намного более достоверной метрикой аффинности лигандов к биомишеням, в сравнении с единичной энергией их докинга в специфический сайт. При этом использование множественного докинга для расчета аффинности соединений не требует определения в белке-мишени местоположения специфического сайта связывания. Известно также, что, в соответствии с теоремой Колмогорова [2], с помощью двухслойной искусственной нейронной сети может быть аппроксимирована зависимость любой сложности. Таким образом, разработка на основе указанной технологии искусственного интеллекта новой методологии построения in silico высокоточных моделей зависимости фармакологической активности химических соединений от спектра их множественной аффинности к релевантным белкам-мишеням, включающая учет взаимодействия лиганда со всей поверхностью белка, является востребованной и весьма актуальной задачей. ЦЕЛЬ РАБОТЫ Построение методом искусственных нейронных сетей модели зависимости уровня ГАМКA-агонисти-ческой активности от спектра энергий множественного докинга химических соединений и оценка ее прогностической способности, в сравнении с точностью прогноза с использованием энергии простого докинга. МЕТОДИКА ИССЛЕДОВАНИЯ Исходное допущение На данном этапе разработки новой методологии прогноза в качестве модельной фармакологической активности была выбрана ГАМ^-агонистическая активность, по следующим основаниям: 1) ГАМК-ергические соединения обычно проявляют психотропные свойства и в связи с этим рассматриваются как перспективные кандидаты для создания новых лекарственных средств; 2) имеются достоверные данные по химической структуре и экспериментальным значениям ГАМ^-агонистической активности уже синтезированных известных веществ; 3) доступны валидные экспериментальные рентгеноструктурные 3D-модели ГАМ^-рецептора и информация о локализации его специфических сайтов связывания. Задачи исследования Для достижения поставленной цели необходимо было решить следующие задачи. 1. Сформировать верифицированную выборку по структуре и уровню активности известных соединений, испытанных на ГАМКA-агонистическую активность. 2. Построить и оптимизировать 3D-модели этих соединений. 3. Выполнить для указанных соединений простой докинг в ГАМК-связывающий сайт ГАМ^-рецептора и множественный докинг во все сформированные для этого пространства данного рецептора. 4. Рассчитать энергии простого докинга и спектры энергий множественного докинга указанных известных соединений. 5. Сформировать модель зависимости уровня ГАМКA-агонистической активности химических соединений от энергии их простого докинга в ГАМК-связывающий сайт, оценить ее точность. 6. Построить нейросетевую модель зависимости уровня ГАМКA-агонистической активности от спектра энергий множественного докинга химических соединений, оценить ее точность. Выборка по структуре и активности ГАМКа-агонистов Верифицированные данные по химической структуре и уровню ГАМКA-агонистической активности 191 известного вещества в отношении a1-p2-Y2 подтипа ГАМ^-рецептора были взяты из оригинальной QSAR-базы системы Microcosm BioS v20.6.6 [3], содержащей структурированную и обработанную информацию по химической структуре и уровню активности 625888 известных соединений, изученных мировым научным сообществом на 11509 различных видов таргетной биологической активности. С помощью программы Statistica 7 [4] методом k-средних был выполнен кластерный анализ количественных значений ГАМКд-агонистической активности с разделением на 2 группы активности: high (24 соединения) и moderate (167 соединений). Оптимизированные SD-модели соединений В соответствии с методикой [5], для всех 191 соединений методами молекулярной механики с помощью программы MarvinSketch 17.1.23 [6], отдельно для каждого соединения, были построены по 10 конфор-меров с наименьшей энергией. Построенные кон-формеры были оптимизированы с помощью программы MOPAC2012 [7] с использованием полуэмпирического квантово-химического метода PM7. Среди оптимизированных конформеров были отобраны для каждого соединения по одному конформеру с наименьшей общей энергией. Простой и множественный докинг В расчетах использовалась экспериментальная bD-модель ГАМКА-рецептора 6D6T [8] - наиболее полная и точная из 14 моделей, найденных в банке данных RCSB PDB [9]. Координаты ГАМК-связывающего сайта были определены с помощью программы LigPLot+ 2.2.5 [10]. Кроме того, на указанной модели 6D6T с помощью программы MSite v21.04.22, в соответствии с алгоритмом, подробно описанным в нашей предыдущей работе [1], были построены 27 пространств для множественного докинга. Ансамблевый докинг проводили с помощью программы AutoDock Vina 1.1.1 [11], каждое соединение в 10 конформерах по 5 раз в каждое пространство докинга, с вычислением по 50 полученным значениям минимальных энергий связывания ДЕ, как это описано в [5]. Докинг выполняли отдельно в ГАМК-связывающий сайт ГАМКА-рецептора и отдельно в каждое из 27 пространств, сформированных для множественного докинга. Полученная в результате расчетов сводная таблица для последующего моделирования включала в себя 30 колонок: шифры соединений; метка уровня ГАМКА-агонистической активности Ind; энергия докинга в специфический ГАМК-связывающий сайт ДЕ0 и энергии множественного докинга в 27 пространств ДЕ1...ДЕ27 ГАМКА-рецептора. Модель зависимости активности от энергии простого докинга Для построения модели зависимости уровня ГАМКA-агонистической активности химических соединений от энергии их простого докинга в ГАМК -связывающий сайт ДЕ0 все значения этого показателя для 191 известного ГАМКA-агониста с помощью программы Statistica 7 [4] были подвергнуты кластерному анализу методом k-средних, с определением граничного значения ДЁ0, разделяющего соединения с высокой энергией докинга ДЕ0 и соединения с умеренной или низкой величиной ДЕ0. Парадигма традиционного докинга постулирует, что высокая расчетная энергия взаимодействия со специфическим сайтом биомишени ДЕ0 соответствует высокому значению фармакологической активности [12]. Таким образом, основанное на простом докинге решающее правило определяется следующими неравенствами: 1) если ДЕ0 < ДЁ0, то прогнозируемое соединение принадлежит к классу соединений с высокой ГА МКA-агонистической активностью; 2) если же ДЕ0 £ ДЁо, то прогнозируемое соединение принадлежит к классу соединений с умеренной или низкой ГАМКА-агонистической активностью. С использованием сформированной модели рассчитаны общая точность прогноза Fo, точность прогноза высоко активных соединений Fa (чувствительность) и точность прогноза не высоко активных соединений Fn (специфичность). С помощью биномиального критерия z [13] оценена статистическая достоверность p показателей точности прогноза. Нейросетевая модель зависимости активности от энергии множественного докинга Для построения модели зависимости уровня ГАМКА-агонистической активности от спектра энергий множественного докинга химических соединений ДЕ1...ДЕ27 была использована технология искусственных нейронных сетей [14]. В соответствии с теоремой Колмогорова [2], в настоящем исследовании использовалась архитектура сети в виде двухслойного пер-цептрона MLP k-m-2 с узким горлом. Здесь k - число входных нейронов, в данном случае 27 (ДЕ1...ДЕ27); m - число скрытых нейронов, устанавливается программой от 3 до 26, поскольку 2 < m < k. В модуле Statistica Neural Networks [14] программы Statistica [4] при построении перцептронных сетей для скрытого и выходного слоев используются пять наиболее распространенных активационных функций (Identity, Logictic, Tanh, Exponential, Softmax) [14], попарный перебор которых также осуществляется программой. Обучение нейросетей в программе Statistica проводится с использованием алгоритма обратного распространения ошибок. С целью достижения наилучшего результата обучения, число сетей для обучения было увеличено с 20 до 400, а число наилучших автоматически отбираемых сетей - с 5 до 100. После окончания обучения для заданного уровня активности из 100 лучших отобранных программой нейросетей 90 = Т. 19, №4.2022 по совокупности характеристик точности обучения и тестирования вручную отбирали лучшую. С использованием построенной модели рассчитаны общая точность прогноза Fo, точность прогноза высоко активных соединений Fa (чувствительность) и точность прогноза не высоко активных соединений Fa (специфичность). С помощью биномиального критерия z [13] оценена статистическая достоверность p показателей точности прогноза. РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ И ИХ ОБСУЖДЕНИЕ Для модели зависимости уровня ГАМКд-агонистической активности химических соединений от энергии JOURNAL OF VOLGOGRAD STATE ! MEDICAL UNIVERSITY и х простого докинга в ГАМК-связывающий сайт ДЕ0 получено граничное значение ДЁ0 = 6,0 Ккал/моль, разделяющее высоко активные и не высоко активные соединения. В случае нейросетевой модели зависимости уровня ГАМКд-агонистической активности от спектра энергий множественного докинга химических соединений ДЕ1...ДЕ27 получена нейронная сеть следующих характеристик: MLP 27-16-2 (Tanh, Softmax), точность обучения 99,3 %, тестирования 100 %, валидации 67,9 %, также классифицирующая высоко активные и не высоко активные соединения. В табл. приведены результаты сравнительной оценки на объединенной выборке точности указанных двух моделей. Точность прогноза уровня ГАМКд-агонистической активности на основе энергий простого и множественного докинга Показатель точности прогноза Значения для модели прогноза с использованием AEo AE1...AE27 Fo, % 51,3 94,8 Fa, % 66,7 83,3 Fa, % 49,1 96,4 zo 0,58 8,73 za 1,08 2,23 za 0,14 8,45 po 0,281 <110-15 pa 0,139 0,0127 pa 0,555 <110-15 Примечание. Fo, Fa, F„ - общая точность прогноза, точность прогноза высоко активных соединений, точность прогноза не высоко активных соединений. zo, za, z„ - биномиальный критерий для Fo, Fa, F„. po, pa, pa - значимость Fo, Fa, Fa. Точность прогноза ГАМКд-агонистической активности с использованием модели на основе энергии докинга в специфический сайт AEo является статистически незначимой по всем показателям. В случае прогноза не высоко активных соединений вычисленная оценка даже меньше точности случайного угадывания, составляющей 50 %. В то же время при использовании нейросетевой модели на основе энергий множественного докинга AE1...AE27 все оценки точности прогноза являются статистически высоко достоверными. При этом значения всех показателей Fo, Fa, Fa значительно превышают точность случайного угадывания. Таким образом, на примере ГАМКд-агонис-тической активности доказано, что нейросетевая модель на основе спектра энергий докинга химических соединений в множество пространств ГАМКд-рецептора является намного более точной, чем модель, полученная на основе единичной энергии их докинга в специфический ГАМК-связывающий сайт. ЗАКЛЮЧЕНИЕ 1. С использованием кластерного анализа построена модель зависимости уровня ГАМКд-агонистической активности химических соединений от энергии их простого докинга в ГАМК-связывающий сайт. 2. С использованием технологии искусственных нейронных сетей построена модель зависимости уровня ГАМКд-агонистической активности от спектра энергий множественного докинга химических соединений по всему пространству ГАМКд-рецептора. 3. Статистическая достоверность и точность прогноза уровня ГАМКд-агонистической активности химических соединений с использованием нейросетевой модели на основе спектра значений энергий множественного докинга существенно превышает аналогичные показатели, полученные с применением модели на основе единичного значения энергии докинга в специфический ГАМК-связывающий сайт ГАМКд-рецептора.
×

About the authors

P. M Vasiliev

Volgograd State Medical University

Doctor of Biological Sciences, Head of the Laboratory of Information Technologies in Pharmacology and Computer Modeling of Drugs, Research Center for Innovative Medicines with Pilot Production, Professor of the Department of Pharmacology and Bioinformatics Volgograd, Russia

A. N Kochetkov

Volgograd State Medical University

System Administrator, Software Engineer of the Laboratory of Information Technologies in Pharmacology and Computer Modeling of Medicines, Scientific Center for Innovative Medicines with Pilot Production Volgograd, Russia

M. A Perfiliev

Volgograd State Medical University

senior laboratory assistant at the Laboratory of Information Technologies in Pharmacology and Computer Modeling of Medicines, Scientific Center for Innovative Medicines with Pilot Production; Assistant, postgraduate student of the Department of Pharmacology and Bioinformatics Volgograd, Russia

References

  1. Васильев П.М., Кочетков А.Н., Спасов А.А., Перфильев М.А. Спектр энергий множественного докинга как многомерная метрика аффинности химических соединений к фармакологически релевантным биомишеням // Волгоградский научно-медицинский журнал. 2021. № 3. С. 57-61.
  2. Колмогоров А.Н. О представлении непрерывных функций нескольких переменных в виде суперпозиции непрерывных функций одного переменного // Доклады АН СССР. 1957. Т. 114, № 5. С. 953-956.
  3. Studying Dependences Between the Chemotype Structure of Some Natural Compounds and the Spectrum of Their Targeted Activities Correlated with the Hypoglycemic Effect / P.M. Vasilyev, O.A. Luzina, D.A. Babkov [et al.] // Journal of Structural Chemistry. 2019. Vol. 60, iss. 11. P. 1827-1832.
  4. Hilbe J.M. Statistica 7: an overview // The American Statistician. 2007. Vol. 61, no. 1. P. 91-94.
  5. Neural network modeling of multitarget RAGE inhibitory activity / P.M. Vassiliev, A.A. Spasov, L.R. Yanaliyeva [et al.] // Biochemistry (Moscow) Supplement Series B: Biomedical Chemistry. 2019. Vol. 13, no. 3. P. 256-263.
  6. Marvin Pro. URL: https://chemaxon.com/products/marvin.
  7. MOPAC, Stewart Computational Chemistry. URL: http://openmopac.net/.
  8. Structure of a human synaptic GABAa receptor / S. Zhu, C.M. Noviello, J. Teng [et al.] // Nature. 2018. Vol. 559 (7712). P. 67-72.
  9. RCSB PDB, Research Collaboratory for Structural Bioinformatics Protein Data Bank. URL: https://www.rcsb.org/.
  10. Laskowski R.A., Swindells M.B. LigPlot+: multiple ligand-protein interaction diagrams for drug discovery // Journal of Chemical Information and Modeling. 2011. Vol. 51, iss. 10. P. 2778-2786.
  11. Trott O., Olson A.J. AutoDock Vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization and multithreading // Journal of Computational Chemistry. 2010. Vol. 31, iss. 2. P. 455-461.
  12. Gupta M., Sharma R., Kumar A. Docking techniques in pharmacology: How much promising? // Comput Biol Chem. 2018. Vol. 76. P. 210-217.
  13. Глотов Н.В., Животовский Л.А., Хованов Н.В., Хромов-Борисов Н.Н. Биометрия. Л.: Изд-во Ленингр. ун-та, 1982. 264 с.
  14. Нейронные сети. Statistica Neural Networks: Методология и технология современного анализа данных. М.: Горячая линия - Телеком, 2008. 392 с.

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2022 Vasiliev P.M., Kochetkov A.N., Perfiliev M.A.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ПИ № ФС 77 - 79562 от 27.11.2020 г.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies