Criteria for the spatial distribution of polymetallic ore objects as a basis for creating a predictive search model using a neural network approach (using the example of the territory of South-Eastern Transbaikalia)
- Authors: Grishkov G.A.1, Nafigin I.O.1, Ustinov S.A.1, Petrov V.A.1, Minaev V.A.1
-
Affiliations:
- Federal State Budgetary Institution of Science Institute of Geology of Ore Deposits, Petrography, Mineralogy and Geochemistry of the Russian Academy of Sciences (IGEM RAS)
- Issue: No 4 (2024)
- Pages: 22-37
- Section: МЕТОДЫ И СРЕДСТВА ОБРАБОТКИ И ИНТЕРПРЕТАЦИИ КОСМИЧЕСКОЙ ИНФОРМАЦИИ
- URL: https://journals.eco-vector.com/0205-9614/article/view/659111
- DOI: https://doi.org/10.31857/S0205961424040021
- EDN: https://elibrary.ru/EMJIMB
- ID: 659111
Cite item
Full Text
Abstract
The work is aimed at identifying and substantiating criteria that indirectly or actually control ore objects in order to create a predictive neural network model of the metallogenic potential of southeastern Transbaikalia. For this purpose, geological, geophysical and cartographic materials were collected and processed, including the results of the analysis of remote sensing data. Statistical analysis of the array of collected data made it possible to establish a list of the minimum necessary information to identify criteria for the localization of polymetallic ore objects within the territory of southeastern Transbaikalia. As a result, thematic schemes have been prepared reflecting the relationship between the distribution of known polymetallic mineralization zones and the identified geological and spatial features. A correlation analysis was carried out between all the criteria in order to assess the suitability of using the selected features as input data for a future neural network model.
Full Text
ВВЕДЕНИЕ
Нейронные сети представляют собой самообучающиеся модели, имитирующие деятельность человеческого мозга. В отличие от обычных программ, нейронные сети не используют стандартные алгоритмические условия. В основе нейросетевых технологий лежит вероятностная модель, использующая регрессионный или классификационный подход для прогнозирования желаемого результата (Гришков и др., 2021).
В последние годы число задач, для решения которых применяются нейронные сети, постоянно увеличивается. Среди основных областей применения нейронных сетей ‒ прогнозирование, принятие решений, распознавание образов, оптимизация, анализ данных. Нейронные сети применяются во многих областях науки, таких как медицина, фармакология, экология, геология и т.д. В геологии нейросетевые технологии уже нашли применение в таких областях исследований, как дистанционное зондирование (Lary et al., 2016), геоморфология (Valentine, Kalnins, 2016), гидрогеофизика (Shen, 2018), сейсмология (Kong et al., 2019), геодинамика (Wang et al., 2018), геохимия (Zuo et al., 2019). Также нейронные сети успешно применяются в области разведки полезных ископаемых (Gonbadi et al., 2015; Zhao et al., 2016; Zuo, Xiong, 2018; Twarakavi et al., 2006; O’Brien et al., 2015; Kirkwood et al., 2016; Xiong, Zuo, 2016).
Наряду с перечисленными работами, исследование, описанное в настоящей статье, направлено на развитие применения нейросетевых методов на разных стадиях геологоразведочных работ. Актуальность проводимых исследований определяется тем, что ускоренное развитие экономического потенциала страны, в том числе в горнодобывающей промышленности, происходит на фоне исчерпания легко отрабатываемых и вскрываемых ресурсов. В связи с этим существует необходимость в получении новых данных и выявлении закономерностей локализации месторождений стратегического сырья с применением современных технологий.
В связи с интенсивным развитием технологий искусственного интеллекта, становится возможным разработка новых подходов к прогнозу твердых полезных ископаемых на основе анализа и моделирования многочисленных критериев, косвенно или фактически контролирующих рудные объекты. Основной целью данного исследования является выявление и обоснование этих критериев для создания автоматизированной экспертной системы прогнозирования гидротермальных месторождений стратегических металлов, в частности полиметаллических. Необходимо отметить, что эти критерии являются фундаментом будущей модели, следовательно, каждый из геолого-пространственных признаков должен быть тщательно проанализирован и обоснован.
ОБЛАСТЬ ИССЛЕДОВАНИЯ
Исследуемая территория располагается в юговосточной части Забайкальского края (Россия) и географически простирается с запада на восток между долинами рек Онон и Аргунь, а с севера на юг между долиной реки Газимур и государственными границами страны с Китаем и Монголией (рис. 1а).
Рис. 1. Область исследования: а – территориальное расположение, б – упрощенная геологическая карта миллионного масштаба (Шивохин и др., 2010).
Территория Юго-Восточного Забайкалья имеет высокий металлогенический потенциал (Au, U, Mo, Pb-Zn, Sn, W, Ta, Nb, Li, флюорит) и является перспективной на обнаружение новых гидротермальных месторождений дефицитных видов стратегического минерального сырья в Аргунской металлогенической зоне (Петров и др., 2017).
Несмотря на относительно высокую опоискованность, ранее проведенные исследования указывают на то, что рассматриваемая территория имеет хорошие перспективы наращивания минерально-сырьевой базы по многим видам полезных ископаемых.
Геологическое строение исследуемого района весьма сложное и характеризуется продолжительным развитием разновозрастных, разнообразных по составу и генезису образований, залегание которых осложнено складчатыми и разрывными нарушениями (рис. 1б).
Основным фактором, определяющим размещение месторождений полезных ископаемых, является литолого-структурный, т.к. месторождения в основном приурочены к линейным зонам разрывных нарушений разного порядка и узлам пересечения долгоживущих глубинных зон разломов северо-восточного простирания с зонами северо-западных, меридиональных и широтных разломов (Ищукова и др., 1998).
В пределах Приаргунской металлогенической зоны широко распространены месторождения в вулканогенных ассоциациях ‒ VHMS (Volcanic-Hosted Massive Sulphide) – колчеданно-полиметаллический (нойон-тологойский) формационный тип и в карбонатных толщах – MVT (Mississippi Valley-Type) – свинцово-цинково-колчеданный (приаргунский) формационный тип.
К VHMS типу отнесены полиметаллические месторождения, локализованные в мезозойских вулканогенно-осадочных образованиях (Нойон-Тологойский тип). Золото-серебро-полиметаллические или колчеданно-полиметаллические рудные тела представлены стратифицированными и штокверковыми жильными зонами в вулкано-тектонических депрессионных структурах мульдообразной формы с пологими бортами. Рудные тела контролируются синвулканическими нарушениями и связанными с ними зонами трещиноватости.
Свинцово-цинково-колчеданные месторождения в осадочных толщах типа MVT развиты в терригенно-карбонатных породах. Руды преимущественно приурочены к венд-кембрийским карбонатно-терригенным и средне-верхнеюрским терригенно-вулканогенным отложениям, которые объединены соответственно в карбонатно-терригенную и вулканогенно-кремнисто-терригенную формации.
Размещение колчеданных месторождений определяется положением центров длительной эндогенной активности, что обеспечивало существенную продолжительность функционирования магматогенных гидротермальных систем (Кузнецов и др., 2018).
МЕТОДИКА
Целью работы является установление и обоснование ключевых геолого-пространственных признаков проявлений гидротермальных процессов как основы для создания прогнозной схемы металлогенического потенциала территории. Как уже упоминалось, нейронные сети успешно применяются для решения задач прогноза полезных ископаемых (Gonbadi et al., 2015; Zhao et al., 2016; Zuo, Xiong, 2018; Twarakavi et al., 2006; O’Brien et al., 2015; Kirkwood et al., 2016; Xiong, Zuo, 2016). Для решения этих задач (Li et al., 2019), а также анализа петрографических и геохимических данных мировым научным сообществом широко используется архитектура нейронной сети AlexNet.
AlexNet – это сверточная нейронная сеть для решения задач классификации изображений, распознавания объектов и детектирования объектов на изображении (Krizhevsky et al., 2017). Ее архитектура состоит из 8 слоев: 5 сверточных слоев, включая слои субдискретизации, и 3 полносвязных слоев (рис. 2). Входными данными для нейронной сети служат RGB изображения размером 224×224 пикселей. Также в архитектуре AlexNet применены техника дропаута и локальная нормализация, что улучшает устойчивость ее обучения.
Рис. 2. Архитектура нейронной сети AlexNet.
В нашей работе в качестве исходных данных были использованы GRID-файлы. Они служат способом организации пространственных геоданных в виде множества равных по размеру и территориально сопряженных ячеек, упорядоченных в виде строк и столбцов, т.е. матриц. Каждой ячейке присваивается определенное значение, служащее для идентификации или описания класса, категории, группы, к которым относится ячейка, либо для задания количественной характеристики. Значения ячеек растра могут быть положительные или отрицательные, целочисленные (для отображения категорийных (дискретных) данных) или с плавающей точкой (для непрерывных поверхностей).
Исходя из того, что полученные GRID-файлы можно представить в виде растровых изображений, была выбрана сверточная нейронная сеть классификации, на основе архитектуры AlexNet, так как она направлена на обработку такого рода информации.
Каждая разработанная нейронная сеть функционирует с определенным типом данных. Для обучения выбранной нейронной сети требуются нормализованные растровые изображения определенного размера с назначением им положительного или отрицательного класса (значения).
В связи с тем, что исходными данными являются GRID-файлы, для их подготовки к требуемому формату был разработан алгоритм, состоящий из ряда следующих шагов:
- оцифровка исходных данных ручным способом;
- растеризация и нормализация данных с помощью инструмента нечеткой классификации с использованием линейной функции принадлежности;
- свертка (разбиение) данных на двумерные массивы заданного размера.
РЕЗУЛЬТАТЫ
Проведена обширная работа по оцифровке картографических данных, что позволило сформировать единый ГИС проект для дальнейшего анализа и построения схемы вероятностного распределения полиметаллических рудных объектов в Аргунской металлогенической зоне. В результате анализа данных был выделен ряд ключевых геолого-пространственных признаков, контролирующих пространственную локализацию гидротермальных процессов, связанных с полиметаллической минерализацией.
Среди собранных и оцифрованных источников данных ключевыми являются следующие.
Цифровая модель рельефа
Цифровая модель рельефа (ЦМР) (рис. 3) – это особый вид трёхмерных математических моделей, представляющий собой отображение рельефа как реальных, так и абстрактных геополей (поверхностей) (Тикунов, 2008). ЦМР широко используется в геологических исследованиях, т.к. она несет в себе информацию о рельефе исследуемой территории, в частности высотные отметки, уклон и экспозицию. Эти факторы часто взаимосвязаны с распределением рудных объектов (Кац и др., 1980).
Рис. 3. Визуализация цифровой модели рельефа исследуемой территории на базе SRTM. Розовыми точками выделены известные полиметаллические рудные объекты.
В качестве ЦМР использовались результаты радиолокационной топографической съёмки – “Shuttle Radar Topography Mission” (SRTM). SRTM ‒ международный исследовательский проект по созданию цифровой модели высот Земли с помощью радарной топографической съёмки её поверхности. SRTM запущена в феврале 2000 года и охватила 80% земной поверхности (Farr et al., 2007).
На основе ЦМР выделяются такие критерии, как условные уровни эрозионного среза (рис. 4а) и карта плотностей линеаментов (рис. 4б), которые позволяют выявить особенности рельефа, связанные с различными геологическими процессами.
Рис. 4. Критерии, выделенные на основе ЦМР: а – уровни эрозионного среза, б – карта плотностей линеаментов. Розовыми точками отмечены известные полиметаллические рудные объекты.
Условные уровни эрозионного среза отражают эволюцию рельефа. Путем анализа различных уровней среза по высоте можно восстановить процессы эрозии и осадконакопления, которые формировали рельеф местности в течение долгого периода времени.
Линеаменты – это линейные структуры или особенности ландшафта, которые могут быть связаны как с геологическими разломами и трещинами, так и с другими структурами, отражаемыми на земной поверхности. Повышенная плотность линеаментов указывает на области, где эти структуры сконцентрированы, что может свидетельствовать о наличии определенных геологических процессов, благоприятных для формирования месторождений (Зверев, Зверев, 2015).
Государственная геологическая карта
Государственная геологическая карта (ГГК) (рис. 5) – это обширная информационная система, созданная на основе геологических данных, включающая в себя различные картографические материалы, описание геологического строения, структуры земной коры, особенностей горных пород, рельефа, литологических и тектонических характеристик и многое другое. ГГК являются источником подробной разномасштабной информации о геологическом строении различных регионов России, что делает их важным инструментом при региональных и локальных работах по поиску полезных ископаемых.
Рис. 5. Геологическая карта масштаба 1:1 000 000 и комплекс геологических карт масштаба 1:200 000. Розовыми точками выделены известные полиметаллические рудные объекты.
Государственная геологическая карта включает следующие критерии: разломная тектоника (рис. 6б); литология (рис. 6а) и зоны контактов интрузивных тел (рис. 6в). Эти критерии являются ключевыми факторами, влияющими на формирование рудных объектов (Глухов, 2019).
Рис. 6. Критерии, выделенные на основе ГГК: а – литология, б – разломная тектоника, в – зоны контактов интрузивных тел. Розовыми точками выделены известные полиметаллические рудные объекты.
Разломная тектоника играет важную роль в понимании закономерностей формирования геологических структур и процессов, в том числе и в металлогении. В контексте исследования полиметаллических рудных объектов, разломы и разломные зоны являются ключевыми элементами, влияющими на локализацию рудогенетических процессов. Это в первую очередь обусловлено тем, что разломы служили каналами для миграции гидротермальных растворов и являются индикаторами глубинных процессов, происходящих в земной коре.
Различные типы горных пород и метасоматитов могут сопровождать различные типы минерализации, что в свою очередь обусловлено разностями химического состава и историей формирования вмещающих горных пород. Изучение литологических разностей горных пород и предрудных, рудосопровождающих и пострудных метасоматитов играет важную роль в металлогенических исследованиях, а также в поиске и разведке полезных ископаемых.
Зоны контактов интрузивных тел – это области, где, например, магматические образования контактируют с вмещающими их горными породами, например, метаморфическими или осадочными. Эти зоны могут быть благоприятны для протекания рудогенетических процессов и образования рудных объектов. Также, вследствие процесса метаморфизма или метасоматоза, в зонах контактов могут образовываться рудные объекты различной специализации в результате изменений химических и физических свойств горных пород (Глухов, 2019).
Геофизические данные
Геофизические данные включают в себя результаты исследований различных физических свойств пород, таких как магнитные, гравитационные, электромагнитные, радиометрические и др. Они позволяют получить информацию о различиях в структуре, составе и других свойствах горных пород на разных глубинах, а также являются важным инструментом в геологических изысканиях, помогая исследователю лучше понимать геологические структуры и определять перспективные участки для поисков, разведки и добычи полезных ископаемых.
Геофизические данные представлены картами магнитного (рис. 7а), гравитационного (рис. 7б) полей и их оцифрованными версиями (рис. 7в; 7г), отражающими физические свойства пород. В ходе их анализа могут быть зафиксированы аномалии, связанные с гидротермальными процессами.
Рис. 7. Геофизические данные: а ‒ комплекс схем аномалий магнитного поля (1:200.000) (М-IV, V, VI, X, XI, XII, XVI, XVII, XVIII, XXII, XXIII), б ‒ комплекс схем аномалий гравитационного поля (1:200.000) (М-IV, V, VI, X, XI, XII, XVI, XVII, XVIII, XXII, XXIII), в ‒ схема аномалий магнитного поля (оцифрованная), г ‒ схема аномалий гравитационного поля (оцифрованная). Розовыми точками выделены известные полиметаллические рудные объекты.
Карта аномального магнитного поля ‒ это инструмент, отображающий вариации магнитных свойств пород на поверхности Земли. Она создается путем измерения и анализа магнитных свойств с помощью специальных геофизических инструментов, таких как магнитометры. Геофизические измерения магнитных полей позволяют выявить различия в составе горных пород и структурах земной коры. Различные типы пород имеют разные магнитные свойства, и их изменения могут свидетельствовать о наличии тех или иных геологических структур и минеральных преобразований.
Карта аномалий гравитационного поля отображает вариации силы гравитационного поля Земли на её поверхности. Она создается на основе измерений гравитационного поля с использованием специальных приборов – гравиметров. Гравиметрия позволяет выявить различия в плотности и составе горных пород, что указывает на различные геологические структуры и аномалии, возможно связанные с наличием полезных ископаемых.
Карта полезных ископаемых
Карта полезных ископаемых является источником информации о пространственном распределении различных полезных ископаемых на определенной территории. Она также предоставляет сведения о количественной и качественной оценке запасов, структуре залежей и других параметрах. Это помогает понять, какие регионы более перспективны для поиска новых месторождений, особенно если рудные узлы или объекты сосредоточены в определенных геологических структурах или локальных областях.
Карта полезных ископаемых включает в себя карту рудных узлов (рис. 8а) и схему распределения рудных объектов (рис. 8б). Эти материалы являются основой для анализа пространственного распределения рудных объектов относительно других геолого-геофизических критериев.
Рис. 8. Критерии, выделенные на основе карты полезных ископаемых: а ‒ карта рудных узлов, б ‒ схема распределения рудных объектов (треугольниками выделены рудные объекты Fl, Mn, Mo, Sn, U и W; квадратами – Zn и Pb; синим цветом – положительные области; красным – отрицательные). Розовыми точками выделены известные полиметаллические рудные объекты.
Рудные узлы на карте полезных ископаемых маркируют области концентрации рудных объектов (при этом зачастую генетически близких) и способствуют определению перспективных районов и участков.
Схема распределения рудных объектов визуально отображает пространственное положение месторождений, рудопроявлений и пунктов минерализации. Анализ этой информации помогает понять, какие типы руд могут быть связаны с определенными геологическими образованиями и структурами.
Анализ собранных данных
Анализ собранных и оцифрованных данных, интегрированных в единый ГИС проект, позволил выявить не только отдельные критерии, но и их взаимосвязи. Актуальность критериев в контексте создания прогнозно-поисковой модели полиметаллических рудных объектов определяется их способностью обеспечить ключевые индикаторы и зоны, связанные с возможными областями сосредоточения полиметаллической минерализации.
Для оценки пространственного распределения рудных объектов относительного литологических разностей была построена гистограмма (рис. 9). Столбцы гистограммы отображают количество рудных объектов, находящихся в конкретном классе (табл. 1), т.е. геологической формации.
Рис. 9. Гистограмма принадлежности полиметаллических рудных объектов к литологическим разностям, т.е. классам, представленным на гистограмме.
Таблица 1. Геологические формации
№ | Название | № | Название | № | Название |
2 | Мулинская серия | 15 | Ерниченская толща | 43 | Патринская свита |
3 | Приаргунская серия | 20 | Тургинская свита | 48 | Акатуйская свита |
5 | Шадоронская серия | 21 | Кадаинский комплекс | 49 | Базановская свита |
6 | Белетуйская свита | 22 | Ундинский комплекс | 50 | Государевская свита |
7 | Кличкинская свита | 23 | Кутомарский комплекс | 54 | Бохтинская свита |
9 | Ильдиканская свита | 31 | Дырбылкейская свита | 55 | Верхнегазимурская свита |
10 | Яковлевская свита | 32 | Нортуйская свита | 60 | Шахтаминский комплекс |
11 | Аленуйский комплекс | 36 | Урулюнгуйский комплекс | ||
14 | Быстринская свита | 37 | Горнозерентуйская толща |
Анализ гистограммы позволил выявить следующие закономерности. Большинство рудных объектов приурочено к осадочным породам венда, кембрия и нижней юры. 33 рудных объекта находятся в классе 6, т.е. в вендских осадочных отложениях (Белетуйская свита). Эти объекты можно отнести к типу MVT. 31 рудный объект приурочен к классу 14 – кембрийским осадочным отложениям (Быстринская свита), следовательно, их также можно отнести к типу MVT. Еще 21 рудный объект типа MVT концентрируются преимущественно в нижнеюрских терригенных толщах (Акатуйская свита). Оставшиеся рудные объекты относятся совершенно к другим типам. Типу VHMS принадлежат 13 рудных объектов, локализующихся в средне-позднеюрских терригенно-вулканогенных отложениях (Мулинская свита) (класс 2 на гистограмме). К скарновому типу можно отнести 14 объектов, сгруппированных в классе 22 – раннепермском гранодиорит-гранитовом комплексе (Ундинский комплекс). В ходе анализа оставшихся рудных объектов не удалось выявить никаких зависимостей. Эти объекты хаотично расположены в пределах различных комплексов, толщ и свит. Следует отметить, что в ходе такого анализа необходимо учитывать погрешность привязки самих рудных объектов, а также погрешность в выделении геологических границ, что в целом свойственно картам регионального масштаба. Таким образом, объекты, находящиеся вблизи литологических границ, разделяющих различные типы горных пород, к примеру, осадочные и вулканогенные, следует относить сразу к обоим типам.
Для более детального анализа установленных продуктивных литологических классов было построено еще 4 гистограммы между их положением и выявленными критериями (рис. 10).
Рис. 10. Гистограммы принадлежности установленных продуктивных литологических классов к: а ‒ условным уровням эрозионного среза, б ‒ значениям плотности линеаментов, в ‒ значениям магнитного поля, г ‒ значениям гравитационного поля.
Для поиска закономерностей между пространственным положением рудных объектов и полученными условными уровнями эрозионного среза, т.е. классами, была построена гистограмма, отражающая концентрацию рудных объектов в том или ином классе (рис. 10а). Анализ гистограммы показывает, что класс 8 условного эрозионного среза в значительной степени представлен литологическим классом 6 (11 рудных объектов). Следовательно, класс 8 эрозионного среза можно рассматривать как литологический класс 6. Эрозионный класс 6 в большей степени представлен литологическими классами 48 (10 рудных объектов) и 2 (9 рудных объектов), но в меньшей степени представлен литологическими классами 6 и 14. Следовательно, класс 6 может рассматриваться как смесь литологических классов 48 и 2. Еще одним ярко выраженным классом является 10, т.к. в нем интенсивно выражен литологический класс 6 (8 рудных объектов). Класс 7 уникален тем, что содержит только один рудный объект, относящийся к 14 литологическому классу. Все остальные эрозионные классы представлены равномерной совокупностью большинства литологических классов и не могут быть однозначно интерпретированы.
Для поиска пространственных закономерностей между рудными объектами и областями со средней, умеренной и высокой плотностью линеаментов (порог от 0.35 – минимальное значение) была построена гистограмма (рис. 10б). Анализ гистограммы позволил выявить 4 класса, отражающих зависимость между литологическими классами и диапазоном плотности линеаментов. Первый класс представлен диапазоном 0.65 ± 0.05. В него преимущественно попадают рудные объекты, относящиеся к литологическому классу 48. Второму классу принадлежит диапазон от 0.5 до 0.6, т.е. 0.55. В него в основном входят рудные объекты литологических классов 6 и 14. Следующий класс характеризуется диапазоном 0.45±0.05 и включает в себя по большей степени рудные объекты литологического класса 22. Последний класс, имеющий диапазон от 0.3 до 0.4, можно ассоциировать с литологическим классом 2, т.к. в него входят по большей мере соответствующие рудные объекты.
Анализ полученных из ЦМР критериев относительно рудных объектов, входящих в выявленные продуктивные литологические классы, позволил выявить между ними зависимости, что говорит о пригодности использования выбранных критериев.
Пространственный анализ рудных объектов и магнитных аномалий основывался на построении графика взаимоотношений значений магнитного поля к рудным объектам, представленным литологическими классами (рис. 10в). В ходе анализа этого графика получилось установить взаимосвязь между конкретными значениями магнитного поля и конкретными литологическими классами (типы рудных объектов). К магнитным аномалиям со значением “–3” по большей части приурочены литологические классы 14 (20 объектов) и 6 (16 объектов). Также было установлено, что литологическому классу 48 свойственны два значения магнитного поля – это “1” и “3”. Такой вывод сделан исходя из того, что к этим значениям приурочено достаточное большое количество (9 и 10 соответственно) рудных объектов данного литологического класса. Литологические классы 22 и 2 сопоставить с конкретными значениями магнитного поля не удалось, т.к. рудные объекты этих классов распределены практически по всем выбранным значениям магнитного поля.
Пространственный анализ гравиметрических данных производился по аналогии с анализом компонентов магнитного поля. На основе графика, отражающего отношение литологических классов к значениям гравиметрического поля (рис. 10г), выявлены следующие зависимости. Судя по графику, значению гравиметрического поля равного “–4” свойственно достаточно большое количество рудных объектов. Анализируя это значение на графике, заметно, что основная масса рудных объектов (11 единиц) принадлежит литологическому классу 48. В то же время присутствуют и объекты (6 единиц), относящиеся к литологическому классу 2. В рамках анализа пренебрежем классами с единственным объектом. В силу того, что объектов, принадлежащих литологическому классу 48, приблизительно в два раза больше, чем объектов класса 2, установим значение гравитационного поля равное “–4” эквивалентным литологическому классу 48. Также можно выделить ещё два значения гравитационного поля, свойственных исключительно литологическому классу 48. Это значения “–2” и “2”. Значению “2” свойственны 5 рудных объектов, но при этом присутствуют и объекты другого литологического класса. А вот значение “–2” свойственно исключительно лишь литологическому классу 48.
Дальнейший анализ позволил установить значения гравитационного поля однозначно присущие некоторым литологическим классам, т.е. значения, в пределах которых нет других типов рудных объектов. Значение “–16” и “16” характерны исключительно литологическому классу 22. Такой разброс значений вероятно связан с положением рудного объекта, т.е. либо он расположен в пределах интрузива, либо в осадочных толщах. Значения “24” и “26” характерны только литологическому классу 6. К этой группе значений также можно добавить значение “28”, хотя в его рамках и присутствует объекты схожего литологического класса. К значениям “12” и “22” приурочены рудные объекты литологического класса 14. Этой группе значений также сопутствует значение “18”, хотя к нему и приурочен схожий литологический класс. Последнее значение гравитационного поля “–8” можно связать с литологическим классом 2, исходя из количества рудных объектов, находящихся в гравитационных аномалиях с этим значением.
В ходе пространственного анализа геофизической информации по отношению к локализации групп рудных объектов, относящихся к определенному литологическому классу, установленному ранее, был выявлен ряд зависимостей, что свидетельствует о целесообразности привлечения выбранных и подготовленных геофизических данных.
Пространственный анализ рудных объектов относительно рудных узлов показал, что 160 рудных полиметаллических объекта локализуются в пределах рудных узлов, но также присутствуют 23 объекта за их пределами. Как правило, это рудопроявления, некоторые из которых могут быть весьма перспективными.
Суммируя представленные результаты, можно сказать, что для обучения нейронной сети собраны, проанализированы и подготовлены входные данные – признаки.
Статистическое обоснование выбора ключевых геолого-пространственных признаков
Как отмечалось ранее, нейронная сеть во время обучения вычисляет и запоминает закономерности между входными и выходными параметрами. В связи с этим, для оценки возможности обучаемости нейронной сети на подготовленных данных, а также оценки качества входных данных рассчитана статистическая связь между ними с помощью корреляционного анализа.
Корреляционный анализ ‒ статистический метод изучения взаимосвязи между двумя и более случайными величинами. Мерой корреляции (или силы связи) служит коэффициент корреляции. Значения коэффициента корреляции лежат в пределах от –1 до 1. При оценке силы связи коэффициентов корреляции используется шкала Чеддока (табл. 2). Положительные значения указывают на наличие зависимости между переменными. Чем ближе значение к 1, тем сильнее связь. Отрицательный коэффициент корреляции указывает на обратную связь между данными, т.е. с увеличением одной переменной другая уменьшится. В случае отсутствия связи между параметрами, коэффициент корреляции будет равен 0 (Баврина, Борисов, 2021).
Таблица 2. Шкала Чеддока для классификации силы связи
Значение коэффициента корреляции | Оценка силы связи |
< 0.3 | Очень слабая |
0.3–0.5 | Слабая |
0.5–0.7 | Средняя |
0.7–0.9 | Сильная (высокая) |
0.9 < | Очень сильная (очень высокая) |
Коэффициент корреляции обладает следующими свойствами:
- направленность, т. е. изменяется от –1 до 1;
- равен нулю, если случайные величины независимы (не коррелированы, не имеют связи);
- является безразмерной величиной, поэтому не зависит от единиц измерения;
- симметричность, т. е. не изменяется при перестановке местами изучаемых величин.
Существует множество методов анализа корреляций, которые применяются в зависимости от типа данных и цели исследования. Условно данные методы по типу зависимости можно разделить на линейные (коэффициент Пирсона) и ранговые (коэффициенты Спирмена и Кендалла) (Наследов, 2007).
Коэффициент корреляции Пирсона ‒ наиболее распространенный и простой в вычислении метод. Он позволяет измерить линейную зависимость между двумя непрерывными переменными. Значение коэффициента корреляции Пирсона может находиться в диапазоне от –1 до 1, где 1 ‒ полная прямая линейная зависимость, –1 ‒ полная обратная линейная зависимость, а 0 ‒ отсутствие линейной зависимости.
Коэффициент корреляции Спирмена ‒ используется для измерения монотонной зависимости между двумя переменными. Он основан на рангах значений переменных и позволяет выявить не только линейные, но и нелинейные связи. Значение коэффициента корреляции Спирмена также может находиться в диапазоне от –1 до 1.
Коэффициент корреляции Кендалла ‒ аналогичен коэффициенту корреляции Спирмена, но более устойчив к выбросам (значениям переменных, выделяющихся из общей выборки) и позволяет учесть зависимость между несколькими переменными. Он также измеряет монотонную связь и может принимать значения от –1 до 1.
Кроме указанных методов, существуют и другие специализированные узконаправленные методы анализа корреляций, например, для категориальных переменных или для временных рядов.
Выбор метода зависит от типа данных, целей исследования и предполагаемой структуры связей между переменными. Нами был выбран линейный коэффициент корреляции Пирсона в связи с тем, что ранговые коэффициенты корреляции, в отличии от линейных, имеют ряд ограничений, связанных с назначением рангов. Каждому уникальному значению присваивается ранг по возрастанию. В случае одинаковых значений берется среднее значение ранга каждого из них. Необходимое требование данного метода, чтобы процент повторяющихся рангов не превосходил 10% (Халафян, 2008).
Подготовленные данные для обучения нейронной сети являются нормализованными растрами, с диапазоном значений от 0 до 1, а также присутствуют карты уровней эрозионного среза, карты целевых областей, буферные зоны и т.д., цифровые величины которых разделены на несколько уникальных чисел, что делает невозможным применение ранговых коэффициентов корреляции.
Для вычисления коэффициента корреляции Пирсона, на языке программирования Python был реализован модуль с использованием библиотеки “Numpy”. Данный модуль рассчитывает линейные корреляционные связи между всеми загружаемыми в него входными параметрами и строит таблицу корреляционного анализа. Результат работы данного модуля на подготовленных данных представлен в таблице 3.
Как можно заметить, очень сильную корреляцию демонстрируют геофизические данные и литологический состав горных пород. Также наблюдается слабая корреляция у буферных зон и разломов. Остальные данные имеют очень слабую корреляцию.
Важным посылом данного анализа является не найти наиболее коррелируемые входные параметры для обучения нейронной сети, а доказать наличие самой связи (корреляции) между ними, что определяет возможность обучения нейронной сети на них. Одним из доказательств такой связи является опровержение нулевой гипотезы.
Нулевая гипотеза является предположением о том, что связи между коррелируемыми величинами не существует. Если в результате исследования нулевая гипотеза не отвергается, то “взаимосвязи нет”. В случае, когда нулевая гипотеза отклоняется, можно утверждать о существовании связи исследуемых случайных величин. Для того, чтобы проверить нулевую гипотезу для определенного уровня значимости (% вероятности ошибки), нужно вычислить коэффициент Стьюдента и сравнить с его критическим значением (Гмурман, 2003).
Если вычисленный коэффициент больше критического значения из таблицы, то можно с вероятностью обратной величине уровня значимости отклонить нулевую гипотезу и подтвердить наличие корреляции между данными.
Для вычисления данного коэффициента были использованы стандартные средства ПО “Excel”. Количество степеней свободы k является числом множества сравниваемых переменных в выборках с вычитанием двух. В нашем случае k равняется количеству пикселей сравниваемых изображений, т.е. 58.061.224 (6.686*8.684), с вычетом 2, что по таблице является ∞. Результат представлен в таблице 4.
Таблица 4. Результат вычисления коэффициентов Стьюдента
Как можно заметить, для всех данных отклоняется нулевая гипотеза для степеней значимости 0.1, 0.05, 0.02, 0.01, 0.002 и 0.001. Следовательно, между всеми данными можно с уверенностью в 99.999% подтвердить наличие корреляции, что является достаточным результатом для дальнейшего обучения нейронной сети на них.
ЗАКЛЮЧЕНИЕ
В работе выявлены и обоснованы геолого-пространственные критерии локализации полиметаллических рудных объектов.
Оцифрованы и нормализованы картографические геолого-геофизические данные, которые обработаны для интеграции в нейронную сеть.
Составлены тематические схемы, отражающие связь распределения полиметаллических рудных объектов с выявленными геолого-пространственными признаками.
Для оценки возможности обучаемости нейронной сети на подготовленных критериях, а также оценки их качества, рассчитана статистическая связь между ними с помощью корреляционного анализа. В связи с тем, что критерии представляют собой растровые нормализованные изображения, применялся линейный коэффициент корреляции Пирсона. Использование рангового коэффициента корреляции на них приведет к заведомо ложным результатам.
Для подтверждения наличия связи между данными и опровержения нулевой гипотезы был вычислен коэффициент Стьюдента для каждого критерия и сравнен с его критическим значением. Проведение корреляционного анализа привело к выводу о наличии связи между подготовленными данными с вероятностью 99.999%.
В целом, можно сделать вывод, что это исследование имеет значение не только в контексте прогнозирования полиметаллических рудных объектов, но и в создании методологии для будущих исследований по поиску полезных ископаемых. Полученные данные представляют собой важную основу для разработки моделей, которые могут улучшить стратегии поиска рудных месторождений, в частности в пределах юго-восточного Забайкалья России.
ИСТОЧНИК ФИНАНСИРОВАНИЯ
Работа выполнена в рамках государственного задания ИГЕМ РАН.
About the authors
G. A. Grishkov
Federal State Budgetary Institution of Science Institute of Geology of Ore Deposits, Petrography, Mineralogy and Geochemistry of the Russian Academy of Sciences (IGEM RAS)
Author for correspondence.
Email: gorgulini@yandex.ru
Russian Federation, Moscow
I. O. Nafigin
Federal State Budgetary Institution of Science Institute of Geology of Ore Deposits, Petrography, Mineralogy and Geochemistry of the Russian Academy of Sciences (IGEM RAS)
Email: gorgulini@yandex.ru
Russian Federation, Moscow
S. A. Ustinov
Federal State Budgetary Institution of Science Institute of Geology of Ore Deposits, Petrography, Mineralogy and Geochemistry of the Russian Academy of Sciences (IGEM RAS)
Email: gorgulini@yandex.ru
Russian Federation, Moscow
V. A. Petrov
Federal State Budgetary Institution of Science Institute of Geology of Ore Deposits, Petrography, Mineralogy and Geochemistry of the Russian Academy of Sciences (IGEM RAS)
Email: gorgulini@yandex.ru
Russian Federation, Moscow
V. A. Minaev
Federal State Budgetary Institution of Science Institute of Geology of Ore Deposits, Petrography, Mineralogy and Geochemistry of the Russian Academy of Sciences (IGEM RAS)
Email: gorgulini@yandex.ru
Russian Federation, Moscow
References
- Bavrina A.P., Borisov I.B. Modern rules for the application of correlation analysis // Medical almanac. 2021. № 3 (68). P. 70–79. (In Russian).
- Gmurman V.E. Probability theory and mathematical statistics: a textbook for universities. M.: Higher School. 2003. 479 p. (In Russian).
- Grishkov G.A., Ustinov S.A., Nafigin I.O., Petrov V.A. Neural networks and the possibilities of their application for the analysis of spatial geological data // Proceedings of the XV International Scientific and Practical Conference. In 7 volumes. Vol. 4. Development of new ideas and trends in Earth sciences: innovative technologies of geological exploration of mining and oil and gas business, well drilling, mathematical modeling and exploration geophysics. Moscow: S. Ordzhonikidze Russian State Geological Exploration University. 2021. P. 33‒36. (In Russian).
- Heritov A.D. SPSS 15: Professional statistical data analysis. St. Petersburg: St. Petersburg. 2007. 416 p. (In Russian).
- Ishchukova L.P., Avdeev B.V., Gubkin G.N., Igoshin Yu.A., Makushin M.F., Popova A.I., Rogova V.P., Spirin E.K., Filipchenko Yu.A., Khomentovsky B.N. Geology of the Urulyunguyevsky ore district and molybdenum-uranium deposits of the Streltsovsky ore field. M.: Geoinformmark. 1998. 382 p. (In Russian).
- Katz Ya.G., Poletaev A.I., Rumyantseva E.F. Fundamentals of lineament tectonics. M.: Nedra. 1986. 140 p. (In Russian).
- Khalafyan A.A. Statistica 6. Statistical data analysis. 3rd ed. Textbook. M.: LLC “BinomPress”. 2008. 512 p. (In Russian).
- Kuznetsov V.V., Brel A.I., Bogoslavets N.N., Elshina S.L., Kuznetsova T.P., Seravina T.V. Metallogeny of the Priagrun structural-formation zone // Domestic Geology. 2018. № 2. P. 32‒43. (In Russian).
- Petrov V.A., Andreeva O.V., Poluektov V.V., Kovalenko D.V. Tectono-magmatic cycles and geodynamic settings of ore-bearing system formation in the Southern Cis-Argun Region // Geology of Ore Deposits. 2017. V. 59. № 6. P. 431‒452. (In Russian).
- Shivokhin E.A., Ozersky A.F., Artamonova N.A., Dukhovsky A.A., Karasev V.V., Kurylenko A.V., Nadezhdina T.N., Pavlenko Yu.V., Raitina N.I., Shor G.M. Explanatory note: State Geological Map of the Russian Federation. Scale 1:1000000 (third generation). Sheet M-50 (Borzya). St. Petersburg: Publishing house kartrofabrika VSEGEI. 2010. 553 p. (In Russian).
- Tikunov V.S. Geoinformatics: a textbook for students. Moscow: Moscow State University. 2008. 361 p. (In Russian).
- Zverev A.V., Zverev A.T. Application of automated lineament analysis of satellite images in the search for oil and gas fields, prediction of earthquakes, slope processes and migration routes of groundwater // Izvestia of Higher Educational Institutions. Geology and exploration. 2015. № 6. P. 14‒20. (In Russian).
- Farr T.G., Rosen P.A., Caro E., Crippen R., Duren R., Hensley S., Kobrick M., Paller M., Rodriguez E., Roth L., Seal D., Shaffer S., Shimada J., Umland J., Werner M., Oskin M., Burbank D., Alsdorf D. The Shuttle Radar Topography Mission // Reviews of Geophysics. 2007. V. 45. № 2. P. 1‒33.
- Glukhov A.N. Tectonic factors of ore genesis of Precambrian terranes on the example of the Prikolymsky uplift and the Omolon massif (Northeast Asia) // Bulletin of St. Petersburg University. Earth Sciences. 2019. V. 64. № 2. P. 219‒248. doi: 10.21638/spbu07.2019.204.
- Gonbadi A.B., Tabatabaei S.H., Carranza E.J.M. Supervised geochemical anomaly detection by pattern recognition // Journal of Geochemical Exploration. 2015. V. 157. P. 81–91.
- Kirkwood C., Cave M., Beamish D., Grebby S., Ferreira A. A machine learning approach to geochemical mapping // Journal of Geochemical Exploration. 2016. V. 167. P. 49–61.
- Kong Q., Trugman D.T., Ross Z.E., Bianco M.J., Meade B.J., Gerstoft P. Machine learning in seismology: Turning data into insights // Seismological Research Letters. 2019. V. 90. № 1. P. 3–14.
- Krizhevsky A., Sutskever I., Hinton G.E. ImageNet classification with deep convolutional neural networks // Communications of the ACM. 2017. V. 60. № 6. P. 84–90. doi: 10.1145/3065386.
- Lary D.J., Alavi A.H., Gandomi A.H., Walker A.L. Machine learning in geosciences and remote sensing // Geoscience Frontiers. 2016. V. 7. № 1. P. 3–10. doi: 10.1016/j.gsf.2015.07.003.
- Li S., Chen J., Xiang J. Applications of deep convolutional neural networks in prospecting prediction based on two-dimensional geological big data // Neural Computing and Applications. 2019. V. 32. P. 2037–2053. doi: 10.1007/s00521-019-04341-3.
- O’Brien J.J., Spry P.G., Nettleton D., Xu R., Teale G.S. Using random forests to distinguish gahnite compositions as an exploration guide to Broken Hill-type Pb–Zn–Ag deposits in the Broken Hill domain, Australia // Journal of Geochemical Exploration. 2015. V. 49. P. 74–86.
- Shen C. A transdisciplinary review of deep learning research and its relevance for water resources scientists // Water Resources Research. 2018. V. 54. № 11. P. 8558–8593.
- Twarakavi N.K.C., Misra D., Bandopadhyay S. Prediction of arsenic in bedrock derived stream sediments at a gold mine site under conditions of sparse data // Nat Resour Res. 2006. V. 15. № 1. P. 15–26.
- Valentine A.P., Kalnins L.M. An introduction to learning algorithms and potential applications in geomorphometry and earth surface dynamics // Earth Surface Dynamics. 2016. V. 4. P. 445–460.
- Wang Z., Di H., Shafiq M.A., Alaudah Y., AlRegib G. Successful leveraging of image processing and machine learning in seismic structural interpretation: A review // The Leading Edge. 2018. V. 37. № 6. P. 451–461.
- Xiong Y., Zuo R. Recognition of geochemical anomalies using a deep autoencoder network // Computers & Geosciences. 2016. V. 86. P. 75–82.
- Zhao J., Chen S., Zuo R. Identifying geochemical anomalies associated with Au–Cu mineralization using multifractal and artificial neural network models in the Ningqiang district, Shaanxi, China // Journal of Geochemical Exploration. 2016. V. 164. P. 54–64.
- Zuo R., Xiong Y., Wang J., Carranza E.J.M. Deep learning and its application in geochemical mapping // Earth-Science Reviews. 2019. V. 192. P. 1–14.
- Zuo R.G., Xiong Y.H. Big data analytics of identifying geochemical anomalies supported by machine learning methods // Nat Resour Res. 2018. V. 27. № 1. P. 5–13.
Supplementary files
