Full Text
ВВЕДЕНИЕ
Поток сейсмических событий включает сгущения по времени и по пространству кластеры событий. Понятие «кластер» подразумевает какое-то обобщенное расстояние между событиями, которое для пар событий из одного кластера меньше (или статистически меньше), чем между событиями из данного кластера и другими событиями. Часто встречаются и одиночные события, достаточно далеко отстоящие от других. Обычно в кластере имеется землетрясение с заметно большей магнитудой главное событие. События, предшествующие главному, называют форшоками, а следующие за главным афтершоками (возможны также кластеры, состоящие из близких по величине толчков сейсмические рои, но такие явления относительно редки). Афтершоки, как указывает само название, это сейсмические толчки, следующие после основного толчка, и индуцированные этим толчком. Это определение не является, однако, точным, количественным (что значит индуцированные?).
Наиболее распространена модель сейсмического процесса ETAS (Epidemic Type Aftershock Sequence) [Ogata, Zhuang, 2006; Console et al., 2010; Zhuang et al., 2011; и др.], в которой афтершоки и основные толчки принципиально не различаются: каждый толчок является в той или иной степени афтершоком всех предыдущих толчков. Из статьи [Ogata, Zhang, 2006]: «Indeed, the recognition of seismic anomalies (форшоков, афтершоков, затиший и пр.) appears to be subjective and still seems under development, and even controversial. To overcome these difficulties we first need to use a practical statistical spacetime model that represents the ordinary seismic activity, rather than carrying out a declustering algorithm that removes aftershock events from a catalog.»
ETAS-модель условной (при заданном прошлом) интенсивности точечного сейсмического процесса имеет вид:
| | (1) |
где: μ постоянная фоновая интенсивность независимых Пуассоновских толчков; К некоторая константа; сумма включает все толчки до момента t; tj моменты времени толчков, произошедших до момента t; с, p, α параметры модели; mj магнитуды прошлых толчков; m0 магнитуда нижнего порога каталога.
Как мы видим, модель ETAS не выделяет одного конкретного предка для любого толчка: все предшествующие толчки вносят свой вклад в интенсивность, порождающую любой толчок. Такой подход представляется обоснованным, и он позволяет получить некоторое вероятностное разделение толчков на фоновые и зависимые события, но он неудобен для исследования статистики и физики афтершокового процесса, так как не дает разбиения на отдельные афтершоковые последовательности. В работе [Baiesi, Paczuski, 2004] предлагается считать «предком» данного афтершока единственный предшествующий толчок, вклад которого можно полагать максимальным согласно некоторому правилу. Такой подход позволяет рассматривать в рамках модели ETAS также и отдельные афтершоковые последовательности. Он, однако, противоречит исходной предпосылке модели, ввиду чего логичность модели ETAS несколько нарушается.
МЕТОДЫ ВЫДЕЛЕНИЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙ АФТЕРШОКОВ
Оконные методы
Разнообразие подходов к выделению афтершоков весьма велико, ниже мы кратко упоминаем только те из них, что наиболее тесно соотносятся с нашим подходом. Более полный и объемный обзор возможных способов выделения афтершоков можно найти в работах [Stiphout et al., 2012; Дещеревский и др., 2016]. Исторически первыми методами выделения афтершоковых последовательностей были оконные методы (см., например, [Gardner, Knopoff, 1974; Uhrhammer, 1986]). Эти методы, вследствие простоты реализации, часто и теперь оказываются наиболее используемыми. Оконный метод состоит в том, что к выделенному определенным способом главному событию tk, λk, k, hk, mk приставляют пространственно-временное окно
| | (2) |
| | (3) |
где: r(λk, k; λ, ) расстояние между точками на поверхности Земли с указанными широтами и долготами, а W1 (mk), W2 (mk) пороги, зависящие от магнитуды главного толчка (чем больше магнитуда, тем больше порог). Такой вид имеют, например, окна ГарднераКнопова, Урхаммера и др., (см. [Gardner, Knopoff, 1974; Uhrhammer, 1986; Stiphout et al., 2012]). События, попавшие в окно (2)(3), считаются афтершоками главного события tk, λk, k, hk, mk. Несколько более сложный алгоритм используется в методе [Reasenberg, 1985], где допускаются вторичные афтершоковые последовательности (афтершоки от афтершоков), при этом эти вторичные афтершоки включаются в первичную последовательность афтершоков.
Метод ближайшего соседа
Более сложный вариант выделения зависимых и независимых событий связан с заданием некоторого обобщенного расстояния между толчками [Baiesi, Paczuski, 2004; Zalyapin et al., 2008; Zalyapin, Ben-Zion, 2013; 2013a; и др.]. Субъективный момент в эти построения вносит выбор формулы, используемой для расчета расстояния, и выбор значения порогового расстояния для различения независимых и зависимых событий. Обычно применяется субъективное решение, в той или иной степени подкрепляемое некоторыми качественными соображениями. Такая субъективность, несомненно, уменьшает объективность получаемых выводов. Мы попытаемся, насколько это возможно, вывести далее некоторые статистические свойства афтершоков, не прибегая к субъективному заданию процедуры их выделения.
Одно из наиболее эффективных обобщенных расстояний используется в так называемом методе «ближайшего соседа» (Nearest Neighbor Distance NND) [Baiesi, Paczuski, 2004; Zalyapin, Ben-Zion, 2013; 2013a]. Каждое событие каталога характеризуется 5 числами: t, λ, , h, m (время, широта, долгота, глубина, магнитуда). Несимметричное расстояние Dk (i) от события tk, λk, k, hk, mk до другого события ti, λi, i, hi, mi задается формулой:
|
| (4) |
Здесь: r расстояние между эпицентрами событий (глубины очагов не учитываются, хотя в принципе их несложно учесть); d некоторый показатель, обычно полагаемый равным среднему значению фрактальной размерности поля эпицентров d = 1.6. Параметр b показатель степени в законе ГутенбергаРихтера ради простоты часто полагают равным единице b = 1, что обычно выполняется с удовлетворительной точностью. У каждого события tk, λk, k, mk (кроме первого события в каталоге) есть один ближайший «предок» это то из предшествующих событий, которое имеет наименьшее расстояние до него. Это минимальное расстояние и есть
|
| (5) |
где минимум берется по i. Заметим, что при этом допускается, что магнитуда основного толчка меньше чем афтершока; такие случаи естественно рассматривать как форшоки.
В работе [Zalyapin, Ben-Zion, 2013; 2013a] показано, что является весьма эффективным средством для разделения каталога на кластеры. Распределение величин оказывается двугорбым (см. рис. 1 или, например, рис. 4 в работе [Zalyapin, Ben-Zion, 2013]), где горб с меньшими расстояниями естественно принять как формируемый зависимыми событиями, а горб с большими расстояниями как независимыми. Если ввести некоторый порог, то можно выделить кластеры (цепочки) событий, в которых каждый ближайший предок отстоит на расстоянии меньше этого порога. Вырожденные цепочки состоят из одного события. Но при выборе порога также неизбежен некоторый произвол, хотя обычно приводят некоторые соображения в пользу того или иного выбора.
Рис. 1. Эмпирическая плотность вероятности lg (NNDBk) для исходного каталога (двугорбая кривая) и для каталога со случайно переставленными моментами времени (одногорбая кривая); d = 1.6.
Метод случайного перемешивания
Основным средством нашего статистического анализа будет служить метод случайного перемешивания (случайного тасования) событий по времени. Этот метод является разновидностью классического бутстреп-метода [Efron, 1979]. Он неоднократно применялся ранее для статистического анализа каталогов землетрясений [Писаренко, Родкин, 2007; Pisarenko, Rodkin, 2010; 2013]. Применительно к проблеме анализа афтершоков этот метод упоминается в работе [Дещеревский и др., 2016]. В этой работе проведен тщательный анализ группируемости землетрясений в смысле изменений вероятности возникновения ближайшего (по времени) землетрясения; такой подход, однако, как представляется, существенно ограничивает разнообразие проявлений эффекта группируемости. По-видимому, именно в результате такого ограничения авторами был получен несогласующийся с другими данными вывод о практической независимости параметров группирования от магнитуды землетрясений. Мы будем пользоваться случайной перестановкой моментов времени событий для разрушения причинных («генетических») связей событий в кластерах. Мы пробовали и вариант перемешивания со случайным заданием момента событий на заданном интервале времени; результаты такого перемешивания близки к варианту случайной перестановки моментов времени событий. Далее мы будем обсуждать вариант случайной перестановки моментов времени как меньше искажающий структуру реального каталога землетрясений. На рис. 1 показаны полученные эмпирические плотности вероятности lg при d = 1.6 (детали вычисления этой плотности в Приложении) для исходного каталога и для каталога со случайной перестановкой моментов времени. Был использован глобальный Гарвардский каталог GCMT 19762016 гг., МW ≥ 5.3, глубина очага меньше 70 км.
Вычисление для реальных каталогов приводит к двумодальным распределениям, состоящим из двух четко выраженных горбов (см. рис. 1 или, например, рис. 4 в работе [Zalyapin, Ben-Zion, 2013]). Такое двугорбое распределение указывает на наличие кластеров. Левый горб (меньшие минимальные расстояния) относится, в основном, к парам землетрясений из одного кластера, а правый (большие минимальные расстояния) к парам из разных кластеров. Следует сразу отметить один недостаток при интерпретации гистограмм Распределение значения зависит от номера “k” в каталоге, точнее, от того, сколько событий в каталоге предшествует событию «k». Ведь минимум в (5) берется по всем предшествующим событиям, а их ровно (k 1). Таким образом, гистограммы состоят из неоднородных наблюдений. Для малых k берется минимум из меньшего числа наблюдений, чем для больших k. По этой причине наблюдаемая величина систематически смещается в меньшую сторону с увеличением k. Этот эффект особенно ярко проявляется на каталогах со случайно переставленными моментами времени. В реальных каталогах он также присутствует, но маскируется сильной нестационарностью реального сейсмического потока. Следует учесть также и нестационарность каталога, связанную с ростом со временем доли более слабых событий за счет совершенствования системы регистрации. Однако эта тенденция достаточно слаба и практически не влияет на результаты анализа, если ограничиться событиями выше порога достаточно надежной регистрации. Для используемого далее GCMT-каталога этот порог соответствует магнитудам MW ≥ 5.3.
Для иллюстрации эффекта систематического смещения мы использовали глобальный GCMT-каталог, n = 17 826 событий; 5.3 ≤ m ≤ 9.1; h ≤ 70 км. Моменты времени каталога на интервале [01.01.197612.01.2016] случайно переставлялись, а координаты не менялись. Таким способом было сгенерировано 10 рандомизированных реализаций каталога. Измерялись средние значения lg в скользящих интервалах (k 50; k + 50), k = 51,..,17 776. Разброс этих средних оценивался стандартным отклонением от выборочного среднего (по 10 реализациям).
На рис. 2а для каталогов со случайными перестановками видно, что значения lg быстро уменьшаются с увеличением k примерно до значений k ≈ 6000, а затем уменьшение практически прекращается. На рис. 2б аналогичный график приведен для реального каталога. Уменьшение здесь менее четко выражено, но несмотря на значительный разброс видно, что средние значения для k < 6000, в основном, больше значений для k > 6000.
Рис. 2.а Средние значения lg (NNDBk) в скользящем окне от (k – 50) события до (k+50) события и разброс этих средних (стандартное отклонение по 10 реализациям) для каталога с перестановками по времени (а) и для реального каталога (б).
Чтобы избежать влияния этой нестационарности мы будем в дальнейшем использовать минимальные расстояния только для k > 6000. Естественно, что для других каталогов значение k изменится. Таким образом, в дальнейшем (если это не оговорено специально) мы будем рассматривать для метода NND укороченный каталог для значений 6001 ≤ k ≤ 17 826 с магнитудами m ≥ 5.3, что соответствует временному отрезку 19.11.199212.01.2016 (11826 событий).
Окно Обобщенного расстояния (ОР-окно)
В ранее предложенных окнах (2)(3) ограничения по времени и по пространству действуют независимо друг от друга. А в методе NND эти ограничения используются более гибко в виде произведения функций от расстояния и времени. Однако метод NND довольно сложен в применении, он требует прослеживания связей, не превосходящих заданный порог, выделения связанных графов и т. д. Возникает мысль воспользоваться расстоянием NND в простой оконной форме. Пусть имеется главное событие tk, λk, k, hk, mk. Окно, определяемое порогом W, задается ограничением:
| (tk - t) · rd < W · 10bmk, (tk - t) > 0. | (6) |
Здесь: r расстояние между эпицентрами событий; d некоторый показатель. Окно (6) будем называть окном Обобщенного Расстояния (ОР-окно). Оно использовалось в работах [Писаренко, Родкин, 2018; Pisarenko, Rodkin, 2018]. Здесь мы обсудим его более подробно и сравним эффективность этого метода выделения афтершоков с другими подходами.
Заметим, что отбор в качестве афтершоков событий с помощью порогового соотношения (6) означает, что в начале афтершоковой серии ((tk t) мало) в качестве афтершоков могут отбираться и достаточно удаленные от главного толчка события. В последнее время все больше свидетельств приводится в пользу того, что афтершоки, в особенности, удаленные, инициируются проходящей сейсмической волной, дающей начало процессу генерации афтершоков. При этом вызванные события могут происходить со значительной задержкой [Freed, 2005; Felzer, Brodsky, 2007; Соболев, Закржевская, 2013; Lippiello et al., 2015; Кочарян, 2016]. Окно (6) согласуется с таким механизмом генерации афтершоков, предполагая возможность отбора ранних, удаленных событий в качестве афтершоков.
Сравнение эффективности выделения кластеров различными методами
Сравним ОР-окно с другими традиционными окнами и покажем его относительную эффективность. Для выделения афтершоков с помощью ОР-окна будем начинать с максимального события в каталоге и присоединять к нему в качестве его кластера все события с расстоянием (6) меньше выбранного порога W. Затем будем выбрасывать этот кластер и переходить к следующему максимальному событию. Для изучения характеристик ОР-окна мы также будем использовать укороченный каталог, но только укорачивать его нужно с конца, т. е. отбрасывать какое-то количество последних наблюдений. Как показали предварительные расчеты, для ОР-окна в качестве подходящей верхней границы можно взять момент времени 05.08.2005 г. Поэтому в дальнейшем, если не будет специальных оговорок, мы будем использовать для ОР-окна и других окон укороченный каталог на временном отрезке 01.01.197605.08.2005 гг. (12000 событий М ≥ 5.3). Завершая описание нового ОР-окна, заметим, что любой оконный метод не может быть абсолютно безошибочен. Действительно, для любого пространственно-временного окна и любого каталога существует не равная нулю вероятность попадания независимого события в это окно.
Для сравнения эффективности выделения кластеров различными методами мы снова будем использовать метод случайной перестановки моментов наступления событий, разрушающий причинные («генетические») связи, существующие в отдельных кластерах. Из реального каталога событий мы будем формировать случайные каталоги с помощью случайной перестановки моментов наступления событий. Получив таким способом N различных случайных каталогов, можно будет усреднить оценки различных параметров с целью уменьшения их разброса. Такую процедуру можно рассматривать как разновидность известного бутстреп-метода [Efron, 1979].
Начнем с ОР-метода. Сформируем из данного реального каталога N случайных каталогов. Рассмотрим нормированные расстояния между всевозможными парами событий:
| (tk - ti) · rd · 10-mk, (tk - t) > 0. | (7) |
Отметим, что в плане настоящего рассмотрения нас фактически интересуют не все возможные пары событий, а только события с расстояниями, приведенными на рис. 1 или близкие к таковым. Действительно, при рассмотрении задачи кластеризации землетрясений нам не важны пары точек с большими расстояниями, сравнимыми с пространственно-временными размерами рассматриваемой области. При этом конкретный выбор этого максимально принимаемого в расчет расстояния не существенен, можно задать любое, несколько отступя вправо от правых горбов на рис. 1. При расчетах использованы ограничения по времени не более 1 года. По расстоянию не более 100 км. Функцию распределения этих расстояний для пар из реального каталога обозначим Freal (x), а в случайном каталоге Frand (x).
Мы не сравниваем эти расстояния с каким-либо порогом W и не принимаем решений о принадлежности каких-либо пар к разным кластерам (или к одному и тому же кластеру), а просто отмечаем, что для случайных каталогов с перемешиванием нормированные расстояния (7) будут в среднем больше, чем для реального каталога (так как в реальном каталоге значительная часть событий входит в кластеры с малыми взаимными расстояниями). Определим в качестве оптимального такой порог W, при котором это отличие максимально, и сравним, насколько оно выражено в разных случаях. Степень отличия мы будем характеризовать минимальной вероятностью:
| min[Frand (W) + (1 - Freal (W))], | (8) |
где минимум берется по всем значениям W. При заданном W величина Frand (W) равна вероятности того, что пара из случайного каталога имеет расстояние меньше W, а величина (1 Freal (W)) равна вероятности того, что пара из реального каталога имеет расстояние больше W. Таким образом, их сумму Frand (W) + (1 Freal (W)) можно рассматривать как суммарную вероятность ошибки при использовании порога W для классификации пар. Эту величину мы и принимаем в качестве меры отличия перекрывающихся распределений Freal (W) и Frand (W). Заметим, что можно было бы минимизировать и любую взвешенную сумму вероятностей ошибок. В качестве статистических оценок функций Frand (W) и Frand (W) берутся стандартные эмпирические функции распределения расстояний пар или их сглаженные аналоги. Мы сглаживали эти функции кернел-методом (Приложение 1). При этом для оценки среднего и разброса Frand (W) мы брали N = 25 случайных каталогов.
Мы применили описанную процедуру к 17 каталогам регионального масштаба. Каталоги выбирались как отвечающие определенной сейсмотектонической структуре, скажем Курильской или Алеутской зоне субдукции. Рассмотрение отдельных региональных каталогов и указанных выше ограничений по времени и пространству удобно в данном случае и в том плане, что снимается времяемкая и физически неоправданная процедура поиска возможных фор- и афтершоков в сильно отдаленных сейсмотектонических зонах. Схема с расположением рассматриваемых регионов с их номерами дана на рис. 3.
Рис. 2.б Средние значения lg (NNDBk) в скользящем окне от (k – 50) события до (k+50) события и разброс этих средних (стандартное отклонение по 10 реализациям) для каталога с перестановками по времени (а) и для реального каталога (б).
Для сравнения эффективности ОР-метода мы выбрали метод NND [Baiesi, Paczuski, 2004; Zalyapin, Ben-Zion, 2013] и два часто используемых окна: окна ГарднераКнопова и Урхаммера. Наиболее часто используемое окно ГарднераКнопова [Gardner, Knopoff, 1974] имеет вид:
|
| (9) |
Окно ГарднераКнопова Tnorm ≤ 10W; Dnorm ≤ 10W имеет стандартный размер при W = 0.
Окно Урхаммера [Uhrhammer, 1986]:
| Tnorm = (tk ti) · 101.2464 - 0.5316 M; M ≥ 6.5; Dnorm = 100.4447 - 0.3992 M. | (10) |
Окно Урхаммера Tnorm ≤ 10W; Dnorm ≤ 10W имеет стандартный размер при W = 0.
ОР-окно имеет вид:
| ((tk - ti)/365) · rd · 10-bmk < 10W, | (11) |
где: b коэффициент наклона закона ГутенбергаРихтера для данного региона; d фрактальная размерность. Стандартный размер окна соответствует значениям W = 5, d = 1.6. Отметим, что ОР-окно зависит от локального (регионального) параметра b, что дает возможность несколько адаптироваться к данному региону, чего нет у других окон.
На рис. 4рис. 5 приведены графики суммарной вероятности ошибки для двух регионов: Курил (b = 0.930) и Алеут (b = 0.921), оцененных с помощью ОР-окна. Показана исходная кривая и сглаженный с помощью кернел-плотности вариант. Оценки параметра b получались стандартным методом правдоподобия с использованием усеченного распределения ГутенбергаРихтера.
Рис. 4. Алеуты. ОР-окно. Графики суммарной ошибки Frand (W) + (1Freal (W)). Исходная кривая и сглаженный вариант.
Рис. 5. Курилы. ОР-окно. Графики суммарной ошибки Frand (W) + (1-Freal (W)). Исходная кривая и сглаженный вариант.
Таблица 1
Регион, | Метод NND | ОР-окно | Окно ГарднераКнопова | Окно Урхаммера |
min Frand (W) + (1-Freal (W)) | Wmin | min Frand (W) + (1-Freal (W)) | Wmin | min Frand (W) + (1-Freal (W)) | Wmin | min Frand (W) + (1-Freal (W)) | Wmin |
1 | 0.642 | 6.44 | 0.623 | 8.43 | 0.756 | 0.357 | 0.738 | 0.27 |
2 | 0.790 | 5.57 | 0.806 | 6.78 | 0.924 | 0.014 | 0.935 | 0.14 |
3 | 0.682 | 4.43 | 0.698 | 4.89 | 0.886 | 0.068 | 0.870 | 0.46 |
4 | 0.746 | 4.51 | 0.813 | 5.36 | 0.908 | 0.015 | 0.911 | 0.41 |
5 | 0.732 | 5.29 | 0.732 | 5.78 | 0.811 | 0.087 | 0.855 | 0.093 |
6 | 0.718 | 4.89 | 0.711 | 5.93 | 0.797 | 0.230 | 0.796 | 0.42 |
7 | 0.753 | 4.83 | 0.849 | 5.63 | 0.899 | 0.107 | 0.907 | 0.14 |
8 | 0.708 | 4.98 | 0.680 | 5.87 | 0.801 | 0.217 | 0.798 | 0.35 |
9 | 0.699 | 5.19 | 0.703 | 5.90 | 0.823 | 0.141 | 0.799 | 0.44 |
10 | 0.690 | 4.64 | 0.705 | 5.71 | 0.820 | 0.111 | 0.817 | 0.36 |
11 | 0.759 | 4.04 | 0.720 | 4.85 | 0.820 | 0.216 | 0.817 | 0.31 |
12 | 0.654 | 4.23 | 0.765 | 4.94 | 0.846 | 0.179 | 0.838 | 0.38 |
13 | 0.458 | 4.45 | 0.437 | 5.82 | 0.569 | 0.291 | 0.611 | 0.52 |
14 | 0.451 | 4.43 | 0.427 | 6.03 | 0.535 | 0.215 | 0.539 | 0.53 |
15 | 0.731 | 6.27 | 0.747 | 8.25 | 0.837 | 0.100 | 0.883 | 0.24 |
16 | 0.711 | 6.02 | 0.669 | 8.42 | 0.886 | 0.061 | 0.917 | 0.053 |
17 | 0.793 | 6.19 | 0.712 | 8.00 | 0.841 | 0.106 | 0.868 | 0.29 |
Таблица 2
Сейсмотектонические зоны и номера регионов | Метод NND | ОР-окно | Окно ГарднераКнопова | Окно Урхаммера |
min Frand (W) + (1-Freal (W)) | min Frand (W) + (1-Freal (W)) | min Frand (W) + (1-Freal (W)) | min Frand (W) + (1-Freal (W)) |
Зона Субдукции 112 | 0.710 ± 0.033 | 0.732 ± 0.070 | 0.842 ± 0.057 | 0.843 ± 0.063 |
Зона Континентов 1314 | 0.581 ± 0.152 | 0.587 ± 0.180 | 0.693 ± 0.163 | 0.701 ± 0.149 |
Зона Рифтов 1517 | 0.745 ± 0.042 | 0.703 ± 0.039 | 0.855 ± 0.087 | 0.889 ± 0.025 |
Все Зоны 117 | 0.686 ± 0.095 | 0.694 ± 0.113 | 0.809 ± 0.107 | 0.818 ± 0.106 |
В табл. 1 приведены значения минимальной суммарной вероятности ошибки для всех 17 регионов.
Иногда бывает полезно раздельно рассмотреть характеристики сейсмического режима для различных типов сейсмотектонических провинций, а именно, для зон субдукции, внутриконтинентальной коллизии и для срединно-океанических хребтов. Эти обобщенные зоны были сформированы на основе приведенных выше регионов. Средние по зонам оценки приведены в табл. 2. Из табл. 2 видно, что наиболее явственное разделение, минимальное значение суммы Frand (W) + (1 Freal(W)), получается для внутриконтинентальных зон коллизии. И наихудшее разделение, в среднем, получается для срединно-океанических хребтов. Можно предположить, что такой результат связан с наиболее точной информацией для внутриконтинентальных зон сейсмичности и наименее полной (вследствие удаленности сейсмостанций) для зон срединно-океанических хребтов.
Из табл. 1, табл. 2 мы видим, что метод NND и ОР-окно имеют вероятность ошибки в среднем на 0.12 меньше, чем два другие окна. Это различие выходит за рамки погрешностей, является значимым. Поэтому можно заключить, что метод NND и ОР-окно предпочтительней упомянутых традиционных окон. Подчеркнем, что этот вывод мы сделали, не используя исходного задания величин порогов.
Варьирование показателя d
Как мы упоминали, для разделения на кластеры связанных между собой «генетически» и несвязанных событий необходимо ввести какое-то обобщенное расстояние. NND-метод принимает это расстояние в виде (4), а ОР-метод в виде (11). Для показателя d обычно используют значение d = 1.6, ссылаясь при этом на корреляционную размерность поля эпицентров [Molchan, Kronrod, 2009]. Проверим, является ли такое задание показателя d оправданным. Если взять логарифм нормированного обобщенного расстояния (6)
| lg (ti – tk) + d · lg (r) – b · mk, | (12) |
то мы получим показатель d как множитель при логарифме расстояния. Таким образом, этот показатель определяет вес, который пространственная компонента имеет по сравнению с временной. Чем больше d, тем больший вес мы придаем пространственной компоненте. В качестве критерия, который позволит выбрать оптимальное в определенном смысле значение d в задаче выделения кластеров, выберем минимальную суммарную вероятность ошибки, рассмотренную в предыдущем разделе. Обозначим ее через р:
| p = min[Frand (W) + (1 – Freal (W)]. | (13) |
Посчитаем с помощью ОР-окна вероятности р для значений d = 0; 0.5; 1.0; 1.5; 2.0 для всех 17 регионов, выбирая для каждого из них соответствующее значение b с теми же параметрами, которые мы использовали при составлении табл. 1, табл. 2. В качестве иллюстрации на рис. 6 показаны кривые суммарных вероятностей Frand (W) + (1 Freal (W)) для региона Японии.
Средние по 17 регионам значения р для разных значений d показаны в табл. 3.
Таблица 3. Минимальные вероятности р для ОР-окна
Коэффициент d | 0 | 0.5 | 1.0 | 1.5 | 2.0 |
Минимальная вероятность р ± std | 0.735 ± 0.094 | 0.731 ± 0.102 | 0.729 ± 0.106 | 0.729 ± 0.114 | 0.735 ± 0.116 |
Рис. 6. Суммарная вероятность ошибки для региона Японии при разных d. Крайняя левая кривая соответствует d = 0. Затем вправо по порядку: d = 0.5; 1.0; 1.5; 2.0. Приведена исходная кривая (неровная) и сглаженный вариант. По оси Х порог W.
Ради экономии места мы приводим только средние значения р, заметив при этом, что вариабельность значений р по регионам довольно велика (среднее стандартное отклонение составляет 0.107). При этом для каждого из регионов при изменении d вероятность р изменяется менее существенно (среднее стандартное отклонение для вариаций р внутри региона составляет 0.088). Формально проинтерполированное среднее минимальное значение р = 0.728 соответствует размерности d = 1.34, что достаточно близко к принятому значению d = 1.6. При этом при других значениях d минимальные р отличаются в среднем не более, чем на 0.025, что не является значимым. Таким образом, при использовании критерия р выбор значения d в ОР-окне несущественен и можно использовать стандартное значение d = 1.6 без потери эффективности. Отметим также, что при использовании ОР-окна существенна подгонка параметров окна к данному региону (наклон графика ГутенбергаРихтера b, порог W, соответствующий минимальному р, нижний порог магнитуд m0).
Степень стационарности потока главных толчков для разных методов декластеризации
Одно из основных требований, предъявляемых к различным методам декластеризации сейсмического потока, является требование стационарности последовательности главных толчков. Сравним по этому критерию стандартные окна ГарднераКнопова, Урхаммера и ОР-окно (9)(11), а также метод NND. Для первых двух стандартный порог W = 0, для ОР-окна и метода NND W = 5. Для идеального Пуассоновского стационарного потока распределение моментов событий на нормированном к единице интервале времени должно быть равномерным на отрезке [0; 1]. В качестве критерия стационарности мы будем использовать стандартный критерий, основанный на расстоянии Колмогорова KD. Если обозначить моменты времени главных толчков (t1, t2,.., tn), то расстояние KD будет иметь вид:
|
| (14) |
где Fn (t) функция эмпирического распределения выборки (t1, t2,.., tn) и максимум берется по всем t. KD имеет стандартное распределение Колмогорова, из которого для конкретного расстояния KD0 можно получить вероятность его превышения при выполнении гипотезы равномерного распределения моментов событий на заданном отрезке времени, которую будем обозначать pKD. Если pKD очень мало (расстояние Колмогорова очень велико), то гипотезу равномерности отвергают. Обычно в качестве порогового значения берут 0.1.
В табл. 4 приведены значения KD, pKD для 17 регионов, рассмотренных выше, а также две характеристики декластеризации: доля главных толчков Cm и доля одиночных толчков Cs среди всех главных толчков. В значениях pKD мы приводим две значащие цифры. Для окон использовались укороченные каталоги, с верхней границей 05.08.2005; для метода NND укороченный каталог начинался с 19.11.1992 г.
В табл. 5 приведены медианы значений pKD по всем 17 регионам для NND-метода и трех окон (медианы в данном случае являются более адекватной характеристикой среднего значения из-за большой асимметрии распределения). Там же приведены средние значения для долей главных толчков Cm (среди всех толчков) и долей одиночных толчков Cs среди главных толчков.
Таблица 4
| Метод NND | ОР-окно | Окно ГарднераКнопова | Окно Урхаммера |
KD/pKD | Cm/Cs | KD/pKD | Cm/Cs | KD/pKD | Cm/Cs | KD/pKD | Cm/Cs |
1 | 0.94/0.35 | 0.38/0.64 | 1.02/0.25 | 0.49/0.75 | 1.23/0.097 | 0.76/0.80 | 1.30/0.070 | 0.82/0.88 |
2 | 0.94/0.35 | 0.51/0.72 | 0.84/0.48 | 0.65/0.81 | 1.18/0.13 | 0.57/0.71 | 0.97/0.30 | 0.70/0.84 |
3 | 0.76/0.61 | 0.60/0.82 | 0.86/0.45 | 0.66/0.83 | 0.86/0.45 | 0.44/0.66 | 1.32/0.0062 | 0.48/0.79 |
4 | 0.71/0.69 | 0.65/0.85 | 0.74/0.64 | 0.71/0.84 | 0.56/0.91 | 0.41/0.60 | 1.11/0.17 | 0.51/0.82 |
5 | 2.01/0.0001 | 0.47/0.83 | 2.98/0 | 0.56/0.88 | 2.95/0 | 0.48/0.73 | 1.45/0.030 | 0.35/0.83 |
6 | 0.64/0.80 | 0.64/0.77 | 0.69/0.73 | 0.70/0.81 | 0.74/0.65 | 0.53/0.68 | 0.59/0.87 | 0.62/0.80 |
7 | 1.32/0.061 | 0.49/0.83 | 1.30/0.068 | 0.53/0.86 | 1.36/0.050 | 0.42/0.68 | 2.82/0 | 0.33/0.85 |
8 | 0.82/0.52 | 0.55/0.79 | 1.10/0.18 | 0.62/0.81 | 0.61/0.86 | 0.47/0.70 | 0.92/0.37 | 0.51/0.79 |
9 | 0.83/0.49 | 0.84/0.89 | 0.78/0.57 | 0.86/0.92 | 0.67/0.76 | 0.66/0.79 | 0.60/0.86 | 0.81/0.91 |
10 | 1.27/0.079 | 0.68/0.82 | 1.55/0.016 | 0.73/0.85 | 1.11/0.18 | 56/0.75 | 1.39/0.043 | 0.65/0.84 |
11 | 1.06/0.22 | 0.83/0.86 | 0.92/0.33 | 0.87/0.91 | 0.64/0.80 | 0.66/0.75 | 0.81/0.53 | 0.77/0.88 |
12 | 2.47/0 | 0.62/0.86 | 2.76/0 | 0.67/0.89 | 1.75/0.0044 | 0.48/0.73 | 1.06/0.21 | 0.38/0.84 |
13 | 1.04/0.23 | 0.80/0.89 | 0.89/0.40 | 0.82/0.94 | 1.07/0.21 | 0.77/0.86 | 0.88/0.43 | 0.78/0.87 |
14 | 1.29/0.072 | 76/0.82 | 1.27/0.079 | 0.80/0.83 | 1.21/0.107 | 0.71/0.76 | 1.31/0.066 | 0.78/0.82 |
15 | 1.55/0.016 | 0.60/0.74 | 1.53/0.019 | 0.74/0.82 | 1.60/0.012 | 0.87/0.89 | 1.67/0.0075 | 0.93/0.93 |
16 | 0.52/0.95 | 0.78/0.84 | 0.62/0.83 | 0.84/0.88 | 0.92/0.37 | 0.91/0.91 | 1.15/0.14 | 0.95/0.95 |
17 | 0.76/0.61 | 0.74/0.79 | 0.82/0.54 | 0.83/0.86 | 0.96/0.32 | 0.84/0.86 | 1.19/0.12 | 0.92/0.94 |
Примечание: жирным шрифтом выделены значения pKD < 0.1, не удовлетворяющие требованию статистически равномерного распределения основных толчков по времени.
Таблица 5
| Метод NND | ОР-окно | Окно ГарднераКнопова | Окно Урхаммера |
Медиана pKD | 0.35 | 0.33 | 0.21 | 0.14 |
Средняя доля Cm | 0.64 | 0.71 | 0.62 | 0.66 |
Средняя доля Cs | 0.81 | 0.85 | 0.76 | 0.86 |
Из табл. 4, табл. 5 можно сделать следующие выводы. Метод NND и ОР-окно в целом обеспечивают режим главных толчков близкий к стационарному. Несколько хуже работает окно ГарднераКнопова. Для отдельных регионов и интервалов времени (в частности, практически всегда после гигантских землетрясений) возможны заметные отклонения от стационарности. Такие отклонения возникают при всех методах выделения афтершоков. Окно Урхаммера не обеспечивает достаточной стационарности потока главных толчков. Отметим, что ОР-окно оставляет большую долю событий в качестве главных толчков, не снижая показателя pKD. Это качество может оказаться привлекательным при решении некоторых задач, связанных с декластеризацией. Доля одиночных главных толчков Cs для всех рассмотренных методов довольно велика и составляет 7585 %.
ОБСУЖДЕНИЕ
Для количественного измерения степени «генетической» связи толчков каталога (обобщенного расстояния между толчками) предлагаются разные модели [Gardner, Knopoff, 1974; Reasenberg, 1985; Uhrhammer, 1986; Molchan, Dmitrieva, 1992; Zalyapin I and Ben-Zion, 2013; и др.]. В оконных вариантах решения задачи считается, что главный толчок каким-то способом определен (например, выбирается сильнейшее событие, которое по используемому определению не может быть афтершоком), а следующие за ним толчки проверяются с помощью соответствующего окна на принадлежность к его кластеру. При статистическом подходе в качестве обобщенного расстояния используют монотонную функцию от правдоподобия (или от интенсивности точечного процесса). Естественно, что для получения функции правдоподобия нужна статистическая модель событий каталога в виде случайного точечного процесса. Процедура статистической проверки может включать в себя итерационные циклы и инкорпорировать известные сейсмологические закономерности (закон ГутенбергаРихтера, закон Омори и др.).
В настоящей статье проводится сравнение традиционных оконных методов выделения афтершоков (окно ГарднераКнопова и окно Урхаммера) с недавно введенным методом NND и предлагаемом нами новым, основанном на обобщенном расстоянии между толчками ОР-окном. Показано также, что при расчете минимальных расстояний для уменьшения систематического смещения желательно использовать укороченный каталог. При этом для ОР-окна нужно укорачивать каталог с конца, т. е. использовать только главные толчки, не выходящие по времени за определенный предел, а для метода NND укорачивать каталог следует с его начала.
При сравнении эффективности методов с помощью случайной перестановки моментов толчков показано, что метод NND и ОР-окно имеют близкие показатели (суммарные вероятности ошибочного решения), в то время как окна ГарднераКнопова и Урхаммера заметно им уступают (табл. 2). Заметим, что при этом сравнении мы не использовали каких-либо порогов для промежутка времени и расстояния между толчками. Отметим также, что метод NND и ОР-окно используют некоторые региональные характеристики (адаптация к условиям конкретного региона), что дает им определенное преимущество.
При изменении параметра d в методе NND и ОР-окне мы не обнаружили существенного влияния этого параметра на эффективность различения реального и псевдослучайного каталогов в диапазоне 0 ≤ d ≤ 2 (при том, что оптимальное значение d = 1.34 достаточно близко к обычно используемому значению d = 1.6). Отсюда заключаем, что можно пользоваться общепринятым значением d = 1.6 без потери эффективности.
Мы сравнили также рассмотренные 4 метода декластеризации по степени равномерности распределения по времени выделяемых данным методом главных толчков (стационарность потока главных толчков). В качестве критерия использовалось расстояние Колмогорова KD и соответствующая ему вероятность превышения pKD. Оказалось, что метод NND и ОР-окно приводят к вполне приемлемым показателям стационарности (медиана значений pKD по всем 17 регионам равна 0.330.35), окно ГарднераКнопова дает несколько худший показатель: медиана pKD = 0.21, а окно Урхаммера приводит к потокам главных толчков с наибольшими отклонениями от стационарности: медиана pKD = 0.14; при этом в 7 регионах из 17 показатель pKD меньше 0.1, т. е., формально не удовлетворяют требованию равномерного распределения основных толчков по времени. Отметим, что для всех сравниваемых методов выделения афтершоков равномерность распределения основных толчков по времени нарушается в окрестности наиболее сильных событий (М = 9.0+ и близких к ним), как правило, сопровождаемых большим шлейфом афтершоков. Отметим, что выявленные нарушения стационарности могут порождаться как реальным нарушением режима фоновой сейсмичности в окрестности сильнейших землетрясений, так и издержками применения удобных оконных методов, заведомо отбраковывающих как афтершоки некоторое число основных событий. Последствия такой отбраковки будут особенно заметны для больших по площади зон влияния сильнейших землетрясений, происходящих при этом в областях с высоким уровнем фоновой сейсмичности.
Предлагаемый нами метод ОР-окна может оказаться практически удобным, ввиду простоты реализации и наибольшей близости результатов его применения к результатам наиболее логически обоснованного, но практически трудно реализуемого варианта NND-метода.
Примененный нами в настоящей работе метод случайной перестановки моментов толчков является полезным статистическим приемом, родственным известному бутстреп-методу, позволяющим анализировать эффективность выделения кластеров событий в сейсмическом потоке без дискуссионных априорных ограничений. При этом ОР-окно, за счет одновременного учета расстояний от главного события по пространству и по времени, а также учету локальных величин наклона графика повторяемости, представляется более гибким. В частности, это окно пропускает как афтершоки ранние, но довольно удаленные события; аргументы в пользу статистической связи таких событий с очагом главного землетрясения приводятся в работе [Freed, 2005; Felzer, Brodsky, 2007; Соболев, Закржевская, 2013; Lippiello et al., 2015].
Подавляющее большинство работ по афтершокам посвящены исследованиям статистических свойств афтершоковых кластеров [Баранов и др., 2018; Гульельми и др., 2014; 2015; 2017; Лутиков, Родина 2013; Zalypin, Ben-Zion 2013; 2013a; Ogata, Zhuang, 2006] и вероятностному прогнозу афтершоковой активности [Баранов, Шебалин, 2016; 2017; 2018; 2018а]. При этом довольно часто авторы декларативно избегают сравнения качества разных алгоритмов выделения афтершоков (см., например, обобщающую работу [Stiphout et al., 2012]). В работе [Дещеревский и др., 2016] констатируется, что «анализ литературы показывает, что набор правил декластеризации, в том числе стохастической, в большей степени зависит от предпочтений исследователей, чем от каких-либо объективно определяемых признаков, обоснованных физическими моделями развивающегося процесса». Причина этого, по-видимому, в неопределенности понятия афтершока и отсутствия единого физического механизма возникновения афтершоков. Так, разными авторами афтершоки связываются с эффектом прохождения сейсмической волны от главного события, изменением напряженного состояния в результате этого события или с изменениями состояния некоторого объема геофизической среды. Отсюда афтершоки можно связать с эпизодами особенно быстрого изменения в состоянии геофизической среды, но тогда возникает вопрос, где проходит граница между этими более быстрыми и фоновыми изменениями. Заметим, что отмеченное выше нарушение стационарности потока основных событий в широкой окрестности сильнейших землетрясений также может быть связано с изменениями состояния среды при подготовке и реализации мегаземлетрясений.
Исследование физических аспектов афтершокового процесса механизмов инициации афтершокового процесса и зависимости режима афтершоков от параметров теплового режима, флюидного режима и характера напряженного состояния литосферы фактически только началось [Felzer, Brodsky, 2007; Hainzl et al., 2013; Lippiello et al., 2015; Shebalin, Narteau, 2017; Смирнов и др., 2019; и др.]. Мы здесь не касаемся этих вопросов. Отметим только, что выбор алгоритма выделения афтершоков является необходимым предварительным этапом исследования статистических закономерностей и физики афтершокового процесса. При этом выбор алгоритма влияет на статистические свойства исследуемой совокупности афтершоков и на физическую интерпретацию механизмов афтершокового процесса. В частности, при использовании предложенного выше алгоритма к афтершокам может быть отнесено определенное число ранних афтершоков, пространственно удаленных от основного землетрясения.
ФИНАНСИРОВАНИЕ РАБОТЫ
Исследования выполнены при частичной поддержке РФФИ, грант 17-05-00351.
БЛАГОДАРНОСТИ
Авторы признательны П.Н. Шебалину, любезно ознакомившемуся со статьей и давшему рекомендации, способствовавшие ее улучшению.
Приложение
Оценка плотности вероятности ядерным методом (kernel method)
Пусть дана выборка (x1,.., xn). Кернел-метод (ядерный метод) [Shawe, 2004], предлагает в качестве оценки плотности вероятности этой выборки функцию:
|
| (1A) |
где: g (x) какая-нибудь симметричная, унимодальная плотность вероятности; σ масштабный параметр. Мы предлагаем взять в качестве g (x) стандартную, нормальную плотность:
|
| (2A) |
Задача состоит в подходящем выборе масштабного параметра σ в зависимости об объема выборки n. При большом σ оценка (1А) может сильно сгладить плотность, а при малом σ в оценке могут появиться ложные пики. Для оптимального выбора масштабного параметра предположим, что неизвестная истинная плотность f (x) является гладкой функцией и имеет вторую производную. Мы рассматриваем задачу асимптотически при n → ∞, σ → 0 и будем пренебрегать членами высшего порядка малости по 1/n, σ. Математическое ожидание f* (x) равно:
(3A)
Отсюда смещение B (x) оценки Е f* (x) равно:
|
| (4А) |
Точно так же, используя разложение в ряд Тейлора до членов второго порядка и отбрасывая члены более высокого порядка малости, получаем дисперсию оценки f* (x):
|
| (5А) |
Естественно требовать, чтобы квадрат смещения и дисперсия имели один и тот же порядок малости при n → ∞, σ → 0. В результате из уравнений (4А), (5А) получаем решение нашей задачи:
σ ~ C/n 1/5. (6A)
Константу С целесообразно выбирать с учетом специфики конкретной задачи. Наш опыт привел к выбору С ~ 0.3*std, где std стандартное отклонение выборки (x1,.., xn).