Theoretical analysis of the predictability indices of the binary genetic tests

Aleksandr Vladimirovich Rubanovich; Рубанович Александр Владимирович; Nikita Nikolayevich Khromov-Borisov; Хромов-Борисов Никита Николаевич

doi:10.17816/ecogen11177-90

Theoretical analysis of the predictability indices of the binary genetic tests

Authors: Rubanovich A.V.¹, Khromov-Borisov N.N.²
Affiliations:
1. Vavilov Institute of General Genetics RAS
2. Saint-Petersburg State I. P. Pavlov Medical University
Issue: Vol 11, No 1 (2013)
Pages: 77-90
Section: Articles
URL: https://journals.eco-vector.com/ecolgenet/article/view/2398
DOI: https://doi.org/10.17816/ecogen11177-90
ID: 2398

Cite item

Full Text

Abstract
Full Text
About the authors
References
Supplementary files
Statistics

Abstract

A set of formulas for the indices of performance and predictive ability of the binary genetic tests is presented. Their dependence on disease prevalence and population frequency of a genetic marker is characterized. It is shown that a marker with the odds ratio OR < 2.2 has an initially low prognostic efficiency in every sense and at any frequencies of the disease and the marker. A marker can be a good classifier, when OR > 5.4, but only when its population frequency is rather high (>0.3). The formulas are presented that allow to obtain indirect estimates of absolute and relative risk of the disease for the carrier of a marker in the case-control studies

Keywords

AUC, genetic association studies, odds ratio, area under curve (AUC), predictive genetic testing

Full Text

Введение Повсеместное распространение исследований статистических связей между генотипом и предрасположенностью к широко распространенным заболеваниям породило острую дискуссию о методах оценки прогностической эффективности маркеров, выявляемых в результате этих работ (Poste, 2011; Kraemer et al., 2011; Pepe et al., 2010; Kraft et al., 2009; Jakobsdottir et al, 2009; Tan et al., 2004). В большинстве случаев авторы сходятся во мнении о том, что высокие значения показателей сопряженности маркера с признаками не гарантируют возможности использования этого маркера для прогноза фенотипического проявления генотипа. В частности, многие авторы подчеркивают, что статистически высоко значимая сопряженность заболевания с генетическим маркером является необходимым, но не достаточным условием возможности использовать такой маркер для предсказания предрасположенности к заболеванию. Так, например, многочисленные гены, выявляемые при широкогеномном сканировании как сопряженные с раком предстательной железы, лишь на несколько процентов увеличивают предсказательную эффективность традиционных биомаркеров (PSA, Gleason score) (см., например, Aly et al. 2011 и редакторский комментарий Bjartell, 2011). В этой связи нами было предпринято теоретическое исследование ситуаций, возникающих при попытках описания статистических связей «генотип — бинарный признак». В первую очередь нас интересовал вопрос: какие значения OR (отношения шансов) могут обнадежить исследователя? При каких OR на основе выявленной генетической ассоциации может быть создан эффективный биомаркер предрасположенности к заболеванию? Мы покажем, что ответы на эти вопросы существенно зависят от распространенности заболевания и частоты встречаемости маркера. Цель публикации — всесторонне исследовать функциональную зависимость стандартных показателей эффективности теста от трех независимых параметров: OR, популяционная частота маркера (pM) и распространенность заболевания (pD). Обзор показателей эффективности бинарного теста Количество предложенных мер сопряженности качественных признаков давно превышает все разумные пределы. В работе (Tan et al., 2004) перечислен 21 показатель ассоциирования, характеризующий таблицу сопряженности из 4 чисел. Столь же многообразны попытки упорядочить возможные индексы и меры сопряженности. В недавней работе (Bossuyt, 2010) предлагается следующая классификация: 1) показатели точности (error-based) — чувствительность, специфичность и производные от них; 2) показатели информативности (information-based) — абсолютные риски при положительных и отрицательных результатах тестирования и отношения правдоподобий; 3) показатели сопряженности (association-based) — отношение шансов OR, относительные риски и показатель «каппа» Коуэна. Эта классификация выглядит не слишком естественной. Фактически к показателям точности отнесены все оценки, связанные с исследованиями типа «случаи — контроли», а к показателям информативности отнесены оценки, характерные для когортных исследований. Абсолютные риски отнесены к показателям информативности, а их отношение (относительный риск) к показателям сопряженности. Кроме того, при OR >> 1 показатель «каппа» и относительные риски могут быть сколь угодно малы, а высокое отношение правдоподобий не гарантирует высокий уровень абсолютных рисков. Мы будем придерживаться следующей нехитрой классификации: 1) тотальные показатели, т. е. зависящие от всей таблицы сопряженности; 2) условные показатели, при вычислении которых используются либо только строки, либо только столбцы таблицы сопряженности. Во втором случае мы будем всячески подчеркивать симметричность ситуации — каждому показателю по строчкам соответствует аналогичный показатель по столбцам. Фактически это единственный способ не запутаться в многообразии возможных характеристик теста. Кроме того, подобная классификация продиктована структурой данных в «генетике предрасположенностей». Генетики редко имеют возможность провести популяционное исследование генотипов и вычислить вероятность совмещения генетического маркера и заболевания. Обычно удается оценить лишь условные вероятности носительства маркера при наличии заболевания (исследования по схеме «случаи–контроль»), либо вероятности развития заболевания при условии носительства маркера (когортные исследования с целевым выбором носителей маркера). Эти два варианта соответствуют вычислениям условных показателей по столбцам либо по строкам. Пусть совместное распределение вероятностей встречаемости маркера М и заболевания D задано в виде стандартной таблицы (матрицы) сопряженности 2 × 2 (1) с нормировкой. Здесь мы предполагаем, что бинарные случайные величины М и D принимают значения: M и D . Под маркером М понимается «предрасполагающий» генотип (аллель, гаплотип), сопряженный с заболеванием D. Под имеется в виду совокупность альтернативных генетических вариантов. означает отсутствие заболевания. Введем обозначения для маргинальных сумм: — распространенность заболевания, и — популяционная частота маркера. Легко проверяемое тождество P(M,D) – pM pD =P(,) – (1 – pM )(1 – pD ) = pM (1– pD ) – P(M,) обусловливает возможность представления исходной матрицы Р в виде: , (2) В этой сумме первая матрица соответствует случаю независимых случайных величин М и D, а вторая — добавка, возникающая за счет их взаимодействия. Далее мы будем рассматривать исключительно случай ∆ ≥ 0 (положительная связь между маркером и заболеванием). Случай ∆ < 0 соответствует замене . Величина является одной из возможных (но редко используемых) мер сопряженности М и D. Определения наиболее распространенных показателей статистической сопряженности перечислены в таблице 1. Тотальные показатели ассоциирования К их числу относятся отношение шансов (OR), точность (ACC), коэффициент корреляции (r) и показатель «каппа» Коуэна (Cohen’s kappa — κС) (Cohen, 1960). Очевидное преимущество показателя OR состоит в его универсальности в смысле применимости к любой схеме исследований (случаи — контроли, когортные исследования). Остальные тотальные показатели могут непосредственно оцениваться лишь в популяционных исследованиях (без целевого выбора «только больные» или только «носители маркера»). Интуитивно привлекательным для понимания является показатель ACC (другое название — FC, Fraction Correct (Mitchell, 2009a, b)), который определяется как доля случаев правильного срабатывания теста (след матрицы Р). Строго говоря, ACC не является показателем сопряженности, поскольку АСС > 0 при OR = 1. Более того, при pM ≈ pD << 1 величина ACC слабо зависит от OR и близка к 1 даже в отсутствие статистической взаимосвязи. В показателях r и κ фактически используется разность ∆ = P(M, D) − pM pD . Тем не менее, коэффициент корреляции r в генетических исследованиях предрасположенности практически не фигурирует, т. к. непосредственно оценивается лишь в популяционных исследованиях. Величина r в первую очередь отражает линейность взаимосвязи M и D, т. е. близость матрицы Р к диагональному виду. При этом в отличие от OR коэффициент корреляции может не регистрировать ситуации (быть близким к нулю), в которых носительство маркера является лишь необходимым (либо только достаточным) условием заболевания. Показатель κC часто используют для проверки согласия между двумя способами диагностики или между мнениями двух диагностов. При этом считается, что согласие хорошее при 0,6 ≤ κC ≤ 0,8 и отличное при 0,8 ≤ κC ≤ 1,0 (Landis, Koch, 1977). На практике показатель κC близок к коэффициенту корреляции, но всегда κC ≤ r с равенством при pM = pD . Точнее . Условные показатели ассоциирования Условные показатели (нижняя часть табл. 1) можно вычислять по столбцам либо по строчкам матрицы сопряженности в зависимости от схемы исследования. Обычно используют условные вероятности появления истинно позитивных и истинно негативных результатов тестирования. В исследованиях по схеме «случаи–контроли» по столбцам можно непосредственно оценить чувствительность (SE) и специфичность (SP) теста. При проведении когортных исследований непосредственной оценке поддаются двойственные показатели по строкам: предсказательная ценность для положительных (PPV) и отрицательных (NPV) результатов диагностического теста (positive/negative predictive value). Для каждой пары показателей можно определить относительные риски (LR и RR), которые всегда меньше OR. Двойственность определения условных показателей обусловливает выполнение тождеств: . Ясно, что OR > RR > LR при pM > pD, и OR > LR > RR при pM < pD . Показатель LR называют отношением правдоподобий и часто обозначают как LR+, имея в виду выполнение тождества , которое позволяет интерпретировать LR+ как отношение апостериорных шансов заболеть после получения информации о носительстве маркера к априорным шансам заболевания до получения такой информации. При этом вводится аналогичный показатель для отрицательных результатов тестирования: . Мы будем рассматривать лишь в виду его двойственности к условному показателю RR (относительный риск). Среднюю эффективность теста часто характеризуют разностью абсолютных рисков: (в исследованиях «случаи–контроли»), (в когортных исследованиях). Легко видеть, что показатели средней эффективности являются коэффициентами наклона соответствующих линий регрессии: (3) , где, , bM|D и bD|M — наклоны линий регрессии M на D и D на M, соответственно. Имеются в виду регрессии, которые вычисляются после перекодировки: . Очевидно, что показатель bD|M, являясь коэффициентом наклона регрессии D на M и разностью абсолютных рисков, характеризует среднюю диагностическую эффективность маркера, т. е. возможность предсказывать индивидуальную предрасположенность к заболеванию по результатам тестирования на носительство маркера. В отношении показателя bM|D в следующем разделе будет показано, что в некотором смысле этот показатель характеризует возможности маркера решать классификационные задачи. Ничего другого и не следовало ожидать: показатель bM|D, являясь коэффициентом наклона регрессии M на D, характеризует способность теста отличать выборки больных от выборок здоровых. Ясно, что коэффициент корреляции является средним геометрическим условных показателей эффективности теста: . Отметим также, что величины bM|D и bD|M часто называют индексом Юдена (Youden, 1950) и суммарным предсказательным индексом (PSI, predictive summary index) (Linn, Grunau, 2006) соответственно. Вероятностные интерпретации показателей эффективности теста Показатели PPV и NPV (а также производный от них показатель RR) имеют очевидную и практически важную интерпретацию — это условные вероятности развития заболевания при носительстве или отсутствии маркера. Прогностическая ценность двойственных показателей по столбцам (SE и SP) представляется менее очевидной. В этой связи рассмотрим несколько возможных вероятностных интерпретаций показателей, связанных с . При анализе эффективности количественных маркеров успешно используется зависимость SE от 1 — SP (ROC-кривая). Площадь под этой кривой (AUC — Area Under Curve) равна вероятности того, что у случайно выбранного субъекта с болезнью значение мерного признака будет выше, чем у случайно выбранного субъекта без данной болезни (Fawcett, 2006). Для бинарного маркера ROC-кривая является кусочно-линейной (рис. 1), при этом соответствующая площадь равна . Отметим также, что в работах, посвященных алгоритмам поиска межлокусных взаимодействий, показатель (SE + SP)/2 называют «балансовой точностью» (balanced accuracy, BA) (см., например, Winham et al., 2010). В отношении показателя (SE + SP)/2 справедливо следующее Утверждение 1. Пусть при тестировании одного больного и одного здорового индивидуума идентификация больного осуществляется следующим образом: больным объявляется носитель маркера, если результаты тестирования не совпадают, и больной выбирается случайно при совпадении результатов тестирования. Тогда вероятность правильной идентификации больного равна AUC = (SE + SP)/2. Доказательство. Искомая вероятность равна Утверждение доказано. Таким образом, величина равна относительной добавке к вероятности 0,5 (случайное угадывание). В ROC-анализе принято считать, что маркер является хорошим классификатором при AUC > 0,7 и безусловно плохим при AUC < 0,6 (Swets, 1988). Утверждение 1 допускает следующее обобщение, которое предлагает интерпретацию показателя LR = SE/(1 − SP). Утверждение 2. Пусть в группе из n человек имеются один больной и (n − 1) здоровых индивидуумов. Для обнаружения больного тестируются все члены группы, и если среди них обнаруживаются k носителей маркера, то выбор больного среди них осуществляется случайным образом с вероятность 1/k. Тогда вероятность правильной идентификации больного при тестировании группы равна . Иными словами, применение теста к группе из n лиц увеличивает вероятность обнаружения больного в LR раз по сравнению со случайным угадыванием (которое возможно с вероятностью 1/n). Доказательство. Искомая вероятность равна . Утверждение доказано. При n = 2 имеем формулу из Утверждения 1. Широкое распространение получили показатели обратные к и в качестве оценок среднего числа тестов, проведенных до первого правильного срабатывания маркера. Этот подход заимствован из работ, оценивающих эффективность терапевтических методов, которые, как правило, являются когортными исследованиями (в качестве маркера М выступает терапия Т). В этих работах часто используется показатель , который оценивает минимальную численность группы прошедших терапию, при которой число излеченных на одного больше, чем в такой же контрольной группе (Number Needed to Treat — число подлежащих воздействию). По аналогии для оценки эффективности использования маркеров различными авторами были предложены (см., Anonymous, 1996 и обсуждение: например, Mitchell, 2009 a, b): число подлежащих диагностированию (Number Needed to Diagnose) для исследований по схеме «случаи—контроль» ; число субъектов, необходимое для предсказания (Number Needed to Predict) для когортных исследований . При этом величину NND часто интерпретируют как среднюю численность выборки, которую необходимо протестировать, для обнаружения одного больного (Mitchell, 2009 a, b). Другие авторы полагают, что NND — это среднее число тестирований до момента любого правильного срабатывания теста (правильная идентификация больного или здорового) (Linn, Grunau, 2006). Нам представляется, что обе интерпретации ошибочны. Контрпример дает матрица Р вида . В этом случае SE = 0,01 и SP = 1 (все носители маркера больны). Тогда NDD = 100, хотя для обнаружения больного при помощи маркера нужно в среднем провести 1/pM = 106 тестов. При этом доля случаев правильного срабатывания теста практически равна единице (ACC = 0,999901). В отношении показателя можно утверждать лишь следующее. Пусть в единицу времени на носительство маркера проверяются один больной и один здоровый человек. Тогда среднее время ожидания события «число носителей маркера среди больных больше, чем среди здоровых» равно = (SE + SP − 1)−1. При этом вероятность того, что в выборке больных число носителей маркера всегда больше, чем в выборке здоровых равна SE + SP − 1. Аналогично, при рассмотрении растущей выборки носителей маркера среднее время ожидания события «число больных среди носителей маркера выше, чем среди свободных от маркера» равно . Зависимость показателей эффективности от распространенности заболевания и популяционной частоты маркера Современные базы данных позволяют получать априорную информацию о частотах встречаемости возможных генов-маркеров (pM) наряду с данными о распространенности изучаемого заболевания (pD). В поисковых ассоциативных исследованиях прогностическая эффективность генетического теста будет существенно зависеть от популяционной частоты выбранного для исследования маркера. В этой связи необходимо четко представлять характер зависимости всех показателей эффективности теста от pM и pD при различных уровнях ассоциирования (значениях OR). В этом разделе мы приведем сводку формул, описывающих зависимость показателей эффективности бинарного теста от трех независимых параметров: OR, pM и pD. Начнем с вычисления ключевого показателя . Величина ∆ вычисляется из определения OR: , откуда (4) где . Из вида выражения (4) ясно,что . Формуле для ∆ можно также придать вид , где, и . Напомним, что мы всюду рассматривает случай ∆ ≥ 0, в котором всегда OR ≥ 1. При ∆ < 0 выражение для ∆max имеет вид: . В популяционной генетике величина ∆ именуется «неравновесием по сцеплению», а ∆' «приведенным неравновесием по сцеплению» (Lewontin, Kojima, 1960; Slatkin, 2008). Отметим, что при pD < pM величина ∆' совпадает с так называемым «популяционным атрибутивным риском» (PAR), который определяется (Levin, 1953) как . Выражения для r и ∆ имеют достаточно громоздкий вид. В этой связи в таблице 2 мы приводим точные формулы для тотальных и условных показателей вместе с аппроксимациями для трех случаев: OR → 1, pD → 0 и pM → 0. Таблица позволяет быстро оценивать прогностические возможности теста в крайних ситуациях. Например, при очень низкой распространенности заболевания (pD → 0) показатель PPV приблизительно равен . Это означает, что в случае редких заболеваний даже для очень «хорошего маркера» показатель PPV заведомо мал. Например, при pD = 10–4 и OR = 100 вероятность заболевания при носительстве маркера не превышает 1 %. При σDσM (OR – 1) < 0,5 хорошее приближение для ∆ дает формула: , (5) где, , , — доля «правильных тестирований» в отсутствие ассоциации. В этом приближении хорошо видна структура показателей эффективности маркера: ; . В любом случае всегда справедливы неравенства , где — правая часть равенства (5). Далее мы дадим качественное описание зависимостей показателей эффективности теста от распространенности заболевания и популяционной частоты маркера. Общий вид этих зависимостей показан на рисунках 2 и 3. Все условные показатели приведены за вычетом значений, характеризующих случай независимых M и D. Ясно, что во всех случаях зависимости для условных показателей представляет одна и та же поверхность, которая от рисунка к рисунку отражается и поворачивается на 90°. Качественная картина такова. Чувствительность теста слабо зависит от распространенности заболевания (монотонно убывает), но критично зависит от частоты встречаемости маркера (ярко выраженный максимум для редких заболеваний). Специфичность теста слабо зависит от распространенности заболевания (монотонно возрастает), но критично зависит от частоты встречаемости маркера для широко распространенных заболеваний (выраженный максимум). В отношении показателей PPV и NPV картина симметрично воспроизводится при замене местами . Аналогичные зависимости для средних показателей эффективности и представлены на рисунке 3. Показатель bM|D слабо зависит от распространенности заболевания, но имеет максимум как функция частоты маркера. Напротив, показатель bD|M слабо зависит от частоты маркера, но имеет максимум как функция распространенности заболевания. На обоих рисунках гребень волны параллелен горизонтальной плоскости и расположен на высоте . Отметим, что max bM|D = max bD|M и совпадает с коэффициентом взаимосвязанности Юла (Yule's coefficient of colligation) (Yule, 1912). Следующее утверждение частично воспроизводилось многими авторами (см., например, King, Zeng, 2002). Утверждение 3. При фиксированном OR максимально возможные значения средних показателей эффективности bM|D и bD|M равны Для достижения максимума необходимо выполнение соотношения Доказательство. Общеизвестно тождество . Из соображений симметрии ясно, что максимум величины достигается при SE = SP. Откуда , а искомый максимум равен . Аналогично максимум величины достигается при и равен . Величина максимума не зависит от pM и pD (рис. 2). При этом max bM|D достигается при , а max bM|D при . Утверждение доказано. Случай OR >> 1 Предельное поведение показателей эффективности маркера из таблицы 1 при OR → ∞ существенно зависит от соотношения между частотами встречаемости маркера и распространенности заболевания. Возможны две альтернативные ситуации, которые представлены в табл. 3. Из таблицы, в частности, следует, что высокое значение OR и высокая статистическая значимость эффекта не всегда указывают на прогностическую эффективность маркера. Так при OR → ∞ и pM >> pD показатель диагностической эффективности bD|M = PPV = pD / pM < 1, т. е. может быть сколь угодно мал по абсолютной величине. В противоположной ситуации (pM << pD) при OR → ∞ заведомо малы чувствительность теста и соответствующий показатель классификационной эффективности: Маркеры-классификаторы и маркеры-диагносты Для ситуаций, представленных в таблице 3 и 4, имеет смысл ввести специальные термины, отражающие специфику маркера. При высокой частоте встречаемости маркера (pM >> pD) и OR >> 1 имеем высокую чувствительность и высокую классификационную эффективность bM|D, но низкую диагностическую значимость теста (PPV ≈ pD /pM). Маркер рационально использовать для массового скрининга и профессионального отбора. По результатам тестирования можно отобрать группу заведомо здоровых людей (свободных от маркера). При этом для носителей маркера вероятность развития заболевания будет достаточно мала. По этой причине данную ситуацию можно обозначить как «маркер — классификатор». Типичным «маркером — классификатором» является маммография: pM = 0,04 >> pD = 0,006 при OR = 200, и bM|D = 0,84. Тем не менее, вероятность наличия заболевания при положительных результатах тестирования достаточно низка — PPV = 0,14 и bD|M = 0,139 (Banks E. et al. 2004). Напротив, в случае редких маркеров (pM << pD) нет смысла проводить массовый скрининг — результаты будут заведомо «нулевые». Однако высокая диагностическая ценность теста bD|M при OR >> 1 позволяет его использовать в клинической практике при наличии дополнительных симптомов и показаний, например в случае неблагоприятной родословной. Подобный маркер можно назвать «маркером–диагностом». Пример «маркера–диагноста» демонстрируют данные по ассоциации полиморфизма Leiden V Arg506Gln с тромбозом вен (Folsom A. et al., 2002): pM = 0,07 << pD = 0,32 при OR = 3,7. Диагностическая ценность теста достаточно высока — PPV = 0,61 и bD|M = 0,31. Однако как классификатор его использовать затруднительно: bM|D = 0,10 из-за низкой чувствительности (SE = 0,14). Формулы для исследований «случаи–контроли» Как известно в исследованиях «случаи–контроли» невозможно напрямую оценить абсолютные (PPV, NPV) и относительные (RR) риски развития заболевания при наличии или отсутствии маркера. Однако с практической точки зрения часто именно эти оценки представляют наибольший интерес. Многие авторы предлагали для RR приблизительную формулу (Zhang, Yu, 1998; Sistrom, Garvan, 2004). Легко видеть, что это есть точная нижняя оценка для RR. Точнее говоря, справедлива следующая цепочка неравенств , в которой левая и правая границы для RR соответствуют случаям pM = 0 и pM = 1 соответственно (рис. 4). В принципе для полной реконструкции матрицы Р необходимы три независимых показателя. Исследование по схеме «случаи–контроли» обеспечивает два из них: SE и SP. Третьим может быть распространенность заболевания (pD), либо популяционная встречаемость маркера (pМ). В таблице 5 приведены оба типа оценок. Выбор между ними осуществляется в зависимости от того, какой из этих двух показателей мы считаем достоверно известным. В любом случае перед использованием формул из таблицы 4 необходимо проверить неравенство SE > pM > 1 − SP, а также выполнение тождества: . (6) Интересно, что при наличии априорной информации о популяционной частоте встречаемости маркера для оценки относительного риска достаточно знать лишь частоту носителей маркера у больных: RR = (1 − pM) × SE/(pM × (1 − SE)). Заключение Приведенные формулы позволяют оценить значения OR и частоты встречаемости маркера, гарантирующие высокую (или низкую) прогностическую эффективность соответствующего теста. В первую очередь следует выделить следующие три утверждения. 1. При OR < 2,2 маркер обладает заведомо низкой прогностической эффективностью во всех смыслах и при любых частотах встречаемости заболевания и маркера. 2. Маркер может быть хорошим классификатором, если OR > 5,4, при условии, что его популяционная частота достаточно высока (pM > 0,3). На практике это означает, что указанным неравенствам должны удовлетворять нижние границы 100 (1 – α) %-го доверительного интервала для оцениваемого значения ORL, т. е. ORL < 2,2 в первом случае и ORL > 5,4 — во втором случае. Ранее близкие значения критических уровней наблюдаемых эффектов предлагались для относительных рисков (RR < 2 и RR > 5) (Ioannidis, 2006). 3. Даже при очень больших OR маркер является заведомо плохим классификатором (AUC < 0,6), если его популяционная частота низка (pM < 0,2 pD). Аналогично, в силу неравенства практически всякий маркер очень редкого заболевания обречен быть плохим диагностом. Действительно, из Утверждения 3 имеем . Тогда, исходя из определения «плохого классификатора» (AUC < 0,6), получим OR < 2,25. В этом случае оба условных показателя средней эффективности (bM|D и bD|M) и коэффициент корреляции (r) заведомо меньше . Далее, исходя из требования AUC > 0,7, получим OR > 5,44. При этом согласно Утверждению 3 максимум bM|D (а значит и AUC) достигается при . Отметим также, что случай AUC > 0,8 возможен лишь при OR > 16 и pM > 0,2. Третье утверждение вытекает из формул, приведенных в таблице 3. При OR >> 1 и pM < pD маркер является плохим классификатором, если , или pM < 0,2 pD . Итогом этого обсуждения является достаточно грустный вывод о низкой прогностической и классификационной эффективности результатов большинства опубликованных ассоциативных генетических исследований. Как правило, эти результаты укладываются в ситуацию из пункта 1, и не могут непосредственно использоваться в клинической практике. Тем не менее устойчиво воспроизводящиеся ассоциации даже при небольших OR могут указывать на участие определенных генов в становлении патологии, давая тем самым принципиально новую информацию о молекулярных механизмах заболевания. Что же следует вычислять в случае редких удач — когда в исследовании по схеме «случаи-контроли» обнаруживается статистически высоко значимая ассоциация с высоким отношением шансов, например, OR > 6? Нам представляется, что, прежде всего, следует проверить полученные оценки SE и SP на согласованность с априорными данными по pM и pD . Процедура проверки подразумевает два момента. 1) Проверка pM (1 − SP, SE), т. е. принадлежности среднестатистических оценок популяционной частоты гена-маркера для данного этноса интервалу (1 − SP, SE), полученному в эксперименте. 2) Проверка оценки , а именно ее соответствия общепринятым представлениям о распространенности данного заболевания. Сильные отклонения от соотношения (6), подобно отклонениям от закона Харди–Вайнберга, могут указывать на ошибки генотипирования и/или идентификации фенотипа — заболевания. Возможны также эффекты, связанные с неоднородностью выборки. При удовлетворительном выполнении тождества (6) можно вычислить косвенные оценки RR, PPV и NPV согласно формулам из таблице 5. В результате будут получены оценки для обоих регрессионных коэффициентов, которые характеризуют прогностические возможности маркера. В целом, думается, что генетический маркер не безнадежен как классификатор, если bM|D > 0,4, и как диагност, если b D|M> 0,4. При этом редкий маркер может выступать только в качестве маркера–диагноста, и то лишь в случае широко распространенных заболеваний. Все эти оценки будут иметь лишь предварительный характер. Очевидно, что всякую обнаруженную ассоциацию следует неоднократно верифицировать на независимых выборках. Кроме того, крайне желателен статистический анализ родословных, например в виде TDT-исследований (Spielman, 1994).

About the authors

Aleksandr Vladimirovich Rubanovich

Vavilov Institute of General Genetics RAS

Email: rubanovich@vigg.ru
Head of Lab of ecological genetic

Nikita Nikolayevich Khromov-Borisov

Saint-Petersburg State I. P. Pavlov Medical University

Email: Nikita.KhromovBorisov@gmail.com
ssociate professor, Department of Physics, Mathematics and Informatics

References

Aly M., Wiklun F., Xu J. et al., 2011. Polygenic risk score improves prostate cancer risk prediction: results from the Stockholm-1 cohort study // European Urology. Vol. 60. P. 21–28.
Anonymous, 1996. How good is the test // Bandolier Journal. N 27. P. 2. http://www.medicine.ox.ac.uk/bandolier/painres/download/Bando027.pdf http://www.medicine.ox.ac.uk/bandolier/band27/b27–2.html.
Banks E., Reeves G., Beral V. et. al., 2004. Influence of personal characteristics of individual women on sensitivity and specificity of mammography in the Million Women Study: cohort study // BMJ. Vol. 329. N. 7464. P. 477–479.
Bjartell A., 2011. Genetic markers and the risk of developing prostate cancer // European Urology. Vol. 60. P. 29–31.
Bossuyt P., 2010. Clinical validity: Defining biomarker performance // Scandinavian Journal of Clinical & Laboratory Investigation. 70. P. 46–52
Cohen J., 1960. A coefficient of agreement for nominal scales // Educational and Psychological Measurement. Vol. 20. P. 37–46.
Fawcett T., 2006. An introduction to ROC analysis //Pattern Recognition Letters. Vol. 27. P. 861–874.
Folsom A., Cushman M., Tsai M. et al., 2002. A prospective study of venous thromboembolism in relation to factor V Leiden and related factors // Blood. Vol. 99. N. 9. P. 2720–2725.
Ioannidis J., 2006. Commentary: Grading the credibility of molecular evidence for complex diseases //International Journal of Epidemiology. Vol. 35. P. 572–577.
Jakobsdottir J., Gorin M. B., Conley Y. P. et al., 2009. Interpretation of genetic association studies: markers with replicated highly significant odds ratios may be poor classifiers // PLoS Genet. Vol. 5. N 2. e1000337.
King G., Zeng L., 2002. Estimating risk and rate levels, ratios, and differences in case-control studies // Statistics in Medicine. Vol. 21. P. 1409–1427.
Kraft P., Wacholder S., Cornelis M. C. et al., 2009. Beyond odds ratios — communicating disease risk based on genetic profiles // Nature Reviews Genetics. Vol. 10. P. 264–269.
Kraemer H. C., Frank E., Kupfer D. J., 2011. How to assess the clinical impact of treatments on patients, rather than the statistical impact of treatments on measures // International Journal of Methods Psychiatric Research. Vol. 20. P. 63–72.
Landis J. R., Koch G. G., 1977. The measurement of observer agreement for categorical data // Biometrics. Vol. 33. P. 159–174.
Levin M. L., 1953. The occurrence of lung cancer in man // Acta Union International Contra Cancrum. Vol. 9. P. 531–541.
Lewontin R. C., Kojima K., 1960. The evolutionary dynamics of complex polymorphisms // Evolution. Vol. 14. P. 458–472.
Linn S., Grunau P. D., 2006. New patient-oriented summary measure of net total gain in certainty for dichotomous diagnostic tests // Epidemiologic Perspectives & Innovations. Vol. 3: 11. http://www.epi-perspectives.com/content/3/1/11.
Mitchell A., 2009a. How To: Implement a Screening Programme for Distress in Cancer Settings // Psycho-oncology.info. — Guide # 101. http://www.psycho-oncology.info/PG_implement_ajmitchell.pdf.
Mitchell A., 2009b. How To: Analyse a Screening or Diagnostic Study // Psycho-oncology.info. — Guide # 104. http://www.psycho-oncology.info/PG_analyse_ajmitchell.pdf.
Pepe M. S., Gu J. W., Morris D. E., 2010. The potential of genes and other markers to inform about risk // Cancer Epidemiology, Biomarkers & Prevention. Vol. 19. P. 655–665.
Poste G., 2011. Bring on the biomarkers // Nature. Vol. 469. P. 156–157.
Sistrom C. L., Garvan C. W., 2004. Proportions, odds, and risk // Radiology. Vol. 230. P. 12–19.
Slatkin M., 2008. Linkage disequilibrium — understanding the evolutionary past and mapping the medical future // Nature Reviews Genetics. Vol. 9. P. 477–485.
Spielman R. S., McGinnis R. E., Ewens W. J., 1994. Letter to the Editor: The transmission/disequilibrium test detects cosegregation and linkage // American Journal of Human Genetics Vol. 54. P. 559–560.
Swets J. A., 1988. Measuring the accuracy of diagnostic systems // Science. Vol. 240. P. 1285–1293.
Tan P. N., Kumar V., Srivastava J., 2004. Selecting the right objective measure for association analysis //Information Systems. Vol. 29. P. 293–313.
Winham S. J., Slater A. J., Motsinger-Reif A. A., 2010. A comparison of internal validation techniques for multifactor dimensionality reduction // BMC Bioinformatics. Vol. 11:394. http://www.biomedcentral.com/1471–2105/11/394
Youden W. J., 1950. Index for rating diagnostic tests //Cancer. Vol. 3. P. 32–35.
Yule G. U., 1912. On the methods of measuring association between two attributes // Journal of the Royal Statistical Society. Vol. 75. P. 579–652.
Zhang J., Yu K. F., 1998. What’s the relative risk? A method of correcting the odds ratio in cohort studies of common outcomes // JAMA. Vol. 280. P. 1690–1691.

Supplementary files

Supplementary Files

Action

1. JATS XML

Download

Username
Password
Remember me

Forgot password?	Register

Username
Password
Remember me

Forgot password?	Register

Theoretical analysis of the predictability indices of the binary genetic tests

Full Text

Abstract

Keywords

Full Text

About the authors

Aleksandr Vladimirovich Rubanovich

Nikita Nikolayevich Khromov-Borisov

References

Supplementary files

This website uses cookies