ФУНКЦИОНАЛ ОЖИДАЕМОЙ ПОЛЕЗНОСТИ: ПРИНЦИПЫ МОДЕЛИРОВАНИЯ И ПРАКТИЧЕСКОГО ПРИМЕНЕНИЯ


Цитировать

Полный текст

Аннотация

Рассматриваются принципы и перспективы практического применения функционала ожидаемой полезности при управлении сложными системами организационно-технического типа.

Полный текст

Введение Конвергенция теорий риска и ожидаемой полезности с теориями знаний и сложных систем (СС) открывает возможности расширенного применения новых информационных технологий в практических целях [1-3]. Под конвергенцией (от лат. convergere - приближаться, сходиться) будем понимать развитие указанных теорий по пути сближения и приобретения общих или сходных признаков; примером новых информационных технологий является метод статистического имитационного моделирования (СИМ) по версии Димова-Маслова (МДМ) [4-5], включающий методы сценариев и функционально-стоимостного анализ [6], а также использующий компьютерную технологию метода Монте-Карло (ММК). Стимулом для указанной конвергенции являются синергетические эффекты, многократно увеличивающие ценность перечисленных СС знаний. В практическом плане версия МДМ ориентирована на повышение эффективности функционирования СС путем оперативного управления ее характеристиками [1-4]. Цель статьи - анализ критериев, предназначенных для использования при управлении СС организационно-технического типа, которые могут быть получены в рамках теорий риска и ожидаемой полезности. Область применения теорий риска и ожидаемой полезности В приложениях теорий риска и ожидаемой полезности для оценки неопределенности используются «линейные» критерии риска типа RS = P(A) АS, где P(A) - вероятность результата А работы СС; АS - его полезность (стоимость рискового выигрыша или проигрыша, в денежных или любых других единицах). Если воспользоваться методом сценариев [6], то можно просчитать значения АS для каждого сценария с помощью метода функционально-стоимостного анализа (по максимуму, по минимуму, в среднем), а также дать оценку вероятности реализации каждого сценария P(A) при помощи интерсубъективных экспертных методов, отражающих согласованное предпочтение (групповое мнение) лиц, принимающих решения (ЛПР) в рамках принятой онтологической модели ситуации (ОМС) [7]. Отметим, что неопределенность не означает отсутствие информации об СС - речь идет о неполноте, неточности, неадекватности имеющихся сведений [8]. Механизм уменьшения этой неопределенности может быть линейным, нелинейным, аддитивным, синергетическим - чтобы правильно воспользоваться им, нужно знать специфику каждой рассматриваемой СС, а также учитывать субъективный «человеческий фактор». Последнее объясняется тем, что роль личности при проведении такого рода исследований достаточно велика. Это касается и методики сбора и обработки первичной информации, и выбора способов представления и критериев оценки конечных данных, и тем более - форм их последующего применения. Но если полученные данные остаются неопределенными по своей физической сути, использовать их в точных математических формулах все равно бесполезно - это будут «обман и пустая трата времени» [9]. Поэтому СИМ по МДМ уделяет особое внимание особенностям поведения ЛПР (менеджеров, операторов, клиентов, партнеров, конкурентов и т.п.) корпорации. Принимаемые решения считаются результатом упорядоченного (поддающегося структурированию и формализации) процесса мышления разумных людей, априори вводятся предположения о характере их действий в виде аксиом рационального поведения. На основе указанных аксиом (наиболее важными из них являются аксиомы транзитивности, безразличия, независимости и рациональности) Дж. фон Нейманом и О. Моргенштерном в 1947 г. была сформулирована и доказана теорема о существовании функции полезности, определяющей действия ЛПР [10]. Полезностью при этом была названа некая условная (воображаемая) величина, которую в процессе выбора максимизируют ЛПР с упомянутым рациональным мышлением - своего рода мера психологической и потребительской ценности для них различного рода реальных и виртуальных благ. Теория объективной ожидаемой полезности предполагает, что в процессе принятия решений рационально мыслящий ЛПР «взвешивает» различные альтернативы и выбирает из них ту, полезность которой максимальна. Функционал объективной полезности (ФОП) фон Неймана-Моргенштерна для N-мерной альтернативы имеет вид , (1) где - вероятность n-го возможного результата, имеющего для ЛПР объективную ценность (стоимость) ; n[1; N]. Считается, что рациональный человек при выборе решения должен руководствоваться правилом . Однако почти одновременно Л. Сэвиджем было предложено правило, положившее начало теории субъективной ожидаемой полезности [11], в рамках которой ФОП представляет собой , (2) где - оценка вероятности n-го возможного результата экспертом , которая имеет для него ценность . В данном случае разные ЛПР могут делать разный выбор из одинаковых альтернатив, руководствуясь субъективными соображениями (которые зависят от их личных качеств, знаний, опыта, предпочтений, предубеждений и т.п.), причем каждый эксперт вправе руководствоваться собственным правилом и выработка группового решения требует от ЛПР коллективных усилий в рамках сложившейся ОМС [7]. Если ЛПР договорятся между собой и придут к согласию относительно совместных оценок и правил сотрудничества, то = ; = (3) и значения обоих ФОП будут одинаковыми. Возможность для этого создает понимание всеми ЛПР, что объективно существуют и управляют их решениями общие для них эвристики (от греч. heurisko - нахожу, в данном случае - совокупности логических приемов и методических правил), которые определяют закономерности отклонения поведения реальных ЛПР от поведения рационального человека. К числу таких эвристик относятся суждения по представительности, по встречаемости, по точке отсчета, а также «сверхдоверие» личному опыту и стремление исключить риск [11]. В то же время какими-либо конкретными рекомендациями по составу и структуре ФОП теории риска и ожидаемой полезности не располагают - настоящая статья призвана уменьшить этот пробел. Функционал ожидаемой полезности Рассмотрим случай, когда приемлемый риск минимизирует потери (затраты) для рассматриваемого объекта (организации, фирмы, физического лица и т.д.), связанные с достижением поставленной цели в корпоративной СС организационно-технического (холонического) типа [6]. Пусть ЛПР Sn , принадлежащий совокупности n [1; N], рассматривает K вариантов своих действий (сценариев развития событий), направленных на достижение указанной цели как некого важного для него позитивного эффекта (выигрыша) Fk , который может быть им лично достигнут с вероятностью pF при затратах, равных Gk , которые могут быть лично им обеспечены с вероятностью pG. Значение pF также учитывает меру правильности прогноза Sn получить на выходе проекта по k-му сценарию выигрыш Fk , а значение pG - шансы ЛПР собрать ресурс Gk, необходимый для начала выполнения проекта. Субъект Sn также учитывает, что k-ый сценарий приводит к достижению цели не гарантированно, а с вероятностью pk , которая характеризует некие объективные (зависящие не только от него лично, как внешние, так и внутренние) обстоятельства: например, в виде согласования и утверждения проекта в вышестоящих инстанциях и т.п. Тогда в качестве критерия эффективности k-го сценария ЛПР может быть выбрана расчетная величина Qk = pk (pF Fk - pG Gk ), (4) где k [1; K], которая и является в данном случае прогнозируемой и допустимой (по его мнению) мерой риска. В наиболее общем плане - при проведении СИМ по МДМ произвольной СС организационно-технического типа - значение Qk будем считать некоторой конкретной полезностью рассматриваемого проекта: понимая под Fk предполагаемый «доход», а под Gk - «расходы», связанные с реализацией k-го сценария. Тогда, следуя логике и терминологии фон-Неймана - Моргенштерна и Сэвиджа, Qk также можно именовать ФОП, который в данном случае является случайным функционалом - поскольку в его состав входят вероятности pk ; pF и pG . … … … … … … … … … … Рис. 1. К выбору оптимального сценария действий ЛПР Sn по критерию ФОП Отметим, что предельно простой по составу («доходы» минус «расходы»), ФОП (1) отличается достаточно сложной комплексной (объективной и субъективной, детерминированной и стохастической, статической и динамической и т.д.) структурой, где ключевым элементом является Gk - так как при отсутствии необходимых ресурсов о его реализации речи быть не может. При анализе ФОП необходимо рассмотреть и промоделировать следующие связи: - Gk и pG, на предмет того, есть ли возможность собрать нужные ресурсы, как уже было сказано, хотя бы для начала проекта; - Gk и Fk , поскольку ЛПР надо знать, «стоит ли игра свеч»: для этого можно рассмотреть некий соответствующий исходным параметрам G0 и F0 начальный вариант («нулевой», базовый, бесприбыльный и т.п. сценарий), принимаемый за условную точку отсчета, относительно которой будет реализована дальнейшая стратегия «синтеза через анализ» рассматриваемой СС при помощи СИМ по МДМ; - Gk и pF , так как, не собрав необходимые ресурсы и не имея под них гарантий, нельзя начинать проект: успех может быть неприемлемо маловероятным и получить выигрыш Fk от его реализации вряд ли удастся; - Gk и pk , в силу того, что получить разрешение «сверху» (в форме утверждения плана действий ЛПР в надсистеме) на реализацию проекта без необходимых ресурсов тоже вряд ли возможно; - Fk и pk , поскольку указанное разрешение «сверху» без весомого стимула в виде реальной возможности выигрыша Fk также обеспечить трудно; - pk и pG ; pF - если считать, что вероятность начала проекта обусловлена перспективой получения необходимых ресурсов и возможностью достижения цели в виде выигрыша Fk. Схема выбора оптимального (наилучшего из рассматриваемых вариантов) сценария по критерию Qopt = MAX (Qk) показана на рис. 1. Вероятность одобрения k-го сценария в рамках предложенной в [4] экспоненциальной модели Qk примем равной pk = 1 - exp (- pG pF Gk Fk / G0 F0), (5) так как чем больше значения «позитивных» рисков pG Gk / G0 получения ресурса и pF Fk / F0 успешного достижения поставленной цели по сравнению с базовым сценарием, тем больше вероятность выбора и утверждения данного варианта реализации проекта. Отметим, что как при pG Gk / G0 >> 1, так и при pF Fk / F0 >> 1, здесь имеет место p ≈ 1, тогда как при pG Gk / G0 << 1 или pF Fk / F0 << 1, напротив, pk ≈ 0, что также соответствует условиям моделирования СС. Данная часть процесса формирования ФОП отражает его объективную сторону, поскольку все вероятности здесь выступают в роли формальных коэффициентов (неизвестных ЛПР в настоящее время), а ресурсы и предполагаемые выигрыши могут быть определены детерминированными способами. Субъективность ФОП проявляет себя при устранении неопределенностей путем конкретизации значений pG и pF , что на практике может быть сделано лишь с помощью эвристических (экспертных) методов группой привлеченных ЛПР. Поскольку, согласно схеме рис. 1, выбор вероятностей pG и pF предваряет оценку связанных с ними значений Gk и Fk , от «правильности» действий экспертов здесь непосредственным образом зависит исход СИМ. Отметим, что теоремы и леммы классической теории вероятностей в рамках концепции «риск как неопределенность» не всегда подходят к рассматриваемой ситуации, где более продуктивной является концепция «риск как возможность». Анализ состава и структуры ФОП Важной частью анализа ФОП является исследование связи между ресурсом Gk и ожидаемым выигрышем Fk - для решения данной задачи представим ресурс и выигрыш как Gk = G0 + ΔGk; Fk = F0 + ΔFk , (6) после чего запишем (1) в следующем приближенном виде: Qk ≈ pk0 [ pF0 (F0 + ΔFk) - pG0 (G0 + ΔGk )], (7) где принято, что рk ≈ pk0 ; рF ≈ pF0 ; рG ≈ pG0 , что, строго говоря, справедливо при Gk >> G0. Перегруппировав слагаемые в правой части (4), получим Qk = Q0 + Δ Qk , (8) где Q0 = pk0 ( pF0 F0 - pG0 G0) ≈ 0 - наш условный «ноль», то есть выигрыш, соответствующий базовому сценарию, а также ΔQk = pk0 ( pF0 ΔFk - pG0 ΔGk ), (9) откуда при pF0 = pG0 и p0 = pk0 pG0 следует ΔQk = p0 ΔGk (ΔFk / ΔGk - 1) ≈ p0 ΔGk (dFk /dGk - 1). (10) Таким образом, в первом приближении связь между Gk и Fk определяется производной dFk /dGk : если dFk /dGk ≤ 1, рассматриваемый k-ый вариант не имеет преимуществ перед базовым сценарием, в то же время наилучшим следует считать вариант, при котором dFk /dGk = MAX. Данный момент формализации ФОП представляется существенным, поскольку позволяет сформировать критерий при проведении СИМ по МДМ, «понятный» не только ЛПР, но и компьютеру. Отметим, что условия рk ≈ pk0 ; рF ≈ pF0; рG ≈ pG0 и pF0 = pG0 не представляются жесткими ограничениями, поскольку данные вероятностные коэффициенты все равно задаются, а впоследствии уточняются эвристическими экспертными методами, которые не могут давать точные (однозначные и надежно достоверные) результаты. Подставим (5) в (4) и сформируем ФОП в итоговом виде, пригодном для проведения СИМ по МДМ: Qk = [1 - exp (- pG pF Gk Fk / G0 F0)] × × (pF Fk - pG Gk). (11) При дальнейшем анализе ФОП возникают два вопроса: во-первых, существует ли сценарий, при котором в (11) достигается оптимум Qopt ; во-вторых, какими в таком случае должен быть ресурс Gopt по сравнению с G0, который необходим для получения базового выигрыша F0. Ответ на эти вопросы был дан в [6], где показано, что Gopt ≈ F0 /2, (12) то есть, во-первых, искомый оптимум существует (в частном случае он может соответствовать и базовому сценарию), во-вторых, при наиболее целесообразном сценарии затраты на него должны составлять примерно половину прогнозируемого выигрыша. Подставив (12) в (11), получаем Qopt = [1 - exp (-F0 /2 G0)] F0 /2 . (13) Таким образом, согласно (12)-(13), приступая к выполнению проекта, ЛПР Sn должен исходить из того, что выигрыш (в денежном выражении - выгода, прибыль) будет как минимум вдвое превышать расходы, связанные с реализацией наилучшего (но возможно и наиболее дорогостоящего) сценария. Особенности разных подходов к анализу ФОП Важное практическое значение имеет вопрос о том, в каких случаях наиболее целесообразен объективный поход к анализу ФОП, а в каких случаях - субъективный. Ясно, что на первый план здесь выходит специфика решаемой задачи и ее конкретные исходные условия, которые определяют, с каким «видом» неопределенности знаний и, соответственно, с какой вероятностью (объективной или субъективной), моделирующей эту неопределенность, ЛПР имеет дело в рассматриваемой ситуации. Поясним сказанное на двух примерах из теории игр - максимально простых и универсальных. Выбирая «вслепую» карту из колоды и пытаясь установить, какая это карта по своим параметрам, мы «работаем» с объективной вероятностью - поскольку принадлежащая данной колоде игральная карта существует сама по себе, независимо от нашего сознания, и мы до определенного времени просто не знаем, какая она, но хотим оценить последствия этого незнания при разных вариантах развития событий. Переводя ситуацию в область оценки ФОП, можно, по аналогии, утверждать, что в природе уже имеется некий готовый вариант его реализации согласно (1), устраивающий нас в наибольшей мере, однако мы не знаем точно, какой это вариант, и хотели бы приблизиться к нему, используя объективный вероятностный подход. Субъективная вероятность соответствует совету «лошадью ходи» в знаменитой кинокомедии, когда игрок сам определяет будущую ситуацию, и она непосредственным образом зависит от познавательной активности, опыта и профессиональной подготовки - то есть от объема и качества аксиологических знаний ЛПР, а также от стечения обстоятельств. Понятие неопределенности знаний в данном случае представляется существенно более богатым и разнообразным, но с большим трудом поддающимся управлению извне - поскольку не каждого ЛПР можно убедить или заставить действовать против его личной воли. Ограничимся здесь замечанием, что преодоление неопределенности знаний в процессе формирования ОМС на основе субъективного вероятностного подхода и соответствующее ему определение ФОП согласно (2) требуют от ЛПР значительных совместных усилий. Заключение Опыт показывает, что поведение и развитие СС в целом ряде случаев не подчиняется известным ЛПР закономерностям, идет по непредсказуемым для них сценариям и незапланированным путем [12]. В этой ситуации, с одной стороны, трудно воспользоваться критерием ФОП [10-11] непосредственно в виде (1)-(2), но с другой стороны - также трудно представить себе более подходящий по своим возможностям и характеристикам способ поддержки действий ЛПР, чем СИМ по МДМ [1-4]. Это объясняется тем, что присущие сведениям об исследуемых СС неточности и неадекватности, возможные ошибки и неизбежные погрешности, а также любые другие неопределенности, воздействующие в качестве случайных факторов на результаты СИМ, можно не только учесть при помощи технологии ММК, но и определить степень их негативного влияния на качество принимаемых решений - с тем, чтобы скорректировать его до приемлемых пределов.
×

Об авторах

Олег Николаевич Маслов

Поволжский государственный университет телекоммуникаций и информатики

Email: maslov@psati.ru

Маргарита Александровна Фролова

Поволжский государственный университет телекоммуникаций и информатики

Список литературы

  1. Димов Э.М., Маслов О.Н., Пчеляков С.Н., Скворцов А.Б. Новые информационные технологии: подготовка кадров и обучение персонала. Часть 1. Реинжиниринг и управление бизнес-процессами в инфокоммуникациях. М.: ИРИАС, 2006. - 386 с.
  2. Димов Э.М., Маслов О.Н., Пчеляков С.Н., Скворцов А.Б. Новые информационные технологии: подготовка кадров и обучение персонала. Часть 2. Имитационное моделирование и управление бизнес-процессами в инфокоммуникациях. Самара: Изд-во СНЦ РАН, 2008. - 350 с.
  3. Ануфриев Д.П., Димов Э.М., Маслов О.Н., Трошин Ю.В. Статистическое имитационное моделирование и управление бизнес-процессами в социально-экономических системах. Астрахань: Изд-во АстИСИ, 2015. - 366 с.
  4. Димов Э.М., Маслов О.Н., Трошин Ю.В. Снижение неопределенности выбора управленческих решений с помощью метода статистического имитационного моделирования // Информационные технологии. №6, 2014. - С. 51-57.
  5. Димов Э.М., Маслов О.Н., Трошин Ю.В. Выбор средств программного обеспечения процесса статистического имитационного моделирования // Информационные технологии. Т. 21, №2, 2015. - С. 132-139.
  6. Маслов О.Н. Безопасность корпорации: моделирование и прогнозирование внутренних угроз методом риска. Самара: Изд-во ПГУТИ-АЭРОПРИНТ, 2013. - 170 с.
  7. Виттих В.А. Организация сложных систем. Самара: Изд-во СНЦ РАН, 2010. - 66 с.
  8. Маслов О.Н. Моделирование неопределенностей // Нейрокомпьютеры: разработка, применение. №9, 2014. - С. 79-84.
  9. Винер Н. Творец и робот. Пер. с англ. М.: Прогресс, 1966. - 104 с.
  10. Нейман Дж. фон, Моргенштерн О. Теория игр и экономическое поведение. Пер. с англ. М.: Наука, 1970. - 708 с.
  11. Savage L.J. The Foundations of Statistics. N.Y.: Wiley, 1954. - 310 p.
  12. Основы теории управления в системах специального назначения. М.: Изд. УДП РФ, 2008. - 400 с.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Маслов О.Н., Фролова М.А., 2015

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах