FUNCTIONAL OF EXPECTED UTILITY: PRINCIPLES OF MODELING AND APPLICATION

Oleg Nikolayevich Maslov; Маслов Олег Николаевич; Margarita Alrksandrovna Frolova; Фролова Маргарита Александровна

doi:10.18469/ikt.2015.13.3.09

FUNCTIONAL OF EXPECTED UTILITY: PRINCIPLES OF MODELING AND APPLICATION

作者: Maslov O.N.¹, Frolova M.A.¹
隶属关系:
1. Povolzhskiy State University of Telecommunications and Informatics
期: 卷 13, 编号 3 (2015)
页面: 291-297
栏目: Articles
URL: https://journals.eco-vector.com/2073-3909/article/view/56076
DOI: https://doi.org/10.18469/ikt.2015.13.3.09
ID: 56076

如何引用文章

全文:

详细
全文:
作者简介
参考
补充文件
统计

详细

This work is concerned on principles and futures of functional of expected utility application for management of organization-technical complex systems. Complex system management applies theory of decision-making, theory of knowledge, theory of risk and expected utility theories (both objective and subjective). We demonstrated advantages and disadvantages of objective and subjective approaches to simulation of functional of expected utility. Here we applied statistical simulation method according to earlier on developed Dimov-Maslov method and computational scheme based on Monte Carlo method to reduce influence of knowledge uncertainty. By using the functional of expected utility as a criterion of effectiveness of statistical simulation method modified by Dimov-Maslov method we improved the effectiveness of decision-making relating with complex system management.

关键词

complex systems, decision-making, theory of knowledge and risk, criterion of expected utility

全文:

Введение Конвергенция теорий риска и ожидаемой полезности с теориями знаний и сложных систем (СС) открывает возможности расширенного применения новых информационных технологий в практических целях [1-3]. Под конвергенцией (от лат. convergere - приближаться, сходиться) будем понимать развитие указанных теорий по пути сближения и приобретения общих или сходных признаков; примером новых информационных технологий является метод статистического имитационного моделирования (СИМ) по версии Димова-Маслова (МДМ) [4-5], включающий методы сценариев и функционально-стоимостного анализ [6], а также использующий компьютерную технологию метода Монте-Карло (ММК). Стимулом для указанной конвергенции являются синергетические эффекты, многократно увеличивающие ценность перечисленных СС знаний. В практическом плане версия МДМ ориентирована на повышение эффективности функционирования СС путем оперативного управления ее характеристиками [1-4]. Цель статьи - анализ критериев, предназначенных для использования при управлении СС организационно-технического типа, которые могут быть получены в рамках теорий риска и ожидаемой полезности. Область применения теорий риска и ожидаемой полезности В приложениях теорий риска и ожидаемой полезности для оценки неопределенности используются «линейные» критерии риска типа RS = P(A) АS, где P(A) - вероятность результата А работы СС; АS - его полезность (стоимость рискового выигрыша или проигрыша, в денежных или любых других единицах). Если воспользоваться методом сценариев [6], то можно просчитать значения АS для каждого сценария с помощью метода функционально-стоимостного анализа (по максимуму, по минимуму, в среднем), а также дать оценку вероятности реализации каждого сценария P(A) при помощи интерсубъективных экспертных методов, отражающих согласованное предпочтение (групповое мнение) лиц, принимающих решения (ЛПР) в рамках принятой онтологической модели ситуации (ОМС) [7]. Отметим, что неопределенность не означает отсутствие информации об СС - речь идет о неполноте, неточности, неадекватности имеющихся сведений [8]. Механизм уменьшения этой неопределенности может быть линейным, нелинейным, аддитивным, синергетическим - чтобы правильно воспользоваться им, нужно знать специфику каждой рассматриваемой СС, а также учитывать субъективный «человеческий фактор». Последнее объясняется тем, что роль личности при проведении такого рода исследований достаточно велика. Это касается и методики сбора и обработки первичной информации, и выбора способов представления и критериев оценки конечных данных, и тем более - форм их последующего применения. Но если полученные данные остаются неопределенными по своей физической сути, использовать их в точных математических формулах все равно бесполезно - это будут «обман и пустая трата времени» [9]. Поэтому СИМ по МДМ уделяет особое внимание особенностям поведения ЛПР (менеджеров, операторов, клиентов, партнеров, конкурентов и т.п.) корпорации. Принимаемые решения считаются результатом упорядоченного (поддающегося структурированию и формализации) процесса мышления разумных людей, априори вводятся предположения о характере их действий в виде аксиом рационального поведения. На основе указанных аксиом (наиболее важными из них являются аксиомы транзитивности, безразличия, независимости и рациональности) Дж. фон Нейманом и О. Моргенштерном в 1947 г. была сформулирована и доказана теорема о существовании функции полезности, определяющей действия ЛПР [10]. Полезностью при этом была названа некая условная (воображаемая) величина, которую в процессе выбора максимизируют ЛПР с упомянутым рациональным мышлением - своего рода мера психологической и потребительской ценности для них различного рода реальных и виртуальных благ. Теория объективной ожидаемой полезности предполагает, что в процессе принятия решений рационально мыслящий ЛПР «взвешивает» различные альтернативы и выбирает из них ту, полезность которой максимальна. Функционал объективной полезности (ФОП) фон Неймана-Моргенштерна для N-мерной альтернативы имеет вид , (1) где - вероятность n-го возможного результата, имеющего для ЛПР объективную ценность (стоимость) ; n[1; N]. Считается, что рациональный человек при выборе решения должен руководствоваться правилом . Однако почти одновременно Л. Сэвиджем было предложено правило, положившее начало теории субъективной ожидаемой полезности [11], в рамках которой ФОП представляет собой , (2) где - оценка вероятности n-го возможного результата экспертом , которая имеет для него ценность . В данном случае разные ЛПР могут делать разный выбор из одинаковых альтернатив, руководствуясь субъективными соображениями (которые зависят от их личных качеств, знаний, опыта, предпочтений, предубеждений и т.п.), причем каждый эксперт вправе руководствоваться собственным правилом и выработка группового решения требует от ЛПР коллективных усилий в рамках сложившейся ОМС [7]. Если ЛПР договорятся между собой и придут к согласию относительно совместных оценок и правил сотрудничества, то = ; = (3) и значения обоих ФОП будут одинаковыми. Возможность для этого создает понимание всеми ЛПР, что объективно существуют и управляют их решениями общие для них эвристики (от греч. heurisko - нахожу, в данном случае - совокупности логических приемов и методических правил), которые определяют закономерности отклонения поведения реальных ЛПР от поведения рационального человека. К числу таких эвристик относятся суждения по представительности, по встречаемости, по точке отсчета, а также «сверхдоверие» личному опыту и стремление исключить риск [11]. В то же время какими-либо конкретными рекомендациями по составу и структуре ФОП теории риска и ожидаемой полезности не располагают - настоящая статья призвана уменьшить этот пробел. Функционал ожидаемой полезности Рассмотрим случай, когда приемлемый риск минимизирует потери (затраты) для рассматриваемого объекта (организации, фирмы, физического лица и т.д.), связанные с достижением поставленной цели в корпоративной СС организационно-технического (холонического) типа [6]. Пусть ЛПР Sn , принадлежащий совокупности n [1; N], рассматривает K вариантов своих действий (сценариев развития событий), направленных на достижение указанной цели как некого важного для него позитивного эффекта (выигрыша) Fk , который может быть им лично достигнут с вероятностью pF при затратах, равных Gk , которые могут быть лично им обеспечены с вероятностью pG. Значение pF также учитывает меру правильности прогноза Sn получить на выходе проекта по k-му сценарию выигрыш Fk , а значение pG - шансы ЛПР собрать ресурс Gk, необходимый для начала выполнения проекта. Субъект Sn также учитывает, что k-ый сценарий приводит к достижению цели не гарантированно, а с вероятностью pk , которая характеризует некие объективные (зависящие не только от него лично, как внешние, так и внутренние) обстоятельства: например, в виде согласования и утверждения проекта в вышестоящих инстанциях и т.п. Тогда в качестве критерия эффективности k-го сценария ЛПР может быть выбрана расчетная величина Qk = pk (pF Fk - pG Gk ), (4) где k [1; K], которая и является в данном случае прогнозируемой и допустимой (по его мнению) мерой риска. В наиболее общем плане - при проведении СИМ по МДМ произвольной СС организационно-технического типа - значение Qk будем считать некоторой конкретной полезностью рассматриваемого проекта: понимая под Fk предполагаемый «доход», а под Gk - «расходы», связанные с реализацией k-го сценария. Тогда, следуя логике и терминологии фон-Неймана - Моргенштерна и Сэвиджа, Qk также можно именовать ФОП, который в данном случае является случайным функционалом - поскольку в его состав входят вероятности pk ; pF и pG . … … … … … … … … … … Рис. 1. К выбору оптимального сценария действий ЛПР Sn по критерию ФОП Отметим, что предельно простой по составу («доходы» минус «расходы»), ФОП (1) отличается достаточно сложной комплексной (объективной и субъективной, детерминированной и стохастической, статической и динамической и т.д.) структурой, где ключевым элементом является Gk - так как при отсутствии необходимых ресурсов о его реализации речи быть не может. При анализе ФОП необходимо рассмотреть и промоделировать следующие связи: - Gk и pG, на предмет того, есть ли возможность собрать нужные ресурсы, как уже было сказано, хотя бы для начала проекта; - Gk и Fk , поскольку ЛПР надо знать, «стоит ли игра свеч»: для этого можно рассмотреть некий соответствующий исходным параметрам G0 и F0 начальный вариант («нулевой», базовый, бесприбыльный и т.п. сценарий), принимаемый за условную точку отсчета, относительно которой будет реализована дальнейшая стратегия «синтеза через анализ» рассматриваемой СС при помощи СИМ по МДМ; - Gk и pF , так как, не собрав необходимые ресурсы и не имея под них гарантий, нельзя начинать проект: успех может быть неприемлемо маловероятным и получить выигрыш Fk от его реализации вряд ли удастся; - Gk и pk , в силу того, что получить разрешение «сверху» (в форме утверждения плана действий ЛПР в надсистеме) на реализацию проекта без необходимых ресурсов тоже вряд ли возможно; - Fk и pk , поскольку указанное разрешение «сверху» без весомого стимула в виде реальной возможности выигрыша Fk также обеспечить трудно; - pk и pG ; pF - если считать, что вероятность начала проекта обусловлена перспективой получения необходимых ресурсов и возможностью достижения цели в виде выигрыша Fk. Схема выбора оптимального (наилучшего из рассматриваемых вариантов) сценария по критерию Qopt = MAX (Qk) показана на рис. 1. Вероятность одобрения k-го сценария в рамках предложенной в [4] экспоненциальной модели Qk примем равной pk = 1 - exp (- pG pF Gk Fk / G0 F0), (5) так как чем больше значения «позитивных» рисков pG Gk / G0 получения ресурса и pF Fk / F0 успешного достижения поставленной цели по сравнению с базовым сценарием, тем больше вероятность выбора и утверждения данного варианта реализации проекта. Отметим, что как при pG Gk / G0 >> 1, так и при pF Fk / F0 >> 1, здесь имеет место p ≈ 1, тогда как при pG Gk / G0 << 1 или pF Fk / F0 << 1, напротив, pk ≈ 0, что также соответствует условиям моделирования СС. Данная часть процесса формирования ФОП отражает его объективную сторону, поскольку все вероятности здесь выступают в роли формальных коэффициентов (неизвестных ЛПР в настоящее время), а ресурсы и предполагаемые выигрыши могут быть определены детерминированными способами. Субъективность ФОП проявляет себя при устранении неопределенностей путем конкретизации значений pG и pF , что на практике может быть сделано лишь с помощью эвристических (экспертных) методов группой привлеченных ЛПР. Поскольку, согласно схеме рис. 1, выбор вероятностей pG и pF предваряет оценку связанных с ними значений Gk и Fk , от «правильности» действий экспертов здесь непосредственным образом зависит исход СИМ. Отметим, что теоремы и леммы классической теории вероятностей в рамках концепции «риск как неопределенность» не всегда подходят к рассматриваемой ситуации, где более продуктивной является концепция «риск как возможность». Анализ состава и структуры ФОП Важной частью анализа ФОП является исследование связи между ресурсом Gk и ожидаемым выигрышем Fk - для решения данной задачи представим ресурс и выигрыш как Gk = G0 + ΔGk; Fk = F0 + ΔFk , (6) после чего запишем (1) в следующем приближенном виде: Qk ≈ pk0 [ pF0 (F0 + ΔFk) - pG0 (G0 + ΔGk )], (7) где принято, что рk ≈ pk0 ; рF ≈ pF0 ; рG ≈ pG0 , что, строго говоря, справедливо при Gk >> G0. Перегруппировав слагаемые в правой части (4), получим Qk = Q0 + Δ Qk , (8) где Q0 = pk0 ( pF0 F0 - pG0 G0) ≈ 0 - наш условный «ноль», то есть выигрыш, соответствующий базовому сценарию, а также ΔQk = pk0 ( pF0 ΔFk - pG0 ΔGk ), (9) откуда при pF0 = pG0 и p0 = pk0 pG0 следует ΔQk = p0 ΔGk (ΔFk / ΔGk - 1) ≈ p0 ΔGk (dFk /dGk - 1). (10) Таким образом, в первом приближении связь между Gk и Fk определяется производной dFk /dGk : если dFk /dGk ≤ 1, рассматриваемый k-ый вариант не имеет преимуществ перед базовым сценарием, в то же время наилучшим следует считать вариант, при котором dFk /dGk = MAX. Данный момент формализации ФОП представляется существенным, поскольку позволяет сформировать критерий при проведении СИМ по МДМ, «понятный» не только ЛПР, но и компьютеру. Отметим, что условия рk ≈ pk0 ; рF ≈ pF0; рG ≈ pG0 и pF0 = pG0 не представляются жесткими ограничениями, поскольку данные вероятностные коэффициенты все равно задаются, а впоследствии уточняются эвристическими экспертными методами, которые не могут давать точные (однозначные и надежно достоверные) результаты. Подставим (5) в (4) и сформируем ФОП в итоговом виде, пригодном для проведения СИМ по МДМ: Qk = [1 - exp (- pG pF Gk Fk / G0 F0)] × × (pF Fk - pG Gk). (11) При дальнейшем анализе ФОП возникают два вопроса: во-первых, существует ли сценарий, при котором в (11) достигается оптимум Qopt ; во-вторых, какими в таком случае должен быть ресурс Gopt по сравнению с G0, который необходим для получения базового выигрыша F0. Ответ на эти вопросы был дан в [6], где показано, что Gopt ≈ F0 /2, (12) то есть, во-первых, искомый оптимум существует (в частном случае он может соответствовать и базовому сценарию), во-вторых, при наиболее целесообразном сценарии затраты на него должны составлять примерно половину прогнозируемого выигрыша. Подставив (12) в (11), получаем Qopt = [1 - exp (-F0 /2 G0)] F0 /2 . (13) Таким образом, согласно (12)-(13), приступая к выполнению проекта, ЛПР Sn должен исходить из того, что выигрыш (в денежном выражении - выгода, прибыль) будет как минимум вдвое превышать расходы, связанные с реализацией наилучшего (но возможно и наиболее дорогостоящего) сценария. Особенности разных подходов к анализу ФОП Важное практическое значение имеет вопрос о том, в каких случаях наиболее целесообразен объективный поход к анализу ФОП, а в каких случаях - субъективный. Ясно, что на первый план здесь выходит специфика решаемой задачи и ее конкретные исходные условия, которые определяют, с каким «видом» неопределенности знаний и, соответственно, с какой вероятностью (объективной или субъективной), моделирующей эту неопределенность, ЛПР имеет дело в рассматриваемой ситуации. Поясним сказанное на двух примерах из теории игр - максимально простых и универсальных. Выбирая «вслепую» карту из колоды и пытаясь установить, какая это карта по своим параметрам, мы «работаем» с объективной вероятностью - поскольку принадлежащая данной колоде игральная карта существует сама по себе, независимо от нашего сознания, и мы до определенного времени просто не знаем, какая она, но хотим оценить последствия этого незнания при разных вариантах развития событий. Переводя ситуацию в область оценки ФОП, можно, по аналогии, утверждать, что в природе уже имеется некий готовый вариант его реализации согласно (1), устраивающий нас в наибольшей мере, однако мы не знаем точно, какой это вариант, и хотели бы приблизиться к нему, используя объективный вероятностный подход. Субъективная вероятность соответствует совету «лошадью ходи» в знаменитой кинокомедии, когда игрок сам определяет будущую ситуацию, и она непосредственным образом зависит от познавательной активности, опыта и профессиональной подготовки - то есть от объема и качества аксиологических знаний ЛПР, а также от стечения обстоятельств. Понятие неопределенности знаний в данном случае представляется существенно более богатым и разнообразным, но с большим трудом поддающимся управлению извне - поскольку не каждого ЛПР можно убедить или заставить действовать против его личной воли. Ограничимся здесь замечанием, что преодоление неопределенности знаний в процессе формирования ОМС на основе субъективного вероятностного подхода и соответствующее ему определение ФОП согласно (2) требуют от ЛПР значительных совместных усилий. Заключение Опыт показывает, что поведение и развитие СС в целом ряде случаев не подчиняется известным ЛПР закономерностям, идет по непредсказуемым для них сценариям и незапланированным путем [12]. В этой ситуации, с одной стороны, трудно воспользоваться критерием ФОП [10-11] непосредственно в виде (1)-(2), но с другой стороны - также трудно представить себе более подходящий по своим возможностям и характеристикам способ поддержки действий ЛПР, чем СИМ по МДМ [1-4]. Это объясняется тем, что присущие сведениям об исследуемых СС неточности и неадекватности, возможные ошибки и неизбежные погрешности, а также любые другие неопределенности, воздействующие в качестве случайных факторов на результаты СИМ, можно не только учесть при помощи технологии ММК, но и определить степень их негативного влияния на качество принимаемых решений - с тем, чтобы скорректировать его до приемлемых пределов.

作者简介

Oleg Maslov

Povolzhskiy State University of Telecommunications and Informatics

Email: maslov@psati.ru

Margarita Frolova

Povolzhskiy State University of Telecommunications and Informatics

参考

Димов Э.М., Маслов О.Н., Пчеляков С.Н., Скворцов А.Б. Новые информационные технологии: подготовка кадров и обучение персонала. Часть 1. Реинжиниринг и управление бизнес-процессами в инфокоммуникациях. М.: ИРИАС, 2006. - 386 с.
Димов Э.М., Маслов О.Н., Пчеляков С.Н., Скворцов А.Б. Новые информационные технологии: подготовка кадров и обучение персонала. Часть 2. Имитационное моделирование и управление бизнес-процессами в инфокоммуникациях. Самара: Изд-во СНЦ РАН, 2008. - 350 с.
Ануфриев Д.П., Димов Э.М., Маслов О.Н., Трошин Ю.В. Статистическое имитационное моделирование и управление бизнес-процессами в социально-экономических системах. Астрахань: Изд-во АстИСИ, 2015. - 366 с.
Димов Э.М., Маслов О.Н., Трошин Ю.В. Снижение неопределенности выбора управленческих решений с помощью метода статистического имитационного моделирования // Информационные технологии. №6, 2014. - С. 51-57.
Димов Э.М., Маслов О.Н., Трошин Ю.В. Выбор средств программного обеспечения процесса статистического имитационного моделирования // Информационные технологии. Т. 21, №2, 2015. - С. 132-139.
Маслов О.Н. Безопасность корпорации: моделирование и прогнозирование внутренних угроз методом риска. Самара: Изд-во ПГУТИ-АЭРОПРИНТ, 2013. - 170 с.
Виттих В.А. Организация сложных систем. Самара: Изд-во СНЦ РАН, 2010. - 66 с.
Маслов О.Н. Моделирование неопределенностей // Нейрокомпьютеры: разработка, применение. №9, 2014. - С. 79-84.
Винер Н. Творец и робот. Пер. с англ. М.: Прогресс, 1966. - 104 с.
Нейман Дж. фон, Моргенштерн О. Теория игр и экономическое поведение. Пер. с англ. М.: Наука, 1970. - 708 с.
Savage L.J. The Foundations of Statistics. N.Y.: Wiley, 1954. - 310 p.
Основы теории управления в системах специального назначения. М.: Изд. УДП РФ, 2008. - 400 с.

补充文件

附件文件

动作

1. JATS XML

下载

用户名
密码
记住我

忘记您的密码?	注册

用户名
密码
记住我

忘记您的密码?	注册