Лемма Шепли — Фолкмана[прим. 1] связывает две операции выпуклой геометрии — сложение по Минковскому и выпуклую оболочку. Лемма имеет приложения в ряде дисциплин, в том числе в математической экономике , оптимизации и теории вероятностей[2]. Лемма и связанные с ней результаты позволяют дать утвердительный ответ на вопрос «Близка ли к состоянию выпуклости сумма нескольких множеств?»[3].
Лемма названа в честь Ллойда Шепли и Джона Фолкмана и была впервые опубликована в работе экономиста Росса Старра. В 2012 году Шепли наравне с Элвином Ротом стал лауреатом Нобелевской премии по экономике[прим. 2]. Работа Старра, в которой произошло первое упоминание леммы, увидела свет в 1969 году. Тогда экономист сотрудничал с известнейшим американским учёным Кеннетом Эрроу и занимался решением вопроса о существовании некоторых экономических равновесий[1]. В работе Старра проводилось исследование экономики, в которой некоторые геометрически выраженные взаимосвязи, обладавшие свойством невыпуклости, заменялись ближайшими выпуклыми аналогами — выпуклыми оболочками . Старр доказал, что такая «овыпукленная» экономика обладает равновесными состояниями, весьма близкими к квазиравновесиям оригинальной экономики. Более того, учёный доказал, что каждое квазиравновесие обладает рядом оптимальных характеристик подлинного равновесия, которые были найдены в выпуклых экономиках. Работы Шепли, Фолкмана и Старра показали, что основные результаты выпуклой экономической теории являются хорошими приближениями экономики с невыпуклыми элементами. Лемма позволяет предположить, что если число слагаемых множеств превосходит размерность векторного пространства D, то тогда нахождение выпуклых оболочек («овыпукление») требуется только для D слагаемых[1]. Французский экономист Роже Генри писал: «Получение этих результатов в общем виде стало одним из главных достижений послевоенной экономической теории»[4].
Тематика невыпуклых множеств в экономике становилась предметом исследования многих других нобелевских лауреатов[прим. 2]. С этим вопросом работали Пол Самуэльсон (премия 1970 года), Кеннет Эрроу (1972), Тьяллинг Купманс (1975), Жерар Дебрё (1983), Роберт Ауман (2005), Пол Кругман (2008). Смежной тематикой выпуклых множеств занимались Леонид Канторович (1975), Роберт Солоу (1987), Леонид Гурвич (2007). В теории оптимизации лемма Шепли — Фолкмана использовалась для объяснения успешного решения задач минимизации сумм нескольких функций[5][6], а также для доказательства «закона средних» для случайных множеств (эта теорема была доказана только для выпуклых множеств)[7].
Лемма опирается на некоторые математические категории и результаты выпуклой геометрии.
Векторным пространством называется алгебраическая структура, для элементов которой определены две операции — сложение и умножение на число (называемое «скаляром»). При этом операции подчинены восьми аксиомам:
где — непустое множество элементов («векторов») данного пространства[8].
Важной характеристикой векторного пространства является размерность, которая характеризует максимальное число линейно независимых элементов пространства. Эти линейно независимые элементы образуют базис векторного пространства[9].
Непустое множество в вещественном векторном пространстве считается выпуклым, если отрезок, соединяющий две любые точки , является подмножеством [10]. Например, невыпуклое множество целых чисел {0, 1, 2} является подмножеством промежутка [0, 2], который обладает свойством выпуклости. Круг является выпуклым множеством, а окружность таковым считаться не может, так как не все точки отрезка будут одновременно являться точками множества: . Пустое множество считается выпуклым либо по определению[11], либо на основании принципа пустой правды[прим. 3].
Формально выпуклое множество можно определить следующим образом:
Множество является выпуклым, если для любых точек , и любого вещественного числа выполняется условие
- .
Выпуклой комбинацией множества называется некоторая взвешенная средняя, определённая по формуле
при условиях
Используя метод математической индукции, можно установить, что множество выпукло тогда и только тогда, когда каждая выпуклая комбинация принадлежит самому множеству[12][13][14]:
Определение выпуклого множества предполагает, что пересечение двух выпуклых множеств всегда выпукло. Отсюда же следует, что выпуклым является и пересечение семейства выпуклых множеств. В частности, пара непересекающихся множеств имеет пересечением пустое множество, которое, как было установлено выше, выпукло[11].
Выпуклой оболочкой множества называется наименьшее выпуклое множество, содержащее в качестве подмножества. Наименьшее множество представляет собой наименьший элемент по отношению к вложению множеств, то есть такое выпуклое множество, содержащее данную фигуру, что оно содержится в любом другом выпуклом множестве, содержащем данную фигуру. Так, является пересечением всех выпуклых множеств, которые покрывают . К примеру, выпуклой оболочкой множества {0, 1} является отрезок числовой прямой [0, 1], содержащий целые числа 0 и 1[15].
Суммой Минковского непустых множеств и в вещественном векторном пространстве является множество , состоящее из сумм всевозможных элементов слагаемых множеств[16][17]:
Итак, в результате проведения операции формируется множество-сумма, включающее все возможные суммы элементов первого и второго множеств. Например, если множество, состоящее из нуля и единицы, сложить с собой же, то в результате будет получено множество, включающее ноль, единицу и двойку[15]:
Согласно методу математической индукции, сумма Минковского конечного семейства непустых множеств при условиях
является множеством, сформированным поэлементным сложением множеств-слагаемых[18][19]:
Также следует отметить, что сумма множества и множества , содержащего только один нулевой элемент, равна :
Операция сложения Минковского обладает полезным свойством при «овыпуклении» множеств, то есть при нахождении их выпуклых оболочек. Для любых множеств и в вещественном векторном пространстве выпуклая оболочка их суммы Минковского равна сумме Минковского их выпуклых оболочек:
С применением математической индукции выводится аналогичное утверждение для конечного набора множеств[20][21]:
Тождество
позволяет установить, что если точка принадлежит выпуклой оболочке суммы Минковского множеств, то она принадлежит и сумме выпуклых оболочек слагаемых множеств:
Из этой импликации и определения суммы Минковского следует, что любую точку, принадлежащую множеству можно представить как сумму некоторых точек , принадлежащих выпуклым оболочкам слагаемых множеств:
В таком представлении набор суммируемых точек зависит от выбранной точки-суммы .
Примем указанное представление точки .
Если размерность векторного пространства строго меньше числа слагаемых множеств
- ,
то тогда, согласно лемме Шепли — Фолкмана, «овыпукление» требуется только для слагаемых множеств (их конкретный набор зависит от выбора точки )[22]. Это позволяет выразить точку следующим образом:
при
Иными словами, сумма точек принадлежит выпуклой оболочке суммы множеств (или меньшего их числа), а сумма точек принадлежит сумме оставшихся множеств-слагаемых.
Содержание леммы проиллюстрируем простейшим примером: каждую точку выпуклого множества [0, 2] можно представить как сумму целого числа из невыпуклого множества {0, 1} и вещественного числа из выпуклого множества [0, 1][15].
Лемма позволяет делать и обратные выводы, касающиеся не множеств, но размерности векторного пространства. Если в некотором конечномерном вещественном векторном пространстве лемма выполняется для натурального числа и ни для какого числа меньше , то размерность векторного пространства равна [23]. Разумеется, данное утверждение актуально только для конечномерных векторных пространств[24][25].
Шепли и Фолкман использовали лемму для доказательства своей теоремы, в которой устанавливалась верхняя граница расстояния между суммой Минковского и её выпуклой оболочкой, «овыпукленной» суммой. Теорема Шепли — Фолкмана гласит, что квадрат евклидова расстояния между любой точкой «овыпукленной» суммы и соответствующей ей точкой исходной суммы не превосходит значение суммы квадратов наибольших радиусов окружностей, описанных около множеств (описанной сферой называется наименьшая сфера, включающая множество)[26]. Значение такой границы не зависит от числа слагаемых множеств, если [27]. Следовательно, расстояние равно нулю тогда и только тогда, когда сумма сама является выпуклым множеством. При верхняя граница зависит от размерности , формы множеств-слагаемых и не зависит от количества слагаемых множеств[2].
Радиус описанной окружности превосходит внутренний радиус множества или, реже, равен ему[28]. Внутренним радиусом называется наименьшее число , такое, что для любой точки существует окружность радиуса , содержащая те точки , которые охватывают центр окружности (то есть )[29]. Внутренний радиус является характеристикой размеров невыпуклостей множества. Формально внутренний радиус множества можно определить так[29][прим. 4]:
Следствие Старра к теореме установил новую (меньшую, чем у Шепли и Фолкмана) верхнюю границу между суммой и «овыпукленной» суммой:
согласно королларию Старра, квадрат евклидова расстояния между любой точкой и соответствующей ей точкой множества ограничен суммой квадратов наибольших внутренних радиусов множеств [28][30].
Для простоты изложения теории меру расстояния, предложенную Старром, называют невыпуклостью (англ. non-convexity)[прим. 5] множества. Граница, налагаемая королларием Старра на невыпуклость множества-суммы, зависит только от наибольших внутренних радиусов множеств-слагаемых и не зависит от числа слагаемых при .
Подмножество слагаемых ( ), точнее, их форма, определяет верхнюю границу расстояния между средним значением множеств по Минковскому
и выпуклой оболочкой этой средней. При N, стремящемся к бесконечности, максимальное расстояние стремится к нулю (для множеств-слагаемых равномерно ограниченного размера)[2].
Оригинальное доказательство леммы устанавливало лишь достоверность существования подобного представления точек, при этом алгоритм их нахождения в доказательстве представлен не был. Схожие доказательства были предложены Эрроу и Ханом[31], Касселсом[32], Шнейдером[33] и другими учёными. Абстрактное и изящное доказательство представил Ивар Экеланд — его работа была впоследствии дополнена Артстейном[5][34]. Некоторые доказательства не были опубликованы[3][35]. В 1981 году Старр опубликовал итеративный метод вычисления представления заданной точки-суммы. Тем не менее, присутствовавшее в работе доказательство было менее сильным, чем оригинальное[36].
Пусть , при этом все за вычетом принадлежат множеству .
Зададим отображение , действующее из в , следующим образом:
По определению, .
Из линейности следует, что
Заметим, что тогда и только тогда, когда также принадлежит выпуклой оболочке конечного числа точек множества . Согласно теореме Каратеодори о выпуклой оболочке, , однако в данном доказательстве этот результат использоваться не будет. Итак, мы можем представить следующим образом:
В свою очередь, любой может быть представлен как
Обозначим m-множество как . Очевидно, что для каждого
при этом
Таким образом, мы заменили каждое множество конечным подмножеством . Для дальнейших целей отметим, что являются многогранниками в , а произведение является многогранником в .
Обозначим прообраз элемента при отображении буквой . Нас интересует подмножество :
Предположение означает, что непусто. Более того, так как есть многогранник, а — аффинное подпространство, то также является многогранником. Пусть — одна из его вершин. По-прежнему, , где при . Мы также докажем, что все точки за исключением по большей мере точек являются вершинами . Так как любая вершина должна принадлежать , доказательство этого утверждения будет служить доказательством леммы в целом.
Предположим, что указанное утверждение неверно, и существует точек , которые не являются вершинами . Обозначим их
Для каждого существует вектор и число такие, что
Обозначим
Итак, при существовании векторов в пространстве размерности между ними имеет место линейная зависимость. Следовательно, существуют не все равные нулю числа такие, что
Мы можем предположить, что при . Теперь определим две принадлежащие точки и :
Из следует, что и принадлежат . Кроме того,
Следовательно, точки и принадлежат . При этом, очевидно,
Вопреки предположению, не может быть вершиной .
Лемма позволяет исследователям экстраполировать результаты, актуальные для сумм Минковского выпуклых множеств, на прочие суммы необязательно выпуклых множеств. Инструменты Шепли, Фолкмана и Старра нашли применение в экономике, математической оптимизации и теории вероятностей.
Многие экономические отношения, зависимости и процессы можно смоделировать, представив их геометрическую интерпретацию. Следовательно, если некоторое множество, имеющее экономический смысл, поддаётся операции сложения Минковского, то лемма, теорема и их следствия становятся актуальными для модели данного экономического явления. Примером подобного множества является кривая безразличия — простая, но важная микроэкономическая модель потребления и полезности.
В микроэкономической теории принято допущение о том, что предпочтения потребителей определены на всём пространстве некоторых «корзин», то есть количественно определённых наборов различных товаров: потребители обладают точным знанием о своих предпочтениях и об их количественных характеристиках. Каждая корзина представлена неотрицательным вектором, координаты которого обозначают количество каждого рассматриваемого товара. На этом множестве корзин для каждого потребителя определяются кривые безразличия. Каждая кривая представляет собой геометрическое место точек, соответствующих тем корзинам, которые потребитель расценивает как эквивалентные по полезности. Другими словами, покупатель испытывает безразличие к тому, какая именно корзина (среди расположенных на одной кривой) ему достанется. В данной модели предполагается, что через некоторую корзину (точку) может проходить только одна кривая безразличия. Финансовые возможности покупателя при этом ограничены бюджетной линией (в двумерном пространстве). Таким образом, оптимальным для потребителя решением является выбор той корзины, которая расположена в точке касания бюджетной линии к некоторой кривой безразличия. Множеством предпочтений (англ. preference set) потребителя называется объединение некоторой кривой безразличия и всех точек, расположенных выше её графика (то есть совокупность некоторых одинаково ценных для потребителя корзин и всех других более ценных корзин). Отношение предпочтения потребителя является выпуклым, если это множество предпочтений выпукло[37][38].
Итак, если найдено оптимальное для потребителя решение, то бюджетная линия является опорной прямой лучшей доступной кривой безразличия. Положение бюджетной линии определено вектором цены и вектором дохода покупателя (точнее, вектором дохода и склонностью к потреблению). Следовательно, множество оптимальных корзин является функцией от цен, и эта функция называется спросом потребителя. Если множество предпочтений выпукло, то спрос потребителя также является выпуклым множеством при любой цене. Примером выпуклых функций спроса являются единственная оптимальная корзина и отрезок оптимальных корзин[39].
Впрочем, если множество предпочтений невыпукло, то при некоторых ценах формируется такая бюджетная линия, которая допускает выбор одной из двух обособленных оптимальных корзин. Например, владелец зоопарка, желающий приобрести льва или орла (оцениваемых одинаково), не может приобрести часть одного животного и часть другого — его множество предпочтений не является выпуклым. Так, потребитель отказывается от приобретения строго выпуклой комбинации товаров в пользу покупки лишь одного товара в произвольном количестве[40].
Если множество предпочтений потребителя невыпукло, тогда при некоторых ценах функция спроса потребителя не является связным пространством. Гарольд Хотеллинг говорил о несвязном спросе:
Если при рассмотрении покупательских кривых безразличия мы примем предположение об их волнообразном характере, выпуклом в некоторых местах и вогнутом в других, мы неизменно придём к выводу о том, что только выпуклые участки можно воспринимать как сколько-нибудь значимые, поскольку другие по существу ненаблюдаемы. Их можно обнаружить только по разрывам, которые могут возникнуть в спросе с изменением ценовых соотношений; [разрывы] приводят к резким скачкам точки касания «через пропасть», возникающим при вращении [касательной] прямой. Но, хотя эти разрывы и могут указывать на существование «пропастей», характеризовать их глубину они не смогут в принципе. Вогнутые участки кривых безразличия и их многомерные обобщения, если таковые существуют, навсегда останутся в неизмеримой неясности[41].
Оригинальный текст (англ.)If indifference curves for purchases be thought of as possessing a wavy character, convex to the origin in some regions and concave in others, we are forced to the conclusion that it is only the portions convex to the origin that can be regarded as possessing any importance, since the others are essentially unobservable. They can be detected only by the discontinuities that may occur in demand with variation in price-ratios, leading to an abrupt jumping of a point of tangency across a chasm when the straight line is rotated. But, while such discontinuities may reveal the existence of chasms, they can never measure their depth. The concave portions of the indifference curves and their many-dimensional generalizations, if they exist, must forever remain in unmeasurable obscurity.
Сложность исследования невыпуклых предпочтений отмечали Херман Волд[42][43] и Пол Самуэльсон. Последний, согласно Диверту[44], писал, что невыпуклости «окутаны вечной тьмой»[прим. 7][45].
Тем не менее, ряд публикаций 1959—1961 годов в журнале The Journal of Political Economy пролил свет на проблемы невыпуклых предпочтений. Ведущими исследователями в этой области стали Фаррелл[46][47][48], Бэйтор[49][50], Купманс[51][52] и Ротенберг[53][54]. В частности, в работе Ротенберга рассматривался вопрос приблизительной выпуклости сумм невыпуклых множеств[55]. Статьи в JPE подтолкнули Шепли и Мартина Шубика к написанию работы, в которой описывались «овыпукленные» отношения предпочтения потребителей. Там же была впервые упомянута концепция «приблизительного равновесия» (англ. approximate equilibrium)[56]. Статья Шепли и Шубика, а также предшествующие публикации вдохновили Роберта Аумана на создание термина «квазиравновесие»[57].
В годы учёбы в Стэнфордском университете Росс Старр проходил особый экономико-математический курс повышенной сложности под руководством Кеннета Эрроу. Эрроу, составивший в прошлом аннотированную библиографию публикаций на тему невыпуклости в экономике, передал её молодому коллеге[58]. Свою семестровую работу Старр посвятил изучению общих равновесий некой вымышленной экономики, в которой невыпуклые отношения предпочтения заменялись их выпуклыми оболочками. Совокупный спрос в этой «овыпукленной» экономике представлял собой сумму выпуклых оболочек функций спроса потребителей при каждой цене. Идеи Старра заинтересовали Шепли и Фолкмана: в рамках частной переписки учёные доказали получившие их имя лемму и теорему, а затем эти результаты были опубликованы в работе Старра 1969 года[1].
Старру удалось обнаружить, что если число агентов на рынке превосходит товарную «размерность» (количество обмениваемых товаров), то общие равновесия «овыпукленной» экономики весьма близки к квазиравновесиям исходной экономики. Экономист получил строгое доказательство того, что в подобной ситуации имеет место по крайней мере одно квазиравновесие цен popt, обладающее следующими свойствами:
Старр установил, что
в целом расхождение между размещением в вымышленной экономике [порождённой нахождением выпуклых оболочек всех потребительских и производственных множеств] и некоторым размещением в настоящей экономике ограничено независимо от числа экономических агентов[61].
Оригинальный текст (англ.)in the aggregate, the discrepancy between an allocation in the fictitious economy generated by [taking the convex hulls of all of the consumption and production sets] and some allocation in the real economy is bounded in a way that is independent of the number of economic agents.
Результаты Шепли, Фолкмана и Старра получили применение и в других отраслях экономической науки: микроэкономике[62][63], теории общего равновесия[59][64][65][66][67], экономике общественного сектора[68] (в том числе в теории провалов рынка[69]), а также в теории игр[70], математической экономике[71] и прикладной математике[72][73][74][75]. Достижения Шепли, Фолкмана и Старра дали толчок внедрению теории меры множества и теории интегрирования в экономическую методологию[76].
Нелинейная оптимизация базируется на следующих основных понятиях:
Например, функции и выпуклы, а функция (синусоида) подобным свойством не обладает (синусоида невыпукла на интервале ).
Во многих задачах оптимизации целевая функция сепарабельна, то есть является суммой многих слагаемых функций, каждая из которых имеет свой аргумент:
В частности, целевые функции в задачах линейного программирования сепарабельны.
Оптимизационные задачи могут быть «овыпуклены» путём нахождения выпуклых оболочек слагаемых функций. Оптимальное решение такой задачи является пределом последовательности[прим. 8] точек с координатами , принадлежащих множеству [5]. Оптимальная точка, согласно лемме, является суммой точек графиков «овыпукленных» слагаемых функций и некоторого числа точек графиков оригинальных функций.
Данный анализ был впервые опубликован Иваром Экеландом в 1974 году. Математик тогда пытался объяснить, почему сепарабельные задачи с большим числом слагаемых выпуклы при невыпуклости исходных слагаемых. За несколько месяцев до того французский учёный Клод Лемарешаль успешно применил итеративные методы выпуклой минимизации к решению невыпуклых задач. Решение двойственной задачи нелинейной минимизации не всегда несёт информацию, полезную для решения прямой задачи (однако для выпуклых прямых задач, удовлетворяющих условиям регулярности, это не так). Задача Лемарешаля была аддитивно сепарабельной, и каждая слагаемая функция была невыпуклой. Тем не менее, решение двойственной задачи давало довольно точное приближение оптимального значения для прямой задачи[78][79][80][5][81]. Анализ Экеланда прояснил причины успеха методов выпуклой минимизации, применяемых к большим и сепарабельным задачам с невыпуклыми слагаемыми функциями. Экеланд и другие учёные утверждали, что аддитивная сепарабельность позволяла считать задачу приблизительно выпуклой при невыпуклости слагаемых. Поворотным событием в данной области исследований стало обращение математиков к лемме Шепли — Фолкмана[81][5][82][83]. Появление леммы стимулировало использование методов выпуклой минимизации для решения других классов задач с сепарабельными функциями[5][6][73][84].
Выпуклые множества часто изучаются в рамках теории вероятностей. Каждая точка, принадлежащая выпуклой оболочке непустого множества в конечномерном пространстве, является математическим ожиданием простого случайного вектора, который принимает значения на множестве (это следует из леммы Каратеодори)[прим. 9]. Таким образом, для непустого множества набор математических ожиданий величин простого случайного вектора эквивалентен выпуклой оболочке множества — следовательно, лемма может быть применена и в этой области[85]. С другой стороны, инструментами для изучения выпуклых множеств в целом и леммы в частности обладает сама теория вероятностей[86]. Результаты Шепли, Фолкамана и Старра широко применялись в вероятностной теории случайных множеств[87], например, для доказательства закона больших чисел[7][88], центральной предельной теоремы[88][89] и теории больших отклонений[90]. Чтобы избежать допущения о выпуклом характере всех случайных множеств, при доказательстве этих предельных теорем теории вероятностей применялись результаты Шепли, Фолкмана и Старра.
Лемма имеет приложения и в тех разделах теории меры, которые не связаны с вероятностью, например, в теориях объёма и векторной меры. Лемма позволяет уточнить теорему Брунна — Минковского, которая устанавливает отношение объёма множества-суммы и сумму объёмов множеств-слагаемых[91]. Объём множества характеризуется мерой Лебега, которая определена для множеств евклидова пространства. Лемма также использовалась при доказательстве теоремы Ляпунова, которая указывает на то, что образ[прим. 10] безатомной векторной меры является выпуклым[92]. Векторная мера, значениями которой являются векторы, является обобщением понятия меры. К примеру, если и являются вероятностными мерами, определёнными на одном измеримом пространстве, тогда их функция-произведение является векторной мерой, где определена для каждого случайного события :
Теорема Ляпунова используется в математической экономике[93], теории релейных автоматических регуляторов и статистической теории[94]. Данная теорема считается непрерывным аналогом леммы Шепли — Фолкмана[2], которую, в свою очередь, называют дискретным «двойником» теоремы Ляпунова[95].
Эта статья входит в число избранных статей русскоязычного раздела Википедии. |
Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".
Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.
Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .