WikiSort.ru - Не сортированное

ПОИСК ПО САЙТУ | о проекте

Минимизация эмпирического риска (МЭР, англ. Empirical risk minimization, ERM) — это принцип статистической теории обучения, который определяет семейство алгоритмов обучения и который задаёт теоретические границы производительности.

Основания

Рассмотрим следующую ситуацию, которая является основной установкой многих задач обучения с учителем. Мы имеем два пространства объектов $X$ и $Y$ и хотели бы обучить функцию $\ h:X\to Y$ (часто называемую гипотезой), которая сопоставляет объект $y\in Y$ объекту $x\in X$ . Чтобы это сделать, мы имеем в распоряжении тренировочный набор из $n$ экземпляров $\ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})$ , где $x_{i}\in X$ является входом, а $y_{i}\in Y$ является соответствующим ответом, который мы хотим получить от $\ h(x_{i})$ .

Чтобы изложить более формально, предположим, что существует совместное распределение $P(x,y)$ над $X$ и $Y$ , и что тренировочный набор состоит из $n$ экземпляров $\ (x_{1},y_{1}),\ldots ,(x_{n},y_{n})$ , выбранных из независимых случайно распределённых величин из $P(x,y)$ . Заметим, что предположение совместного распределения позволяет моделировать неопределённость в предсказании (например, из-за шума в данных), поскольку $y$ не является детерминированной функцией от $x$ , а скорее случайной величиной с условным распределением $P(y|x)$ для фиксированного $x$ .

Предположим также, что нам дана неотрицательная вещественнозначная функция потерь $L({\hat {y}},y)$ , которая измеряет, насколько отличается предсказание ${\hat {y}}$ гипотезы от истинного выхода $y.$ Риск^[en], ассоциированный с гипотезой $h(x)$ , определяется тогда как математическое ожидание функции потерь:

R(h)=\mathbf {E} [L(h(x),y)]=\int L(h(x),y)\,dP(x,y).

Часто в качестве функции потерь в теории используется 0-1 функция потерь: $L({\hat {y}},y)=I({\hat {y}}\neq y)$ , где $I(\dots )$ означает индикатор.

Высшей целью алгоритма обучения является поиск гипотезы $h^{*}$ в фиксированном классе функций ${\mathcal {H}}$ , для которых риск $R(h)$ минимален:

h^{*}=\arg \min _{h\in {\mathcal {H}}}R(h).

Минимизация эмпирического риска

В общем случае риск $R(h)$ не может быть вычислен, поскольку распределение $P(x,y)$ неизвестно для обучающего алгоритма (эта ситуация называется агностическим обучением). Однако мы можем вычислить приближение, называемое эмпирическим риском, путём усреднения функции потерь на тренировочном множестве:

\!R_{\text{emp}}(h)={\frac {1}{n}}\sum _{i=1}^{n}L(h(x_{i}),y_{i}).

Принцип минимизации эмпирического риска (МЭР) ^[1] утверждает, что алгоритм обучения должен выбирать гипотезу ${\hat {h}}$ , которая минимизирует риск:

{\hat {h}}=\arg \min _{h\in {\mathcal {H}}}R_{\text{emp}}(h).

Тогда алгоритм обучения, определённый принципом МЭР состоит в решении вышеуказанной задачи оптимизаци.

Свойства

Вычислительная сложность

Известно, что минимизация эмпирического риска для задачи классификации с 0-1 функцией потерь является NP-трудной даже для такого относительно простого класса функций задач, как линейные классификаторы^[2]. Хотя она может быть эффективно решена, когда минимальный эмпирический риск равен нулю, то есть данные линейно сепараблеьны.

На практике алгоритмы обучения машин справляются с этим либо путём выпуклой аппроксимации до 0-1 функции потерь (подобно кусочно-линейной функции потерь^[en] для метода опорных элементов), которую проще оптимизировать, либо выдвижением предположения о распределении $P(x,y)$ (а тогда обучающий алгоритм перестаёт быть агностическим).

См. также

Метод максимального правдоподобия

Примечания

↑ Vapnik, 1992, с. 831–838.
↑ Feldman, Guruswami, Raghavendra, Wu, 2009.

Литература

Vapnik V. Principles of Risk Minimization for Learning Theory // Advances in neural information processing systems. — 1992.
Feldman V., Guruswami V., Raghavendra P., Yi Wu. Agnostic Learning of Monomials by Halfspaces is Hard // SIAM Journal on Computing. — 2009. — Т. 41, вып. 6.

Литература для дальнейшего чтения

Vapnik V. The Nature of Statistical Learning Theory. — 2000. — (Information Science and Statistics). — ISBN 978-0-387-98780-4.

Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".

Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.

Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .

Текст в блоке "Читать" взят с сайта "Википедия" и доступен по лицензии Creative Commons Attribution-ShareAlike; в отдельных случаях могут действовать дополнительные условия.

Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.

2019-2025
WikiSort.ru - проект по пересортировке и дополнению контента Википедии

[_1530c35052edd409-1] Vapnik, 1992, с. 831–838.

[_f106175454aeabfc-2] Feldman, Guruswami, Raghavendra, Wu, 2009.