WikiSort.ru - Не сортированное

ПОИСК ПО САЙТУ | о проекте

Отбор признаков, известный также как отбор переменных, отбор атрибутов или отбор поднабора переменных, это процесс отбора подмножества значимых признаков (переменных зависимых и независимых) для использования в построении модели. Техники отбора признаков используются по четырём причинам:

  • упрощение моделей для того, чтобы сделать их проще для интерпретации исследователями/пользователями[1],
  • более короткое время тренировки,
  • чтобы избежать проклятие размерности,
  • улучшенное обобщение путём сокращения переобучения[2] (формально, уменьшение дисперсии[1]).

Центральный посыл использования техники отбора признаков — что данные содержат некоторые признаки, которые либо излишни, либо не значимы, а потому могут быть удалены без существенной потери информации[2]. Излишни и не значимы являются двумя различными понятиями, поскольку один значимый признак может быть излишним при присутствии другого существенного признака, с которым он сильно коррелирует [3].

Техники отбора признаков следует отличать от выделения признаков. Выделение признаков создаёт новые признаки как функции от оригинальных признаков, в то время как отбор признаков возвращает подмножество признаков. Техники отбора признаков часто используются в областях, где имеется много признаков и выборки сравнительно малы (мало точек данных). Классическими местами применения отбора признаков являются анализ рукописных текстов и ДНК-микрочипы, где имеется много тысяч признаков и от десятков до сотен экземпляров выборки.

Введение

Алгоритм отбора признаков можно рассматривать как комбинацию техник поиска для представления нового поднабора признаков вместе с вычислением меры, которая отражает различие подмножеств признаков. Простейшим алгоритмом является проверка каждого возможного подмножества признаков и нахождения того, который минимизирует величину ошибки. Это исчерпывающий поиск по пространству и он вычислительно труден для наборов признаков, не являющихся очень маленькими. Выбор метрики сильно влияет на алгоритм и они различны для трёх основных категорий алгоритмов отбора признаков: обёртки, фильтры и методы вложения[3].

  • Методы обёртывания используют модель априорной оценки результата для оценки поднаборов признаков. Каждый новый поднабор используется для тренировки модели, которая проверяется на контрольной выборке. На этой контрольной выборке считается число ошибок (показатель ошибок модели), которое даёт оценку для данного подмножества. Так как методы обёртывания тренируют модель для каждого поднабора, они вычислительно очень затратны, но дают, как правило, лучший набор признаков для конкретного типа модели.
  • Методы фильтров использует косвенный показатель вместо показателя ошибки для оценки поднабора признаков. Этот показатель выбирается так, чтобы его можно было легко вычислить при сохранении показателя полезности набора признаков. Обычно применяемые меры — взаимная информация[3], поточечная взаимная информация[en][4], коэффициент корреляции смешанных моментов Пирсона, алгоритм, основанный на Relief[en][5] и расстояние между классами/внутри класса или результат критериев значимости для каждой комбинации класс/признак[4][6]. Фильтры обычно вычислительно менее интенсивны, чем обёртки, но они дают наборы признаков, которые не настроены на специфичный тип прогнозирующей модели[7]. Этот недостаток настройки означает, что набор признаков, полученный из фильтра более общий, чем набор, полученный из обёртки, что приводит к меньшей способности предсказания, чем у обёртки. Однако набор признаков не содержит при этом предположений о прогнозирующей модели, а потому более пригоден для обнаружения связей между признаками. Многие фильтры обеспечивают ранжирование признаков, не давая явного лучшего подмножества признаков, а точка отсечения в ранжировании выбирается с помощью перекрёстной проверки. Методы фильтров используются также как предварительные шаги обработки для методов обёртывания, что позволяет применять обёртывание для больших задач. Другим популярным подходом является алгоритм рекурсивного исключения признаков, обычно используемый вместе с методом опорных векторов для многократного построения модели и удаления признаков с малыми весами.
  • Методы вложения являются обобщающей группой техник, которые осуществляют отбор признаков как часть процесса построения модели. Экземпляром такого подхода является метод LASSO[en] (англ. Least absolute shrinkage and selection operator = метод оценивания коэффициентов линейной регрессионной модели) для построения линейной модели, который штрафует коэффициент регрессии на штраф L1, сокращая многие из них до нуля. Любые признаки, которые имеют ненулевые коэффициенты регрессии «выбираются» алгоритмом LASSO. Улучшения алгоритма LASSO включают алгоритм Bolasso, который формирует выборку путём бутстрепа[8], регуляризацию эластичной сети[en], которая комбинирует штраф L1 алгоритма LASSO со штрафом L2 гребневой регрессии, и метод FeaLect, который оценивает все признаки на основе комбинаторного анализа коэффициентов регрессии[9]. Эти подходы по вычислительной сложности оказываются где-то между фильтрами и обёртками.

В традиционной статистике наиболее популярной формой отбора признаков является ступенчатая регрессия[en], которая является техникой оборачивания. Это жадный алгоритм, который добавляет лучший признак (или удаляет худший) на каждом шаге алгоритма. Главная проблема — когда остановить алгоритм. При обучении машин это обычно делается путём перекрёстной проверки. В статистике некоторые критерии оптимизированы. Это ведёт к наследованию проблемы вложения. Исследовались и более устойчивые методы, такие как метод ветвей и границ и кусочно-линейная сеть.

Выбор поднабора

Выбор поднабора оценивает поднабор признаков как группу стабильности. Алгоритмы выбора поднабора можно разбить на Обёртки, Фильтры и Вложения. Обёртки используют алгоритм поиска для поиска по пространству возможных признаков и оценивают каждый поднабор путём прогона модели на поднаборе. Обёртки может быть вычислительно затратна и имеет риск переподгонки (переобучения) модели. Фильтры похожи на Обёртки по подходу к поиску, но вместо оценки модели оценивается более простой фильтр. Техники вложения встраиваются в модель и специфичны для неё.

Многие популярные подходы используют жадный поиск восхождением к вершине, который итеративно оценивает поднабор признаков как кандидата, затем модифицирует поднабор и оценивает, насколько новый поднабор лучше старого. Оценка поднабора требует использования оценочной метрики[en], которая ранжирует поднаборы признаков. Исчерпывающий поиск, как правило, невыполним, так что разработчик (или оператор) определяет точку останова, поднабор признаков с наибольшей достигнутой оценкой, обнаруженный к этому моменту выбирается как удовлетворительный поднабор признаков. Критерий остановки зависит т алгоритма. Возможные критерии: оценка поднабора превышает порог, программа превысила максимальное допустимое время, и так далее.

Альтернативные техники на основе поиска базируются на целевом поиске наилучшей проекции[en], который находит проекции низкой размерности данных с высокой оценкой — выбираются признаки, которые имеют наибольшие проекции в пространстве низкой размерности.

Подходы для поиска:

Две популярные метрики фильтров для задач классификации — корреляция и взаимная информация, хотя ни одна из них не является истинной метрикой[en] или «мерой расстояния» в математическом смысле, поскольку для них не выполняется неравенство треугольника, а потому они не представляют действительного «расстояния» – их следует, скорее, понимать как «оценку». Эти оценки вычисляются между признаками-кандидатами (или наборами признаков) и желаемой категорией. Есть, однако, истинные метрики, которые являются простыми функциями от взаимной информации[18].

Другие возможные метрики фильтров:

  • Отделимость классов
    • Вероятность ошибки
    • Межклассовое расстояние
    • Вероятностное расстояние
    • Энтропия
  • Выбор признаков на основе непротиворечивости
  • Выбор признаков на основе корреляции

Критерий оптимальности

Выбор критерия оптимальности сложен, так как имеется несколько целей в задаче отбора признаков. Многие критерии включают меру точности со штрафованием числом выбранных признаков (например, байесовский информационный критерий). Наиболее старыми являются статистика Cp Мэллоуса[en] и информационный критерий Акаике (англ. Akaike information criterion, AIC). Они добавляют переменные, если t-статистика превосходит .

Другими критериями являются байесовский информационный критерий (БИК, англ. Bayesian information criterion, BIC), который использует , минимальная длина описания (англ. minimum description length, MDL), который асимптотически использует , Бонферрони / RIC, который использует , отбор признаков с максимальной зависимостью, и набор новых критериев, которые продиктованы идеей уровня ложноположительных результатов[en] (англ. false discovery rate, FDR) и которые используют нечто, близкое к . Критерий максимума энтропийной скорости может также быть использован для выбора наиболее значимого поднабора признаков[19].

Структурное обучение

Фильтр отбора признаков является специальным случаем более общей парадигмы с названием «структурное обучение». Выбор признаков находит значимый набор признаков для конкретной целевой переменной, в то время как структурное обучение находит связи между переменными, обычно выражая эти связи в виде графа. Наиболее распространённые алгоритмы структурного обучения предполагают, что данные генерируются байесовской сетью, так что структура является ориентированной графовой моделью. Оптимальное решение задачи фильтра отбора признаков является марковским ограждением целевого узла и в байесовской сети имеется единственное марковское ограждение для каждого узла[20].

Механизмы отбора признаков на основе информационной теории

Есть различные механизмы отбора признаков, которые используют взаимную информацию для оценки различных признаков. Они обычно используют один и тот же алгоритм:

  1. Вычисляется взаимная информация как оценка между всеми признаками ( ) и целевым классом ( )
  2. Выбирается признак с наибольшей оценкой (например, ) и добавляется в набор отобранных признаков ( )
  3. Вычисляется оценка, которая может быть получена из взаимной информации
  4. Выбираем признак с наибольшей оценкой и добавляем в набор отобранных признаков (например, )
  5. Повторяем шаги 3. и 4. Пока не наберём определённое число признаков (например, )

Наиболее простой подход использует взаимную информацию в качестве «производной» оценки[21].

Однако, есть различные походы, которые пытаются уменьшить избыточность между признаками.

Выбор признаков на основе минимальной избыточности-максимальной релевантности

Пэн, Лон и Дин[22] предложили метод отбора признаков, который может использовать взаимную информацию, корреляцию или оценку расстояния/похожести для отбора признаков. Целью является наложение штрафа на значимость признака при избыточности, вызванной присутствием в других выбранных признаках. Значимость набора признаков S для класса c определяется средним значением всех значений взаимной информации между индивидуальным признаком fi и классом c:

.

Избыточность всех признаков в наборе S равна среднему значению всех значений ваимной информации между признакоим fi и признаком fj:

Критерий минимальной избыточности-максимальной релевантности (англ. Minimum-redundancy-maximum-relevance, mRMR}} является комбинацией двух мер, заданных выше и определённой как:

Предположим, что имеется полный набор из n признаков. Пусть xi будет индикаторной функцией вхождения в множество fi, так что xi=1 отражает присутствие, а xi=0 отражает отсутствие признака fi в глобальном оптимальном наборе признаков. Пусть и . Формула выше может теперь быть переписана как задача оптимизации:

Алгоритм mRMR является аппроксимацией теоретически оптимального алгоритма отбора признаков с максимальной зависимостью, который максимизирует взаимную информацию между совместным распределением выбранных признаков и классификационной переменной. Так как mRMR аппроксимирует задачу комбинаторной оценки серией существенно меньших задач, каждая из которых использует только две переменные, он использует попарные совместные вероятности, которые более устойчивы. В некоторых ситуациях алгоритм может недооценить полезность признаков, так как он не имеет возможности измерить взаимосвязь между признаками, которая может увеличить значимость. Это может привести к плохой производительности[21], если признаки по отдельности бесполезны, но становятся значимыми в комбинации (патологический случай найден, когда класс является функцией чётности[en] признаков). В общем случае алгоритм более эффективен (в терминах количества требуемых данных), чем теоретически оптимальный выбор максимальной зависимости, всё же даёт набор признаков с небольшой попарной избыточностью.

Алгоритм mRMR является представителем большого класса методов фильтров, которые балансируют различным образом между значимостью и избыточностью[21][23].

Квадратичное программирование для отбора признаков

Алгоритм mRMR является типичным примером инкрементальной жадной стратегии для отбора признаков — как только признак выбран, он не может быть удалён из выборки на последующих шагах. В то время как mRMR можно оптимизировать с помощью плавающего поиска для сокращения некоторых признаков, его можно переформулировать как глобальную оптимизационную задачу квадратичного програмирования[24]:

где является вектором значимости признаков в предположении, что имеется всего n признаков, является матрицей попарной значимости, а представляет относительные веса признаков. Задача QPFS решается методами квадратичного программирования. Было показано, что QFPS смещена в направлении признаков с меньшей энтропией[25] вследствие самоизбыточности признака на диагонали матрицы H.

Условная взаимная информация

Другая оценка, производная от взаимной информации, основана на условной значимости[25]:

где и .

Преимущество SPECCMI заключается в том, что оно может быть решено просто путём нахождения доминирующего собственного вектора Q. SPECCMI обрабатывает также для признаков взаимосвязи второго порядка.

Совместная взаимная информация

При изучении различных оценок Браун, Поукок, Чжао и Лухан[21] рекомендовали совместную взаимную информацию[26] в качестве хорошей оценки для отбора признаков. Оценка пытается найти признак, который добавляет наибольшую новую информацию к уже отобранным признакам, чтобы избежать избыточность. Оценка формулируется следующим образом:


Оценка использует условную взаимную информацию и взаимную информацию для оценки избыточности между уже отобранными признаками ( ) и исследуемым признаком ( ).

Выбор признаков на основе критерия независимости Lasso Гильберта — Шмидта

Для данных высокой размерности и небольших данных (например, размерность > и размер выборки < ), полезным является критерий независимости Lasso Гильберта — Шмидта (HSIC Lasso)[27]. Задача оптимизации HSIC Lasso задаётся как

где является ядерной мерой независимости, называемой (эмпирическим) критерием независимости Гильберта — Шмидта (англ. Hilbert-Schmidt independence criterion, HSIC), обозначает след, является параметром регуляризации, и являются входными и выходными центрироваными матрицами Грама, и являются матрицами Грама, и являются ядерными функциями, является центрированной матрицей, является m-мерной единичной матрицей (m: число элемнтов выборки), является m-мерным вектором со всеми единицами, а является -нормой. HSIC всегда принимает неотрицательное значение и равно нулю тогда и только тогда, когда две случайные переменные статистически независимы при применении универсального производящего ядра, такого как гауссово ядро.

HSIC Lasso можно записать как

где является нормой Фробениуса. Задача оптимизации является задачей Lasso, а потому она может быть эффективно решена с помощью современных методов решения Lasso, таких как двойственный метод обобщённого Лагранжиана[en].

Отбор признаков на основе корреляции

Отбор признаков на основе меры корреляции (англ. Correlation Feature Selection, CFS) оценивает подмножества признаков на базе следующей гипотезы: «Хорошие поднаборы признаков содержат признаки, сильно коррелирующие с классификацией, но не коррелирующие друг с другом»[28][29]. Следующе равенство даёт оценку поднабора признаков S, состоящего из k признаков:

Здесь является средним значением всех корреляций признак-классификация, а является средним всех корреляций признак-признак. Критерий CFS определяется следующим образом:

Переменные и являются корреляциями, но не обязательно коэффициентами корреляции Пирсона или ρ Спирмена[en]. Диссертация Марка Холла не использует ни одну из них, но использует три различных меры связанности, минимальную длину описания (англ. minimum description length, MDL), симметричную неопределённость и Relief[en].

Пусть xi будет индикаторной функцией вхождения в множество для признака fi. Тогда формула выше может быть переписана как задача оптимизации:

Комбинаторные задачи выше являются, фактически, смешанными 0–1 задачами линйного программирования, которые могут быть решены с помощью алгоритма ветвей и границ[30].

Регуляризованные деревья

Было показано, что признаки из дерева решений или ансамбли деревьев избыточны. Недавний метод с названием «регуляризованное дерево»[31] может быть использован для выбора поднабора признаков. Регуляризованные деревья штрафуются с помощью переменной, подобной переменным, выбранным на предыдущих узлах дерева для расщепления текущего узла. Для регуляризованных деревьев нужно строить только одну модель (иди один ансамбль деревьев), а потому вычислительно алгорим эффективен.

Регуляризованные деревья естественным образом работают с численными и категорийными признаками, взаимодействиями и нелинейностями. Они инвариантны относительно масштаба атрибутов (единиц) и нечувствительны к выбросам, а потому требуют малой предварительной обработки данных, такой как нормализация[en]. Регуляризованный случайный лес (англ. Regularized random forest, RRF)[32] является одним из типов регуляризованных деревьев. Управляемый RRF является улучшенным методом RRF, который управляется оценкой важности из обычного случайного леса.

Обзор методов метаэвристики

Метаалгоритм (или метаэвристика) является общим описанием алгоритма, предназначенного для решения трудных (типично, NP-трудных задач) задач оптимизации для которых не имеется никаких методов решения. Обычно метаалгоритм является стохастическим алгоритмом, стремящимся достичь глобального оптимума. Есть много метаалгоритмов от простого локального поиска до сложного алгоритма глобального поиска.

Основные принципы

Методы отбора признаков обычно представлены тремя классами по тому, как они комбинируют алгоритмы выбора и построения модели.

Метод фильтров

Метод фильтров для отбора признаков

Методы фильтров выбирают переменные независимо от модели. Они базируются только на общих признаках, таких как корреляция переменной с предсказанием. Методы фильтров подавляют наименее интересные переменные. Другие переменные будут частью классификации или модели регрессии, использованной для классификации или предсказания. Эти методы очень эффективны по времени вычисления и устойчивы к переобучению[33].

Однако, методы фильтров стремятся к выбору избыточных переменных, поскольку они не учитывают связь между переменными. По этой причине эти методы главным образом используются как методы предварительной обработки.

Метод обёртывания

Метод обёртывания для отбора признаков

Методы обёртывания оценивают поднаборы переменных и позволяют, в отличие от подходов фильтрации, обнаружить возможную взаимосвязь между переменными[34]. Два главных недостатка этих методов:

  • Увеличивается риск переобучения, когда число наблюдений недостаточно.
  • Существенное время вычисления, когда число переменных велико.

Метод вложения

Метод вложения для отбора признаков

Методы вложения были предложены как попытка комбинации преимуществ двух предыдущих методов. Обучающий алгоритм имеет преимущество собственного процесса выбора переменной и осуществляет выбор признаков и классификацию одновременно.

Приложение метаэвристики отбора признаков

Ниже обзор приложений метаалгоритмов отбора признаков, использованных в литературе. Обзор был приведён в тезисах Джулии Хэммон[33].

ПриложениеАлгоритмПодходклассификаторЦенностная
функция
[en]
Ссылка
ОНПВыбор признаков с помощью похожести признаковФильтрr2Фыонг 2005[34]
ОНПГенетический алгоритмОбёрткаDecision TreeПравильность классификации (10-кр)Шах, Кусиак 2004[35]
ОНППоиск восхождением к вершинеФильтр + ОбёрткаНаивный байесовский классификаторПредсказочная остаточная суммаквадртаовЛон 2007[36]
ОНПАлгоритм имитации отжигаНаивный байесовский классификаторПравильность классификации (5-кр)Устункар 2011[37]
Segments paroleАлгоритм муравьиной колонииОбёрткаИскусственная нейронная сетьMSE[en]Аль-ани 2005
MarketingАлгоритм имитации отжигаОбёрткаРегрессияAIC, r2Мейри 2006[38]
EconomyАлгоритм имитации отжига, Генетический алгоритмОбёрткаРегрессияБИККапетаниос 2005[39]
Spectral MassГенетический алгоритмОбёрткаМножественная линейная регрессич, Частные наименьшие квадраты[en]Среднеквадратичная ошибка[en] предсказанияБродхёрст 2007[40]
SpamБинарный метод роя частиц + Мутация[en]ОбёрткаДерево решенийвзвешенная ценаДжанг 2014[14]
МикроматрицаПоиск с запретами + Метод роя частицОбёрткаМетод опорных векторов, Метод k-ближайших соседейЕвклидова метрикаЧанг, Янг 2009[41]
МикроматрицаPSO + Генетический алгоритмОбёрткаМетод опорных векторовПравильность классификации (10-кр)Альба 2007[42]
МикроматрицаГенетический алгоритм + Итеративный локальный поиск[en]ВложенныйМетод опорных векторовПравильность классификации (10-кр)Дювал 2009[43]
МикроматрицаОбёрткаРегрессияАпостериорная вероятностьХанс, Дорба, Вест 2007[44]
МикроматрицаГенетический алгоритмОбёрткаМетод k-ближайших соседейПравильность классификации (Перекрёстная проверка с исключением)Эйткен 2005[45]
МикроматрицаГибридный генетический алгоритм[en]ОбёрткаМетод k-ближайших соседейПравильность классификации (перекрёстная проверка с исключением)Ох, Мун 2004[46]
МикроматрицаГенетический алгоритмОбёрткаМетод опорных векторовЧувствительность и специфичностьСюань 2011[47]
МикроматрицаГенетический алгоритмОбёрткаПопарный метод опорных векторовПравильность классификации (перекрёстная проверка с исключением)Пэн 2003[48]
МикроматрицаГенетический алгоритмВложенныйМетод опорных векторовПравильность классификации (10-кр)Эрнандес 2007[49]
МикроматрицаГенетический алгоритмHybridМетод опорных векторовПравильность классификации (перекрёстная проверка с исключением)Уэрта 2006[50]
МикроматрицаГенетический алгоритмМетод опорных векторовПравильность классификации (10-кр)Муни, Пал, Дас 2006[51].
МикроматрицаГенетический алгоритмОбёрткаМетод опорных векторовEH-DIALL, CLUMPЖурден 2011[52].
Болезнь Альцгеймераt-тест Уэлча[en]Фильтрядерный метод опорных векторовПравильность классификации (10-кр)Чжан 2015[53]
Компьютерное зрение Бесконечный отбор признаков Фильтр Независим Средняя точность[en],
ROC-площадь под кривой
Роффо 2015[54]
Микроматрицы Eigenvector Centrality FS Фильтр Независим Средняя точность, Точность, ROC AUC Роффо, Мельци 2016[55]
XML Симметричный Тау-алгоритм Фильтр Структурная ассоциативная классификация Точность, Покрытие Шахарани, Хаджич 2014

Выбор признаков, вложенных в алгоритмы обучения

Некоторые обучающие алгоритмы осуществляют отбор признаков как часть алгоритма:

  • Техники -регуляризации, такие как разреженная регрессия, LASSO, и -SVM
  • Регуляризованные деревья[31], например, регуляризованный случайный лес, реализованный в пакете RRF[32]
  • Дерево решений[56]
  • Меметический алгоритм[en]
  • Случайный мультиномиальный логит (англ. Random multinomial logit, RMNL)
  • Автокодирующая сеть с узким уровнем
  • Выделение субмодулярных[en] признаков[57][58][59]
  • Выбор признаков на основе локального обучения[60]. По сравнению с традиционными методами данный метод не использует эвристического поиска, может легко справляться с задачами с многими классами, и работает как на линейных, так и нелинейных задачах. Метод также поддержан с теоретической стороны. Численные эксперименты показали, что метод может достичь близкое к оптимальному решение даже в случае, когда данные содержат более 1M незначимых признаков.

См. также


Примечания

  1. 1 2 James, Witten, Hastie, Tibshirani, 2013, с. 204.
  2. 1 2 Bermingham, Pong-Wong, Spiliopoulou и др., 2015, с. 10312.
  3. 1 2 3 Guyon, Elisseeff, 2003.
  4. 1 2 Yang, Pedersen, 1997.
  5. Urbanowicz, Meeker, LaCava, Olson, Moore, 2017.
  6. Forman, 2003, с. 1289–1305.
  7. Zhang, Li, Wang, Zhang, 2013, с. 32–42.
  8. Bach, 2008, с. 33–40.
  9. Zare, 2013, с. S14.
  10. Soufan, Kleftogiannis, Kalnis, Bajic, 2015, с. e0117988.
  11. Figueroa, 2015, с. 162–169.
  12. Figueroa, Neumann, 2013.
  13. Figueroa, Neumann, 2014, с. 4730–4742.
  14. 1 2 Zhang, Wang, Phillips, 2014, с. 22–31.
  15. Garcia-Lopez, Garcia-Torres, Melian, Moreno-Perez, Moreno-Vega, 2006, с. 477–489.
  16. Garcia-Lopez, Garcia-Torres, Melian, Moreno-Perez, Moreno-Vega, 2004, с. 59–68.
  17. Garcia-Torres, Gomez-Vela, Melian, Moreno-Vega, 2016, с. 102-118.
  18. Kraskov, Stögbauer, Andrzejak, Grassberger, 2003.
  19. Einicke, 2018, с. 1097–1103.
  20. Aliferis, 2010, с. 171–234.
  21. 1 2 3 4 Brown, Pocock, Zhao, Luján, 2012, с. 27-66.
  22. Peng, Long, Ding, 2005, с. 1226–1238.
  23. Nguyen, Franke, Petrovic, 2010, с. 1529-1532.
  24. Rodriguez-Lujan, Huerta, Elkan, Santa Cruz, 2010, с. 1491–1516.
  25. 1 2 Vinh, Chan, Romano, Bailey, 2014.
  26. Yang, Moody, 2000, с. 687-693.
  27. Yamada, Jitkrittum, Sigal, Xing, Sugiyama, 2014, с. 185-207.
  28. Hall, 1999.
  29. Senliol, Gulgezen, Yu, Cataltepe, 2008, с. 1-4.
  30. Nguyen, Franke, Petrovic, 2009.
  31. 1 2 Deng, Runger, 2012.
  32. 1 2 RRF: Regularized Random Forest, пакет на языке R в репозитории Comprehensive R Archive Network (CRAN)
  33. 1 2 Hammon, 2013.
  34. 1 2 Phuong, Lin, Altman, 2005, с. 301-309.
  35. Shah, Kusiak, 2004, с. 183–196.
  36. Long, Gianola, Weigel, 2011, с. 247–257.
  37. Ustunkar, Ozogur-Akyuz, Weber, Friedrich, Son, 2011, с. 1207–1218.
  38. Meiri, Zahavi, 2006, с. 842-858.
  39. Kapetanios, 2005.
  40. Broadhurst, Goodacre, Jones, Rowland, Kell, 1997, с. 71-86.
  41. Chuang, Yang, 2009, с. 1689–1703.
  42. Alba, Garia-Nieto, Jourdan, Talbi, 2007.
  43. Duval, Hao, Hernandez, 2009, с. 201-208.
  44. Hans, Dobra, West, 2007, с. 507-516.
  45. Aitken, 2005, с. 148.
  46. Oh, Moon, 2004, с. 1424–1437.
  47. Xuan, Guo, Wang, Liu, Liu, 2011, с. 588–603.
  48. Peng, 2003, с. 358–362.
  49. Hernandez, Duval, Hao, 2007, с. 90-101.
  50. Huerta, Duval, Hao, 2006, с. 34-44.
  51. Muni, Pal, Das, 2006, с. 106-117.
  52. Jourdan, Dhaenens, Talbi, 2011.
  53. Zhang, Dong, Phillips, Wang, 2015, с. 66.
  54. Roffo, Melzi, Cristani, 2015, с. 4202–4210.
  55. Roffo, Melzi, 2016, с. 19-38.
  56. Kohavi, John, 1997, с. 273-324.
  57. Das, Kempe, 2011.
  58. Liu, Wei, Kirchhoff, Song, Bilmes, 2013.
  59. Zheng, Jiang, Chellappa, Phillip, 2014.
  60. Sun, Todorovic, Goodison, 2010, с. 1610-1626.

Литература

Литература для дальнейшего чтения

Ссылки

Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".

Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.

Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .




Текст в блоке "Читать" взят с сайта "Википедия" и доступен по лицензии Creative Commons Attribution-ShareAlike; в отдельных случаях могут действовать дополнительные условия.

Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.

2019-2024
WikiSort.ru - проект по пересортировке и дополнению контента Википедии