WikiSort.ru - Не сортированное

ПОИСК ПО САЙТУ | о проекте

Автоматическое обучение машин (AutoML) — это процесс автоматизации сквозного процесса применения обучения машины к задачам реального мира. В типичном приложении обучения машины практический работник должен применить подходящие методы предварительной обработки данных, конструирования признаков, выделения признаков и выбора признаков^[en], которые делают набор данных пригодным для обучения машин. После этих шагов работник должен осуществить выбор алгоритма^[en] и оптимизацию гиперпараметров для максимизации прогнозируемой производительности конечной модели обучения машин. Поскольку многие из этих шагов не могут осуществить люди, не будучи экспертами, был предложен AutoML как основанное на искусственном интеллекте решение для всё возрастающей необходимости применения обучения машин^[1]^[2]. Автоматизация сквозного процесса применения обучения машин даёт преимущество получения более простых решений, более быстрого создания таких решений и моделей, которые часто превосходят модели, построенные вручную.

Цели автоматизации

Автоматическое обучение машин может иметь целью различные стадии процесса обучения машины:^[2]

Автоматическая подготовка данных^[en] и сбор и сохранение данных (из сырых данных и разнообразных форматов)
- Автоматическое определение типа столбца; например, булевские данные, дискретные численные данные, непрерывные числовые значения или текст
- Автоматическое определение смысла столбца; например, цель/метка, поле районирования, числовой признак, текстовая категория или свободный текст
- Автоматическое обнаружение задач; например, двоичная классификация, регрессия, выделение кластеров или ранжирование
Автоматическое конструирование признаков
- Выбор признаков^[en]
- Выделение признаков
- Метаобучение^[en] и перенос обучения^[en]
- Обнаружение и обработка асимметричных данных и/или отсутствующих значений
Автоматический выбор модели
Оптимизация гиперпараметров алгоритма обучения и характеризации
Автоматический выбор каналов по времени, памяти и ограничений сложности
Автоматический выбор метрик оценки / процедур валидации
Автоматическая проверка задач
- Определение утечки
- Определение ошибок в конфигурации
Автоматический анализ полученных результатов
Пользовательские результаты и визуализация для автоматического обучения машин

Примеры

Программное обеспечение различных стадий AutoML:

Оптимизация гиперпараметров и выбор модели

H2O AutoML осуществляет автоматическую подготовку данных, настройку гиперпараметров путём случайного поиска и даёт многоуровневые сборки в распределённой платформе обучения машин.
mlr является пакетом на языке R, который содержит некоторые техники оптимизации гиперпараметров для задач обучения машин.

Полная оптимизация каналов

Auto-WEKA^[3] является уровнем байесовской оптимизации гиперпараметров поверх системы WEKA.
auto-sklearn^[4] является уровнем байесовской оптимизации гиперпараметров поверх системы scikit-learn^[en].
Firefly.ai облачная система для автоматической генерации моделей обучения машин
TPOT^[5]^[6] является библиотекой на языке Python, которая автоматически создаёт и оптимизирует полные каналы обучения машин, используя генетическое программирование.
TransmogrifAI^[7]^[8] является библиотекой на языке/фреймворке Scala/SparkML, созданная компанией Salesforce для автоматического очищения данных, конструирования признаков, выбора модели и оптимизации гиперпараметров
RECIPE^[9] является фреймворком, опирающимся на основанном на грамматике генетическом программировании. Система создаёт индивидуализированные каналы классификации для системы scikit-learn^[en].

Поиск архитектуры глубокой нейронной сети

devol — это пакет на языке Python, который осуществляет поиск архитектуры глубокой нейронной сети, используя генетическое программирование.
Google AutoML для выбора архитектуры модели глубокого обучения.
Auto Keras — это пакет на языке Python с открытым кодом для поиска архитектуры нейронной сети.

См. также

Примечания

↑ "Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms" in KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining.: 847-855.
1 2 Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B, and Larochelle H. AutoML 2014 @ ICML (неопр.). AutoML 2014 Workshop @ ICML. Проверено 28 марта 2018.
↑ Kotthoff, Thornton, Hoos, Hutter, Leyton-Brown, 2017, с. 1-5.
↑ Feurer, Klein, Eggensperger, Springenberg, Blum, Hutter, 2015, с. 2962--2970.
↑ Olson, Urbanowicz, Andrews, Lavender, Kidd, Moore, 2016, с. 123-137.
↑ Olson, Bartley, Urbanowicz, Moore, 2016, с. 485-492.
↑ Shubha Nabar. Open Sourcing TransmogrifAI – Automated Machine Learning for Structured Data - Salesforce Engineering (англ.). Salesforce Engineering (16 August 2018). Проверено 16 августа 2018.
↑ Kyle Wiggers. Salesforce open-sources TransmogrifAI, the machine learning library that powers Einstein (неопр.). VentureBeat (16 августа 2018). — «Once TransmogrifAI has extracted features from the dataset, it’s primed to begin automated model training. At this stage, it runs a cadre of machine learning algorithms in parallel on the data, automatically selects the best-performing model, and samples and recalibrates predictions to avoid imbalanced data.». Проверено 16 августа 2018.
↑ de Sá, Pinto, Oliveira, Pappa, 2017, с. 246–261.

Литература

Kotthoff L., Thornton C., Hoos H. H., Hutter F., Leyton-Brown K. Auto-WEKA 2.0: Automatic model selection and hyperparameter optimization in WEKA // Journal of Machine Learning Research. — 2017.
Feurer M., Klein A., Eggensperger K., Springenberg J., Blum M., Hutter F. Efficient and Robust Automated Machine Learning // Advances in Neural Information Processing Systems 28 (NIPS 2015). — 2015.
Olson R. S., Urbanowicz R. J., Andrews P.C., Lavender N. A., Kidd L., Moore J. H. Automating biomedical data science through tree-based pipeline optimization // Proceedings of EvoStar 2016. — 2016. — DOI:10.1007/978-3-319-31204-0_9. — arXiv:1601.07925.
Olson R. S., Bartley N., Urbanowicz R. J., Moore J. H. Evaluation of a Tree-based Pipeline Optimization Tool for Automating Data Science // Proceedings of EvoBIO 2016. — 2016. — DOI:10.1145/2908812.2908918. — arXiv:1603.06212.
Alex G. C. de Sá, Walter José G. S. Pinto, Luiz Otavio V. B. Oliveira, Gisele L. Pappa. RECIPE: A Grammar-Based Framework for Automatically Evolving Classification Pipelines. — Springer International Publishing, 2017. — (Lecture Notes in Computer Science). — ISBN 9783319556956. — DOI:10.1007/978-3-319-55696-3_16.

Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".

Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.

Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .

Текст в блоке "Читать" взят с сайта "Википедия" и доступен по лицензии Creative Commons Attribution-ShareAlike; в отдельных случаях могут действовать дополнительные условия.

Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.

2019-2025
WikiSort.ru - проект по пересортировке и дополнению контента Википедии

[autoweka1-1] "Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms" in KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining.: 847-855.

[AutoML2014ICML-2] 1 2 Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B, and Larochelle H. AutoML 2014 @ ICML (неопр.). AutoML 2014 Workshop @ ICML. Проверено 28 марта 2018.

[_6c8ca54cc7e6ec1e-3] Kotthoff, Thornton, Hoos, Hutter, Leyton-Brown, 2017, с. 1-5.

[_3acb116ef561f6fa-4] Feurer, Klein, Eggensperger, Springenberg, Blum, Hutter, 2015, с. 2962--2970.

[_880a179b9f6ea09e-5] Olson, Urbanowicz, Andrews, Lavender, Kidd, Moore, 2016, с. 123-137.

[_36b140a20ac424cf-6] Olson, Bartley, Urbanowicz, Moore, 2016, с. 485-492.

[engi_Open-7] Shubha Nabar. Open Sourcing TransmogrifAI – Automated Machine Learning for Structured Data - Salesforce Engineering (англ.). Salesforce Engineering (16 August 2018). Проверено 16 августа 2018.

[vent_Sale-8] Kyle Wiggers. Salesforce open-sources TransmogrifAI, the machine learning library that powers Einstein (неопр.). VentureBeat (16 августа 2018). — «Once TransmogrifAI has extracted features from the dataset, it’s primed to begin automated model training. At this stage, it runs a cadre of machine learning algorithms in parallel on the data, automatically selects the best-performing model, and samples and recalibrates predictions to avoid imbalanced data.». Проверено 16 августа 2018.

[_6a02e861b9dd1baa-9] Sá, Pinto, Oliveira, Pappa, 2017, с. 246–261.