WikiSort.ru - Не сортированное

ПОИСК ПО САЙТУ | о проекте

C4.5 — алгоритм для построения деревьев решений, разработанный Джоном Квинланом (англ. John Ross Quinlan). C4.5 является усовершенствованной версией алгоритма ID3 того же автора. В частности, в новую версию были добавлены отсечение ветвей (англ. pruning), возможность работы с числовыми атрибутами, а также возможность построения дерева из неполной обучающей выборки, в которой отсутствуют значения некоторых атрибутов.

Требования к данным

  • Описание атрибутов. Данные должны быть представлены в виде плоской таблицы. Вся информация об объектах (примерах) из предметной области должна описываться в виде конечного набора признаков (атрибутах). Каждый атрибут должен иметь дискретное или числовое значение. Сами атрибуты не должны меняться от примера к примеру, и количество атрибутов должно быть фиксированным для всех примеров.
  • Определенные классы. Каждый пример должен быть ассоциирован с конкретным классом, т.е. один из атрибутов должен быть выбран в качестве метки класса.
  • Дискретные классы. Классы должны быть дискретными, т.е. иметь конечное число значений. Каждый пример должен однозначно относиться к конкретному классу. Случаи, когда примеры принадлежат к классу с вероятностными оценками, исключаются. Количество классов должно быть значительно меньше количества примеров.

Построение дерева

Реализации

  • J48 — реализация на языке Java, входит в пакет Weka[1].
  • C5.0 (для Linux) / See5 (для Windows) — реализация Квинлана на языке C.

Примечания

  1. Weka.Classifiers.Trees: J48 (англ.). Документация на Sourceforge. Проверено 18 февраля 2012. Архивировано 12 сентября 2012 года.

Литература

  • Паклин Н.Б., Орешков В.И. Глава 9. // Бизнес-аналитика: от данных к знаниям(+CD): Учебное пособие. 2-е изд.. — СПб: Питер, 2013. — С. 444-459. ISBN 978-5-459-00717-6.
  • Quinlan J. R. Learning With Continuous Classes (англ.) // Proceedings of the 5th Australian Joint Conference on Artificial Intelligence. — 1992. — P. 343—348. ISBN 978-9810-2125-06.
  • Quinlan J. R. C4.5: Programs for Machine Learning. San Mateo: Morgan Kaufmann Publishers Inc., 1993. — 302 p. ISBN 1-5586-0238-0.  (англ.)
  • Quinlan J. R. Improved Use of Continuous Attributes in C4.5 (англ.) // Journal of Artificial Intelligence Research. — 1996. — Vol. 4. — P. 77—90. ISSN 1076-9757. DOI:10.1613/jair.279.

Ссылки

Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".

Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.

Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .




Текст в блоке "Читать" взят с сайта "Википедия" и доступен по лицензии Creative Commons Attribution-ShareAlike; в отдельных случаях могут действовать дополнительные условия.

Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.

2019-2024
WikiSort.ru - проект по пересортировке и дополнению контента Википедии