База данных ImageNet — проект по созданию и сопровождению массивной базы данных аннотированных изображений, предназначенная для отработки и тестирования методов распознавания образов и машинного зрения. По состоянию на 2016 год в базу данных было записано около десяти миллионов URL с изображениями, которые прошли ручную аннотацию для ImageNet, в аннотациях перечислялись объекты, попавшие на изображение, и прямоугольники с их координатами.[1] База данных с аннотацией и URL изображений от третьих лиц доступна непосредственно через ImageNet, но при этом сами изображения не принадлежат проекту. [2] С 2010 года ведётся проект ILSVRC (ImageNet Large Scale Visual Recognition Challenge - Кампания по широкомасштабному распознаванию образов в ImageNet ), в рамках которого различные программные продукты ежегодно соревнуются в классификации и распознавания объектов и сцен в базе данных ImageNet.
ImageNet использует краудсорсинг для аннотирования изображений.
Аннотации на уровне самих изображений показывают наличие или отсутствие объекта данного класса (например, "на картинке имеется тигр" или "на картинке нет тигров" ). На уровне объекта в аннотацию включается прямоугольник с координатами видимой части объекта. ImageNet использует вариант семантической сети WordNet для категоризации объектов, которая достаточно детализирована, например, породы собак представлены 120 классами. Каждому узлу сети WordNet сопоставлены сотни или тысячи изображений, но в среднем на 2016 год - около 500 изображений. [3]
На август 2017 года в ImageNet 14.197.122 изображения, разбитых на 21.841 категорию.
С 2010 года в рамках проекта ILSVRC проводятся соревнования между исследовательскими группами по классификации объектов. ILSVCR возникла по аналогии с небольшой кампанией 2005 года PASCAL VOC, которая располагала набором из 20 тысяч изображений и 20 классов объектов.[3] Существенный прогресс в распознавании образов был достигнут в 2010 году. В 2011 хорошим результатом считалась ошибка классификации 25%. В 2012 году система глубокого обучения на основе свёрточной нейронной сети смогла достичь 16% ошибки; а в следующие годы ошибка упала до нескольких процентов.[4] В 2015 году исследователи констатировали, что программы в определённых задачах проекта ILSVRC превзошли человеческие способности.[5] Однако, как указывала Ольга Руссаковская, одна из организаторов кампании, программы пока должны определять объекты для одной из тысячи категорий, а люди могут распознать большее количество категорий и (в отличие от программ) могут ещё и обозначить контекст изображений. [6]
В 2014 к кампании подключилось более 50 организаций.[3] В 2015 исследователей из проекта Baidu дисквалифицировали на год потому что они вошли в проект под несколькими разными именами чтобы обойти ограничения по двум поставкам в неделю.[7][8] Позднее Baidu заявило, что руководитель группы был смещён, и что будет установлена специальная панель для научных консультаций.[9]
Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".
Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.
Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .