DBpedia | |
---|---|
![]() | |
URL | dbpedia.org |
Коммерческий | нет |
Тип сайта | база знаний и онлайн-база данных |
Язык(-и) | Scala, Java, Virtuoso Server Pages |
Язык программирования | Scala и Java |
Владелец | Лейпцигский университет и Университет Мангейма |
Начало работы | 10 января 2007 |
Рейтинг Alexa | 102 111[1] |
![]() |
DBpedia — краудсорсинговый проект, направленный на извлечение структурированной информации из данных, созданных в рамках проекта Википедия и публикации её в виде доступных под свободной лицензией наборов данных. Проект был отмечен Тимом Бернерсом-Ли как один из наиболее известных примеров реализации концепции связанных данных[2].
Проект был начат группой добровольцев из Свободного университета Берлина и Лейпцигского университета, в сотрудничестве с фирмой OpenLink Software, первый набор данных опубликован в 2007 году. С 2012 года активным участником проекта является Университет Мангейма.
По состоянию на сентябрь 2014 года базы данных DBpedia описывают более 4,58 млн понятий, из которых 4,22 млн классифицированы в соответствии с онтологией, в том числе 1,445 млн персоналий, 735 тыс. географических объектов, 123 тыс. музыкальных альбомов, 87 тыс. фильмов, 19 тыс. видеоигр, 241 тыс. организаций, 251 тыс. таксонов и 6 тыс. заболеваний. DBpedia содержит 38 млн меток и аннотаций на 125 языках; 25,2 млн ссылок на изображения и 29,8 млн ссылок на внешние веб-страницы; 50 млн внешних ссылок на другие базы данных RDF-формата, 80,9 млн категорий Википедии.
Проект использует Resource Description Framework (RDF) для представления извлечённой информации, на сентябрь 2014 года базы состоят из более чем 3 млрд RDF-троек, из которых 580 млн были взяты из английского раздела Википедии и 2,46 млрд извлечены из разделов на других языках.
Одна из проблем при извлечении информации из Википедии состоит в том, что одни и те же понятия могут быть выражены в шаблонах разными способами, например, понятие «место рождения» может быть сформулировано в английском языке как «birthplace» и как «placeofbirth». Из-за этой неоднозначности запрос проходит по обоим вариантам для получения более достоверного результата. Для облегчения поиска при сокращении количества синонимов был разработан специальный язык — DBpedia Mapping Language, а у пользователей DBpedia появилась возможность повышать качество извлечения данных с помощью сервиса Mapping.
DBpedia извлекает фактическую информацию со страниц Википедии, позволяя пользователям найти ответы на вопросы в ситуациях, когда требуемая информация находится в нескольких различных статьях Википедии. Например, чтобы найти все работы иллюстратора манги Tokyo Mew Mew возможно выполнить следующий SPARQL-запрос[3]:
PREFIX dbprop: <http://dbpedia.org/property/>
PREFIX db: <http://dbpedia.org/resource/>
SELECT ?who ?work ?genre WHERE {
db:Tokyo_Mew_Mew dbprop:illustrator ?who .
?work dbprop:author ?who .
OPTIONAL { ?work dbprop:genre ?genre } .
}
Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".
Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.
Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .