WikiSort.ru - Не сортированное

ПОИСК ПО САЙТУ | о проекте
Карен Спарк Джонс

Карен Спарк Джонс в 2002 году
Дата рождения 26 августа 1935(1935-08-26)
Место рождения Хаддерсфилд, Йоркшир
Дата смерти 4 апреля 2007(2007-04-04) (71 год)
Место смерти Уиллингем
Страна  Великобритания
Научная сфера Информатика
Место работы Компьютерная лаборатория Кембриджского университета
Альма-матер Кембриджский университет
Научный руководитель Ричард Брейтуэйт
Известна как Создатель концепции IDF
Награды и премии ACL Lifetime Achievement Award, BCS Lovelace Medal, ACM-AAAI Allen Newell Award, ACM SIGIR Salton Award, American Society for Information Science and Technology’s Award of Merit
Сайт cl.cam.ac.uk/archive/ksj21

Карен Спарк Джонс (член британской академии[⇨]; 26 августа 1935 — 4 апреля 2007) британский учёный в области информатики.

Спарк внесла значительный вклад в две отдельные области: информационный поиск (ИП) и обработка естественного языка (ОЕЯ). В последние годы своей жизни она занималась интеграцией этих направлений в основные блок-схемы ИИ. Её наиболее важным вкладом является создание концепции учёта весов слов обратной частоты документа (IDF), которую она описала в статье в 1972-м году[⇨]. На сегодняшний день IDF используется во многих поисковых системах, как правило, в составе схемы TF-IDF.

Биография

Происхождение

Карен Спарк Джонс [1][2] родилась в городе Хаддерсфилде графства Йоркшир в Англии. Её отцом был Оуэн Джонс — преподаватель химии, а матерью — норвежка Ида Спарк, которая переехала в Великобританию во время Второй мировой войны. Оуэн и Ида покинули Норвегию на одном из последних кораблей после немецкого вторжения в 1940 году.[3]

Карьера

Карен Спарк Джонс обучалась в гимназии Хаддерсфилд, а затем в Кембриджском колледже с 1953 по 1956 года. Там изучала историю, но на последнем году обучения увлеклась философией (тогда она называлась Моральные науки (англ. Moral Sciences)) и после окончания обучения приняла приглашение Маргарет Мастерман (англ.)[4] на вступление в языковой исследовательский отдел Кембриджского университета (ЯИОКУ). Прежде чем перейти к исследовательской работе в области информатики, она недолго проработала учителем в школе.

Статья, написанная Спарк совместно с Мастерман и Нидхемом, и опубликованная в 1958 году, называется «Аналогия между машинным переводом и поиском в библиотеке»[5]. В 1968 году Спарк перевели из ЯИОКУ в компьютерную лабораторию при Кембриджском университете (англ.), к тому времени она уже 3 года была сотрудником Ньюнхем-колледжа (англ.), а затем стала членом Лондонского королевского общества. Там она начала свою карьеру в области ИП, в которой она стала мировым авторитетом.

До того, как Спарк была переведена в Кембриджский университет, она написала диссертацию на тему «Синонимия и семантическая классификация» в 1964 году при Кембриджском языковом исследовательском подразделении под руководством Маргарет Мастерман и её мужа, философом Ричардом Брейтуэйтом (англ.). Эта работа сильно опережала своё время и была опубликована лишь двадцать лет спустя в статье по теме ИИ в Эдинбургском университете. На самом деле, это было первое применение статистических методов кластеризации для лексических данных. Это было амбициозной попыткой создать некоторое представление о примитивных понятиях машинного перевода на эмпирической основе. Алгоритмы, которые она использовала, были из теории о «сгустках» («Theory of Clumps»). Они были разработаны и использованы её мужем Роджером Нидхемом в его дипломной работе по автоматической классификации, и те, которые она использовала, когда начала работать в компьютерной лаборатории при Кембриджском университете. Основным источником вдохновения для Спарк был её муж Роджер Нидхем и её руководитель Маргарет Мастерман[4].

Концепция IDF

Карен Спарк Джонс внесла значительный вклад в области: ИП и ОЕЯ.[6], а также создала концепцию учёта весов слов обратной частоты документа (IDF), которую она описала в статье в 1972-м году.[7] IDF (inverse document frequency — обратная частота документа) — инверсия частоты, с которой некоторое слово встречается в документах коллекции. Учёт IDF уменьшает вес широкоупотребительных слов. Для каждого уникального слова в пределах конкретной коллекции документов существует только одно значение IDF.

Проводится ежегодная лекция «British Computer Society», названная в её честь[8]. На протяжении её карьеры в области информатики, она пыталась привлечь женщин для работы в данной области[3] (её лозунг — «вычисления слишком важны, чтобы оставлять их мужчинам»), а также была хорошим наставником для студентов[9].

Последние годы жизни

Карен Спарк Джонс умерла от рака 4-го апреля 2007 года в городе Уиллингеме графства Кембриджшир. Была организована и проведена встреча в компьютерной лаборатории Кембриджского университета, чтобы воздать дань памяти и уважения. [10]

Личная жизнь

Карен Спарк Джонс была замужем за своим товарищем, учёным Кембриджского университета Роджером Нидхемом. Они построили свой дом в деревне Котон (англ.) (около 3 км к западу от Кембриджа в графстве Кембриджшир, Англия). По утрам они работали дома, возвращаясь на своё рабочее место лишь после полудня. Они жили долго и счастливо в скромном деревянном доме на протяжении многих лет, пока шум от шоссе М11 (англ.) не заставил их покинуть это место.[11]

Почести

  • Член британской академии, в которой она была вице-президентом в феврале 2000 года;
  • Член AAAI;
  • Член ECCAI;
  • Стала президентом Association for Computational Linguistics в 1994 году.

Награды

Примечания

Ссылки

  • Karen Spärck Jones. Synonymy and Semantic Classification (thesis published as a book) : [англ.]. — Edinburgh University Press, 1986. — Vol. 1.
  • Karen Spärck Jones lecture (англ.). British Computer Society (23.05.2013). — In Memoriam Karen Spärck Jones. Проверено 12 ноября 2013.
  • Karen Spärck Jones biography (англ.). The telegraph (24.04.2007). — Biography of the Karen Spärck Jones. Проверено 12 ноября 2013.

Дополнительная литература

Ссылки

Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".

Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.

Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .




Текст в блоке "Читать" взят с сайта "Википедия" и доступен по лицензии Creative Commons Attribution-ShareAlike; в отдельных случаях могут действовать дополнительные условия.

Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.

2019-2025
WikiSort.ru - проект по пересортировке и дополнению контента Википедии