Карен Спарк Джонс
Карен Спарк Джонс (26 серпня 1935, Гаддерсфілд — 4 квітня 2007, Кембриджшир) — британський учений в галузі інформатики. Член британської академії. Спарк зробила значний внесок у дві окремі області: інформаційний пошук (ІП) та обробка природної мови (ОПМ). В останні роки свого життя вона займалася інтеграцією цих напрямків в основні блок-схеми штучного інтелекту. Її найбільш важливим внеском є створення концепції обліку ваги слів зворотної частоти документа (IDF), яку вона описала в статті в 1972 році. На сьогоднішній день IDF використовується в багатьох пошукових системах, зазвичай, у складі схеми TF-IDF.
Зміст
Походження
Карен Спарк Джонс народилася в місті Гаддерсфілді графства Йоркшир в Англії. Її батьком був Оуен Джонс — викладач хімії, а матір'ю — норвежка Іда Спарк, яка переїхала до Великої Британії під час Другої світової війни. Оуен і Іда покинули Норвегію на одному з останніх кораблів після німецького вторгнення 1940 року.
Кар'єра
Карен Спарк Джонс навчалася в гімназії Гаддерсфілд, а потім в Кембріджському коледжі з 1953 по 1956 рік. Там вивчала історію, але на останньому році навчання захопилася філософією (тоді вона називалася Моральні науки (англ. Moral Sciences))і після закінчення навчання прийняла запрошення Маргарет Мастерман на вступ до мовно дослідного відділу Кембриджського університету. Перш ніж перейти до дослідницької роботи в галузі інформатики, вона недовго пропрацювала вчителем в школі.
Стаття, написана Спарк спільно з Мастерман та Нідгемом, і опублікована у 1958 році, називається «Аналогія між машинним перекладом та пошуком в бібліотеці». 1968 року Спарк перевели з ЯІОКУ в комп'ютерну лабораторію при Кембриджському університеті Ньюнгем-колледжа. До того часу вона вже 3 роки була співробітником Ньюнгем-коледжу. А потім стала членом Лондонської королівської спільноти. Там вона почала свою кар'єру в області ІП, в якій вона стала світовим авторитетом.
До того, як Спарк була переведена в Кембриджський університет, вона написала дисертацію на тему «Синонімія та семантична класифікація» 1964 року при Кембриджському мовному дослідницькому підрозділі під керівництвом Маргарет Мастерман та її чоловіка, філософа Річарда Брейтуейта. Ця робота сильно випереджала свій час і була опублікована лише двадцять років потому в статті на тему ШІ в Единбургському університеті. Насправді, це було перше застосування статистичних методів кластеризації для лексичних даних. Це було амбітною спробою створити деяке уявлення про примітивні поняття машинного перекладу на емпіричній основі. Алгоритми, які вона використовувала, були з теорії про «згустки» («Theory of Clumps»). Основним джерелом натхнення для Спарк був її чоловік Роджер Нідгем і її керівник Маргарет Мастерман.
У 1982 році вона взяла участь у Альві Програма.
Щорічна Премія Карен Спарк Джонс лекція названа на її честь.
У серпні 2017 р Університет Хаддерсфілда на її честь перейменована одну зі своїх будівель кампусу. Раніше відомий як Canalside West, у будівлі Спарка Джонса розміщується університетська школа обчислювальної техніки та техніки.
Карен Спарк Джонс розробила технологію пошуку та видачі інформації, яка дозволила рядовим користувачам складати пошукові запити зі звичайних слів замість рівнянь і кодів. Результатом цього прориву стали сучасні пошукові машини, в тому числі і Google.
На роботи Карен навіть зараз спираються в розробці штучного інтелекту! А її пристрасть до роботи досі надихає сотні програмістів у всьому світі на нові звершення.
Концепція IDF
Карен Спарк Джонс зробила значний внесок у галузі: ІП і ОЕЯ, а також створила концепцію обліку вагів слів зворотної частоти документа (IDF), яку вона описала в статті в 1972-му році. IDF (inverse document frequency — зворотна частота документа) — інверсія частоти, з якою деяке слово зустрічається в документах колекції. Облік IDF зменшує вагу широковживаних слів. Для кожного унікального слова в межах конкретної колекції документів існує лише одне значення ID. Проводиться щорічна лекція «British Computer Society», названа на її честь. Протягом її кар'єри в галузі інформатики, вона намагалася залучити жінок для роботи в даній області (її гасло — «обчислення занадто важливі, щоб залишати їх чоловікам»), а також була хорошим наставником для студентів.
Останні роки життя
Карен Спарк Джонс померла від раку 4-го квітня 2007 року в місті Уіллінгемі графства Кембриджшир. Була організована та проведена зустріч в комп'ютерній лабораторії Кембриджського університету, щоб віддати данину пам'яті та поваги.
Особисте життя
Карен Спарк Джонс була заміжня за своїм товаришем, ученим Кембриджського університету Роджером Нідгемом. Вони побудували свій будинок в селі Котон (близько 3 км на захід від Кембриджа в графстві Кембриджшир, Англія). Вранці вони працювали вдома, повертаючись на своє робоче місце лише після полудня. Вони жили довго та щасливо в скромному дерев'яному будинку протягом багатьох років, поки шум від шосе М11 не змусив їх покинути це місце.
Пошана
- Співробітник Британська академія, віце-президентом якої вона була у 2000–2002 рр
- Співробітник AAAI
- Співробітник ECCAI
- Президент Асоціація обчислювальної лінгвістики у 1994 році
Нагороди
- Премія Жерара Солтона[en] Премія Жерара Солтона (1988)
- Американське суспільство з інформатики та технологіям (англ.) Award of Merit (2002)
- ACL Lifetime Achievement Award (2004)
- Британське комп'ютерне суспільство
- Медаль Лавлейс
- ACM-AAAI Allen Newell Award (2007)