Розподілені системи
Зміст
Розподілені системи
Поняття розподільна система
У літературі можна знайти різні визначення розподілених систем, причому жодне з них не є задовільним і не узгоджується з іншими. Для викладення даної статті вистачить доволі простої характеристики.
Розподілена система — це набір незалежних комп'ютерів, що представляється їх користувачам єдиною об'єднаною системою.
У цьому визначенні обмовляються два моменти. Перший відноситься до апаратури: всі машини автономні. Другий стосується програмного забезпечення: користувачі думають, що мають справу з єдиною системою. Важливо обидва моменти. Можливо, замість того щоб розглядати визначення, розумніше буде зосередитися на важливих характеристиках розподілених систем. Перша з таких характеристик полягає в тому, що від користувачів приховані відмінності між комп'ютерами і способи зв'язку між ними. Те ж саме відноситься і до зовнішньої організації розподілених систем. Іншою важливою характеристикою розподілених систем є спосіб, за допомогою якого користувачі і додатки одноманітно працюють в розподілених системах, незалежно від того, де і коли відбувається їх взаємодія. Розподілені системи повинні також відносно легко піддаватися розширенню, або масштабуванню. Ця характеристика є прямим наслідком наявності незалежних комп'ютерів, але в той же час не указує, яким чином ці комп'ютери насправді об'єднуються в єдину систему. Розподілені системи зазвичай існують постійно, проте деякі їх частини можуть тимчасово виходити з ладу. Користувачі і додатки не повинні повідомлятися про те, що ці частини замінені або полагоджені або що додані нові частини для підтримки додаткових користувачів або додатків. Для того, щоб підтримати представлення різних комп'ютерів і мереж у вигляді єдиної системи, організація розподілених систем часто включає додатковий рівень програмного забезпечення, що знаходиться між верхнім рівнем, на якому знаходяться користувачі і додатки, і нижнім рівнем, що складається з операційних систем, як показано на рис. 1. Відповідно, така розподілена система зазвичай називається системою проміжного рівня (middleware).
Рис.1. Розподілена системо організована у вигляді служби проміжного рівня
Наведемо деякі приклади розподілених систем.
Як перший приклад розглянемо мережу робочих станцій в університеті або відділі компанії. Додатково до персональної робочої станції кожного з користувачів є пул процесорів машинного залу, не призначених наперед жодному з користувачів, але що динамічно виділяються їм при необхідності. Ця розподілена система може володіти єдиною файловою системою, в якій всі файли однаково доступні зі всіх машин з використанням постійного шляху доступу. Крім того, коли користувач набирає команду, система може знайти якнайкраще місце для виконання запрошуваної дії, можливо, на власній робочій станції користувача, можливо, на простоюючій робочій станції, що належить комусь іншому, а може бути, і на одному з вільних процесорів машинного залу. Якщо система в цілому виглядає і поводиться як класична однопроцесорна система з розділенням часу (тобто розрахована на багато користувачів), вона вважається розподіленою системою.
Як другий приклад розглянемо роботу інформаційної системи, яка підтримує автоматичну обробку замовлень. Зазвичай подібні системи використовуються співробітниками декількох відділів, можливо в різних місцях. Так, співробітники відділу продажів можуть бути розкидані по обширному регіону або навіть по всій країні. Замовлення передаються з переносних комп'ютерів, що сполучаються з системою за допомогою телефонної мережі, а можливо, і за допомогою стільникових телефонів. Замовлення, що приходять, автоматично передаються у відділ планування, перетворюючись там на внутрішні замовлення на постачання, які поступають у відділ доставки, і в заявки на оплату, що поступають в бухгалтерію. Система автоматично пересилає ці документи співробітникам, що є на місці, відповідають за їх обробку. Користувачі залишаються в повному невіданні про те, як замовлення насправді курсують усередині системи, для них все це представляється так, ніби вся робота відбувається в централізованій базі даних.
Як останній приклад розглянемо World Wide Web. Web надає просту, цілісну і одноманітну модель розподілених документів. Щоб побачити документ, користувачеві досить активізувати посилання. Після цього документ з'являється на екрані. У теорії (але безумовно не в поточній практиці) немає необхідності знати, з якого сервера доставляється документ, достатньо лише інформації про те, де він розташований. Публікація документа дуже проста: ви повинні тільки задати йому унікальне ім'я у формі уніфікованого покажчика ресурсу (Uniform Resource Locator, URL), яке посилається на локальний файл з вмістом документа. Якби Усесвітня павутина представлялася своїм користувачам гігантською централізованою системою документообігу, вона також могла б вважатися розподіленою системою. На жаль, цей момент ще не наступив. Так, користувачі усвідомлюють, що документи знаходяться в різних місцях і розподілені по різних серверах.
Концепції побудови розподілених систем
Апаратна побудова розподілених систем
Не дивлячись на те що всі розподілені системи містять по декілька процесорів, існують різні способи їх організації в систему. Особливо це відноситься до варіантів їх з'єднання і організації взаємного обміну. У цьому розділі ми стисло розглянемо апаратне забезпечення розподілених систем, зокрема варіанти з'єднання машин між собою. Предметом нашого обговорення в наступному розділі буде програмне забезпечення розподілених систем. За минулі роки було запропоновано безліч різних схем класифікації комп'ютерних систем з декількома процесорами, але жодна з них не стала дійсно популярною і широко поширеною. Нас цікавлять виключно системи, побудовані з набору незалежних комп'ютерів. На мал. 1.4 ми підрозділяємо всі комп'ютери на дві групи. Системи, в яких комп'ютери використовують пам'ять спільно, зазвичай називаються мультипроцесорами (multiprocessors), а що працюють кожен з своєю пам'яттю — мульткомп'ютерами (multicomputer). Основна різниця між ними полягає в тому, що мультипроцесори мають єдиний адресний простір, спільно використовуваний всіма процесорами. Якщо один з процесорів записує, наприклад, значення 44 за адресою 1000, будь-який інший процесор, який після цього прочитає значення, лежаче за адресою 1000, отримає 44. Всі машини задіюють одну і ту ж пам'ять. На відміну від таких машин в мультікомпиотерах кожна машина використовує свою власну пам'ять. Після того, як один процесор запише значення 44 за адресою 1000, інший процесор, прочитавши значення, лежаче за адресою 1000, набуде того значення, яке зберігалося там раніше. Запис за цією адресою значення 44 іншим процесором ніяк не позначиться на вмісті його пам'яті. Типовий приклад мультикомпьютера — декілька персональних комп'ютерів, об'єднаних в мережу. Кожна з цих категорій може бути підрозділена на додаткові категорії на основі архітектури сполучаючої їх мережі. На мал.2 цю дві архітектуру позначено як шинна (bus) і комутована (switched). Під шиною розуміється одиночна мережа, плата, шина, кабель або інше середовище, що сполучає всі машини між собою. Подібну схему використовує кабельне телебачення: кабельна компанія протягує уздовж вулиці кабель, а всім підписчикам робляться відведення від основного кабелю до їх телевізорів.
Рис.2 Різні базові архітектури процесорів та пам'яті розподілених комп'ютерних систем
Комутаційні системи, на відміну від шинних, не мають єдиної магістралі, такий як у кабельного телебачення. Замість неї від машини до машини тягнуться окремі канали, виконані із застосуванням різних технологій зв'язку. Повідомлення передаються по каналах з ухваленням явного рішення про комутацію з конкретним вихідним каналом для кожного з них. Така організована глобальна телефонна мережа. Ми проведемо також розділення розподілених комп'ютерних систем на гомогенні (homogeneous) і гетерогенні (heterogeneous). Це розділення застосовується виключно до мультикомпьютерным систем. Для гомогенних муль-тікомпьютерних систем характерна одна сполучаюча комп'ютери мережа, що використовує єдину технологію. Однакові також і всі процесори, які в основному мають доступ до однакових об'ємів власної пам'яті. Гомогенні мультикомпьютерные системи нерідко використовуються як паралельні (що працюють з одним завданням), в точності як мультипроцесорні. На відміну від них гетерогенні мультикомпьютерные системи можуть містити цілу гамму незалежних комп'ютерів, сполучених різноманітними мережами. Так, наприклад, розподілена комп'ютерна система може бути побудована з декількох локальних комп'ютерних мереж, сполучених комутованою магістраллю FDDI або АТМ. У наступних трьох пунктах я стисло розгляну мультипроцесорні, а також гомогенні і гетерогенні мультикомп'ютерні системи. Не дивлячись на те, що ці питання не пов'язані безпосередньо з нашою основною темою, розподіленими системами, вони допомагають краще за її зрозуміти, оскільки організація розподілених систем часто залежить від вхідної в їх склад апаратури.
* Мультипроцесори * Гомогенні мультикомп'ютерні системи * Гетерогенні мультикомп'ютерні системи
Програмна побудова розподілених ситем
Програмна побудова розподілених ситем Материал из WIKI. Перейти к: навигация, поиск
Апаратура важлива для розподілених систем, проте від програмного забезпечення значно сильніше залежить, як така система виглядатиме насправді. Розподілені системи дуже схожі на традиційні операційні системи. Перш за все, вони працюють як менеджери ресурсів (resource managers) існуючого апаратного забезпечення, які допомагають безлічі користувачів і додатків спільно використовувати такі ресурси, як процесори, пам'ять, периферійні пристрої, мережу і дані всіх видів. По-друге, що, ймовірно, більш важливо, розподілена система приховує складність і гетерогенну природу апаратного забезпечення, на базі якого вона побудована, надаючи віртуальну машину для виконання додатків. Щоб зрозуміти природу розподіленої системи, розглянемо спочатку операційні системи з погляду розподіленості. Операційні системи для розподілених комп'ютерів можна начорно розділити на дві категорії — сильно зв'язані і слабо зв'язані системи. У сильно зв'язаних системах операційна система в основному прагне працювати з одним, глобальним представленням ресурсів, якими вона управляє. Слабо зв'язані системи можуть представлятися нетямущій людині набором операційних систем, кожна з яких працює на власному комп'ютері. Проте ці операційні системи функціонують спільно, роблячи власні служби доступними іншим. Це ділення на сильно і слабо зв'язані системи пов'язано з класифікацією апаратного забезпечення. Сильно зв'язані операційні системи зазвичай називаються розподіленими операційними системами (Distributed Operating System, DOS) і використовуються для управління мультипроцесорними і гомогенними мультикомпьютерными системами. Як і у традиційних однопроцесорних операційних систем, основна мета розподіленої операційної системи полягає в захованні тонкощів управління апаратним забезпеченням, яке одночасно використовується безліччю процесів. Слабо зв'язані мережеві операційні системи (Network Operating Systems, NOS) використовуються для управління гетерогенними мультикомпьютерными системами. Хоча управління апаратним забезпеченням і є основним завданням мережевих операційних систем, вони відрізняються від традиційних. Ця відмінність витікає з того факту, що локальні служби повинні бути доступними для видалених клієнтів. У наступних пунктах ми розглянемо в першому наближенні ті та інші. Щоб дійсно скласти розподілену систему, служб мережевої операційної системи недостатньо. Необхідно додати до них додаткові компоненти, щоб організувати кращу підтримку прозорості розподілу. Цими додатковими компонентами будуть засоби, відомі як системи проміжного рівня (middleware), які і лежать в основі сучасних розподілених систем. Засоби проміжного рівня також обговорюються в цьому розділі. У табл.1 представлені основні дані по розподілених і мережевих операційним системам, а також засобам проміжного рівня.
Система | Опис | Основне призначення |
---|---|---|
Розподілені операційні системи | Сильно зв'язані операційні системи для мультипроцесорів і гомогенних мультикомпьютерных систем | Заховання і управління апаратним забезпеченням |
Мережеві операційні системи | Слабо зв'язані операційні системи для гетерогенних мультикомпьютерных систем (локальних або глобальних мереж) | Надання локальних служб віддаленим клієнтам |
Засоби проміжного рівня | Додатковий рівень поверх мережевих операційних систем, що реалізовує служби загального призначення | Забезпечення прозорості розподілу |
В даній статті ми докладніше зупинимося на мережевих операційних системах.
Комп'ютерні мережі, як частковий випадок розподілених систем
Комп'ютерні мережі належать до розподілених (або децентралізованих) обчислювальним систем. У обчислювальних мережах програмні й апаратні зв'язки є ще слабшими, а автономність обробних блоків простежується найбільшою мірою – основними елементами мережі є стандартні комп'ютери, що не мають ні спільних блоків пам'яті, ні спільних периферійних пристроїв. Зв'язок між комп'ютерами здійснюється за допомогою спеціальних периферійних пристроїв – мережевих адаптерів, сполучених відносно протяжними каналами зв'язку. Кожний комп'ютер працює під керуванням власної операційної системи, а якась «спільна» операційна система, що розподіляє роботу між комп'ютерами мережі, відсутня. Взаємодія між комп'ютерами мережі відбувається за рахунок передачі повідомлень через мережеві адаптери і канали зв'язку. За допомогою цих повідомлень один комп'ютер звичайно запитує доступ до локальних ресурсів іншого комп'ютера. Такими ресурсами можуть бути як дані, що зберігаються на диску, так і різноманітні периферійні пристрої – принтери, модеми, факси-апарати і т.д. Поділ локальних ресурсів кожного комп'ютера між усіма користувачами мережі – основна мета створення обчислювальної мережі. На тих комп'ютерах, ресурси яких повинні бути доступні всім користувачам мережі, необхідно встановити модулі, що постійно будуть знаходитися в режимі чекання запитів, які надходять мережею від інших комп'ютерів. Зазвичай такі модулі називаються програмними серверами (server), тому що їхнє головне завдання – обслуговувати (serve) запити на доступ до ресурсів свого комп'ютера. На комп'ютерах, користувачі яких хочуть одержувати доступ до ресурсів інших комп'ютерів, також потрібно додати до операційної системи деякі спеціальні програмні модулі, що повинні виробляти запити на доступ до віддалених ресурсів і передавати їх мережею на потрібний комп'ютер. Такі модулі звичайно називають програмними клієнтами (client). Власне ж мережеві адаптери і канали зв'язку вирішують у мережі достатньо просте завдання – вони передають повідомлення з запитами і відповідями від одного комп'ютера до іншого, а основну роботу з організації спільного використання ресурсів виконують клієнтські і серверні частини операційних систем. Пара модулів «клієнт – сервер» забезпечує спільний доступ користувачів до визначеного типу ресурсів, наприклад до файлів. У цьому випадку говорять, що користувач має справу з файловою службою (service). Звичайно мережева операційна система підтримує декілька видів мережевих служб для своїх користувачів – файлову службу, службу друку, службу електронної пошти, службу віддаленого доступу і т.п. У технічній літературі англомовний термін «service» звичайно перекладається як «служба», «сервіс». Часто ці терміни використовуються як синоніми. Водночас, деякі спеціалісти розрізняють термін «служба», з одного боку, і терміни «сервіс» і «послуга», з іншого. Під «службою» розуміється мережевий компонент, що реалізує деякий набір послуг, а «сервісом» називають опис того набору послуг, що надається даною службою. Таким чином, сервіс – це інтерфейс між споживачем послуг і постачальником послуг (службою). Терміни «клієнт» і «сервер» використовуються не тільки для позначення програмних модулів, але і комп'ютерів, підключених до мережі. Якщо комп'ютер надає свої ресурси іншим комп'ютерам мережі, то він називається сервером, а якщо він їх споживає – клієнтом. Іноді один комп'ютер може одночасно виступати і в ролі сервера, і в ролі клієнта. Мережеві служби завжди є розподіленими програмами. Розподілена програма – це програма, що складається з декількох частин, які взаємодіють, причому кожна частина, як правило, реалізується на окремому комп'ютері мережі. В мережі можуть виконуватися і розподілені користувацькі програми. Розподілений додаток також складається з декількох частин, кожна з яких виконує якусь визначену закінчену роботу з розв’язання прикладного завдання. Наприклад, одна частина додатку, що виконується на комп'ютері користувача, може підтримувати спеціалізований графічний інтерфейс, друга – працювати на потужному виділеному комп'ютері і займатися статистичною обробкою введених користувачем даних, а третя – заносити отримані результати в базу даних на комп'ютер із встановленою стандартною СУБД. Розподілені додатки повною мірою використовують потенційні можливості розподіленої обробки, надані обчислювальною мережею, і тому часто називаються мережевими додатками. Варто підкреслити, що не кожен додаток, що виконується у мережі, є мережевим. Існує велика кількість популярних додатків, що не є розподіленими і повністю виконуються на одному комп'ютері мережі. Проте і такі додатки можуть використовувати переваги мережі за рахунок умонтованих в операційну систему мережевих служб. Більшість додатків, які виконувалися у локальних мережах у середині 80-х років, були звичайними, нерозподіленими додатками. І це зрозуміло – вони були написані для автономних комп'ютерів, а потім – просто перенесені в мережеве середовище. Створення ж розподілених додатків, хоч і мало багато переваг (зменшення мережевого трафіка, спеціалізація комп'ютерів) виявилося справою зовсім не простою. Потрібно було розв'язувати безліч додаткових проблем – на скільки частин розбити додаток, які функції покласти на кожну частину, як організувати взаємодію цих частин, щоб у випадку збоїв і відмов частини, що залишилися, вони коректно завершували роботу, і т. д, і т п. Тому дотепер тільки невелика частина додатків є розподіленими, хоча очевидно, що саме за цим класом додатків майбутнє, тому що вони повною мірою можуть використовувати потенційні можливості мереж з розпаралелення обчислень.