Відмінності між версіями «Надійність комп'ютерних мереж»

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук
Рядок 46: Рядок 46:
 
У результаті розрахунків надійності спрощеної моделі мережі можуть бути вироблені рекомендації і критерії щодо вибору топології і структури, які допоможуть досягти більш високої надійності.
 
У результаті розрахунків надійності спрощеної моделі мережі можуть бути вироблені рекомендації і критерії щодо вибору топології і структури, які допоможуть досягти більш високої надійності.
 
=== Области применения ===
 
=== Области применения ===
юэюэ
 
 
==== Сети с коммутацией пакетов, уровень опорной сети ====
 
==== Сети с коммутацией пакетов, уровень опорной сети ====
щлщзлшщ
+
Перші мережі з комутацією пакетів були розроблені в 1960-х. Їх створили з метою поділити високошвидкісні канали між великою кількістю користувачів. Трафік, породжуваний одним користувачем, має багато сплесків і пауз. Трафік декількох користувачів можна динамічно рознести за часом і передавати по одному з'єднанню. ARPANET була першою великою мережею з комутацією пакетів. Велика частина досліджень в галузі мережевої надійності до і після 1970 велася саме для ARPANET. Надійність ARPANET в основному розглядалася з точки зору пов'язаності мережі. Вважалося, що мережа функціонує, якщо вона залишається пов'язаної, тобто поки кожен з користувачів специфікованого субнабора пов'язаний один з одним. Такий підхід був виправданий, тому що в ARPANET використовувалася динамічна маршрутизація, так що дані могли бути спрямовані в обхід які відмовили вузлів. Хоча існувала можливість транспортування даних за іншим маршрутом, в мережі могли виникнути перевантаження і затримки, викликані падінням загальної пропускної здатності мережі.
 +
 
 +
При порівнянні ARPANET з комерційними опорними мережами з комутацією пакетів, що використовуються в 1980-х роках, такими, як Telnet і Tymnet, ясно, що комерційні мережі багато компактнішим. Як наслідок, імовірність порушення зв'язаності в комерційних мережах багато менше, але, як правило, завантаження каналів там досить висока. Звідси напрошується висновок, що слід більш детально обчислювати параметри мережевий надійності і враховувати перевантаження і пропускну здатність мережі. Будемо вважати, що мережа працездатна, якщо вона пов'язана і параметри мережевий працездатності, якими можуть бути середні затримки, не перевищують заданих меж.
 +
 
 +
Сьогодні мережа ArpaNet може здатися топологічно досить простий, але навіть для такої мережі розрахунок надійності аж ніяк не просте завдання навіть при оцінці простий зв'язності.
 +
 
 +
Для того щоб мінімізувати перебір, можна використовувати різні методи еквівалентного перетворення графа мережі, мiнiмiзуючого число вузлів або ребер при збереженні значення надійності.
 
==== Опорный уровень в сетях с коммутацией каналов ====
 
==== Опорный уровень в сетях с коммутацией каналов ====
лодлд
+
На сьогоднішній день найбільші телекомунікаційні мережі є мережами з комутацією каналів, які утворюють всесвітні телефонні мережі загального призначення. У таких мережах пара користувачів займає канал на час розмови. Відмова в роботі деяких мережевих компонентів знижує повну пропускну здатність мережі, і скорочується максимально можливу кількість з'єднань. Це несприятливо позначається на користувачах, зростає ймовірність того, що, коли людина захоче подзвонити, лінія буде зайнята. Це явище називається "блокуванням виклику". У разі пошкодження вузлів у мережі з комутацією пакетів може збільшитися затримка передачі даних, але блокування виклику не відбудеться. Звичайно, для обох типів мереж вірно, що, якщо відсутня зв'язаність мережі між двома користувачами, вони не зможуть один з одним спілкуватися. У ранніх роботах з мережевої надійності пропонувалися моделі мережі з комутацією каналів, де мережеві канали вважалися несправними, якщо вони виявилися блокованими.
 
==== Связные сети ====
 
==== Связные сети ====
уацуацуацуацу
+
Особливий випадок мереж з комутацією каналів виникає при проектуванні зв'язкових мереж в паралельних обчислювальних архітектурах для об'єднання паралельних процесорів і пам'яті. Моделі, засновані на пов'язаності мережі, однаково застосовні і до відмов з причини перевантажень, і до відмов у роботі мережевих вузлів. Еквівалентом продуктивності системи вважається середнє значення параметра пов'язаності мережі між її вхідний і вихідний точками.
 
==== Локальные оптоволоконные сети для передачи голоса ====
 
==== Локальные оптоволоконные сети для передачи голоса ====
укпукпу
+
Оптичні кабелі - одне з останніх досягнень сучасної технології. Телекомунікаційні мережі всього світу переводяться на використання цієї техніки (дивись, наприклад, T. Flanagan, "Fiber Network Survivability" IEEE Communication Magazine 28 (1990) 46-53). Основною перевагою оптичного середовища передачі в порівнянні з передачею по мідних кабелях є істотне зростання пропускної спроможності та зниження рівня шумів. Саме з цієї причини багато телефонні мережі загального користування здійснюють швидкий перехід на оптику. Як, проте, виявилося, у проблематиці надійності мереж існують більш важливі проблеми, і саме їх потрібно вивчати. А саме: пропускна здатність оптоволоконних мереж надзвичайно висока, тому структура таких мереж, на відміну від звичайних, має більш розподілений характер. Старі мережі були більш розгалуженими і мали велике число зв'язків, питання мережевий надійності стояв не так гостро. При проектуванні сучасних мереж слід серйозно поставитися до проблеми мережевий надійності, тому що перебої в роботі навіть одного з оптичних каналів можуть викликати розрив мережі.
 +
 
 +
До оптичних каналах додають канали-дублери з можливістю перемикання між основним і дублюючим каналом. При цьому бажано, щоб траси їх прокладки не збігалися (по країні нишпорять бульдозери та екскаватори, так і норовлять порвати будь-які кабелі). У результаті ми зможемо застосувати до оптичної мережі вже існуючі методи оцінки надійності.
 +
 
 
==== Архитектуры переключателей и компьютеров, устойчивые к сбоям ====
 
==== Архитектуры переключателей и компьютеров, устойчивые к сбоям ====
цуацуацацуацуа
+
Комп'ютерна система називається стійкою до збоїв, якщо при відмові одного з її компонентів вона продовжує функціонувати. У 1970-х роках такі комп'ютери використовувалися як перемикачів в опорних телекомунікаційних мережах. І сьогодні вони широко застосовуються у багатьох додатках. Пізніше були розроблені паралельні обчислювальні архітектури. З метою підвищення продуктивності паралельні ЕОМ збиралися з безлічі однотипних елементів. Однак паралельні архітектури мають також і підвищені характеристики надійності. Зазвичай такі відмовостійкі і паралельні комп'ютерні системи при аналізі надійності моделювались як мережі. Оскільки більша частина досліджень з оцінки мережевий надійності велася для мереж передачі даних, основний упор робився на алгоритми аналізу топології мереж. Стимулом робіт з мережевої надійності послужили комп'ютерні архітектури, в основі роботи яких лежать сильно структуровані мережі, поєднані з певними архітектурами ЕОМ. Зазвичай використовуються заходи, що базуються на пов'язаності мережі. Проте особливо у випадку паралельних ЕОМ з великою кількістю процесорів повинні розглядатися параметри надійності, які враховують міркування пропускної здатності.
 +
 
 
==== Прочие применения ====
 
==== Прочие применения ====
кнрнеореноеео
+
Існує велика різноманітність мережевих моделей, частина з них застосовується в інших галузях науки. У всіх аналізованих випадках мережа підтримує роботу багатьох користувачів, трафік кожного з них потрібно через мережу одним або кількома маршрутами. Зазвичай мається на увазі, що можна зробити більш точну оцінку надійності, якщо врахувати в розрахунках параметри маршрутизації. На завершення потрібно відзначити, що потрібно враховувати величини пропускної здатності. Одна з найбільш цікавих галузей застосування - міські мережі наземного транспорту. У цьому контексті інциденти, такі, як аварії на автомагістралях, викликають відмову мережевих вузлів або дуг. Хоча порушення зв'язаності в мережі міського транспорту відбуваються дуже рідко, все-таки цілком типово, коли відмова сайту або зв'язку викликає ситуацію значною перевантаження.
 +
 
 +
Нарешті, застосування багатьох засобів оцінки надійності мережі, які розроблені для заходів, що базуються на зв'язності, поширюється на зовсім інші проблеми надійності, наприклад, у сфері диспетчеризації та розподілу ресурсів (в тому числі операційних систем або мереж електропостачання).
 +
 
 
==== Причины возникновения сбоев ====
 
==== Причины возникновения сбоев ====
щугрпшупршуп
+
Механізми втрат і причини їх виникнення відносно добре вивчені в класичній теорії надійності. Наприклад, в електронних системах деградація вузлів відбувається, коли вони піддаються безперервному теплового впливу. У результаті такі вузли випадковим чином виходять з ладу. Аналіз надійності для подібних систем звичайно включає в себе вивчення цих випадкових процесів і параметри їх розподілів. При аналізі мережевий надійності частина механізмів, що викликають втрати, відома також як і параметри їх функцій розподілу. Але залишається багато не менш важливих механізмів, про функції розподілу яких ми нічого не можемо сказати. Наприклад, існує багато публікацій про виникнення відмов у роботі оптоволоконних мереж, викликаних природними причинами, такими, як пожежі, або помилками оператора транзитної мережі, який спільно використовував канал. Таким чином, важко побудувати модель збоїв в каналі, що задовольняє реальній частоті збоїв. Зазвичай, прогноз частоти збоїв у мережі будується на основі історичного аналізу або результатів вимірювань. Більш докладний розгляд проблеми представлено в книзі MO Ball, C.J. Colbourn, J.S. Provan, "Network Reliability".
 +
 
 
=== Основные определения ===
 
=== Основные определения ===
кпупукпукпукпп
+
Через відсутність прийнятної моделі механізму втрат в мережі і властивої складності розрахунку мережевий надійності використовуються времязавісімие моделі з дискретною ймовірністю. Тут ми розглянемо найбільш популярну модель. У ній передбачається, що мережеві компоненти (вузли та ребра на мові графів) можуть приймати лише два стани: працює чи не працює. Стан мережевого компонента - випадкова величина, яка не залежить від стану інших компонентів (у загальному випадку це може бути і не так). Постановка завдання обчислення надійності: для кожного компонента мережі задана ймовірність того, що він знаходиться в робочому стані, і потрібно обчислити міру надійності мережі.
 +
 
 +
Розглянемо якесь узагальнення цієї моделі. Зокрема, будемо розглядати моделі, в яких кожен компонент може знаходитися в одному з декількох станів, або моделі, в яких робочий стан характеризується чисельною значенням. Чисельні значення цих характеристик зазвичай прирівнюються метриці відстані або величиною пропускної здатності. Проста модель з двома станами добре підходить для обчислення заходи пов'язаності. Коли виникає необхідність порахувати більш складну міру, наприклад, продуктивність системи, застосовують більш складні характеристики станів компонентів.
 +
 
 +
Для моделі з двома станами ймовірність працездатності компонента або, простіше, надійність, можна розуміти по-різному. Найбільш поширеними є формулювання:
 +
 
 +
  1. доступність компонента;
 +
  2. надійність компонента.
 +
 
 +
Взагалі в цьому розділі домовимося застосовувати термін надійність для позначення ймовірності того, що компонент або система працює. Тут ми обговорюємо більш окрему ухвалу. Доступність використовується в контексті ремонтоспособних систем. Зі сказаного випливає, що компонент може знаходитися в одному з трьох станів: працює, не працює, у процесі відновлення. Доступність компонента визначається як ймовірність його роботи у випадковий момент часу. Оцінка величини доступності проводиться з урахуванням середнього часу відновлення в робочий стан і середнього часу в неробочому стані. Надійність можна записати так:
 +
[[Файл:Example.jpg]]
 
=== Введение к сложности анализа надежности ===
 
=== Введение к сложности анализа надежности ===
 
цацуацацацаца
 
цацуацацацаца

Версія за 12:41, 7 вересня 2010

Сетевая надёжность

Сучасний Інтернет нараховує десятки мільйонів серверів і сотні мільйонів робочих станцій. Дана технологія стала широко використовуватися в інформаційних системах та бізнесі, саме з цієї причини проблема надійності мереж стає все більш актуальною. Адже зовсім не байдуже, чи отримає людина своєчасно відгук від банкомату, справить чи клієнт покупку, чи будуть коректно введені дані до системи навігації ракети і т.д.

Але перш ніж поставити питання про надійність Інтернет або навіть локальної мережі, потрібно визначити деякі базові поняття. Надійність будь-якої системи визначається надійністю складових її елементів. А надійність елементів задається часом напрацювання на відмову або ймовірністю відмови за обумовлений період часу. Надійності різних елементів можуть відрізнятися істотно. В результаті як усереднені значення надійності, так і розподілу ймовірності відмов різних мережних пристроїв можуть варіюватися в дуже широких межах. У багатьох випадках надійність і розподілу надійності визначаються емпірично.

І якщо вимога надійності визначити як працездатність всіх елементів, надійність Інтернету виявиться рівною нулю, бо завжди знайдеться несправний або відключений вузол або робоча станція. Якщо ж визначити надійність системи як можливість комунікації між, скажімо, 1000 будь-яких вузлів або робочих станцій, то надійність Інтернет виявиться практично рівною одиниці. Звичайно, якщо ваша робоча станція не потрапить до числа цих 1000 вузлів, ви навряд чи погодитеся з твердженням абсолютної надійності. Зрозуміло тому, що обидва визначення абсолютно неприйнятні. Не треба думати, що випадок оцінки надійності локальної мережі, що містить, наприклад, 100 робочих станцій, багато простіше.

Тут потрібно буде визначити, що таке відмову. Сучасна персональна ЕОМ - досить складний прилад, що містить кілька зовнішніх пристроїв, один або більше процесорів, оперативну пам'ять, мережевий інтерфейс, ОС і т.д. Що слід вважати відмовою робочої станції? Вихід з ладу джерела живлення, повісаніе ОС, руйнування системного диска, відмова мережевої карти і пр. або щось ще, наприклад, помилка в прикладній програмі або висмикування прибиральницею кабелю з розетки? Треба відразу сказати, що однозначної відповіді на це питання немає, все залежить від обставин.

Перш ніж переходити до теоретичної частини, подивимося, що можна зробити для поліпшення надійності мережі з практичної точки зору. Звичайно, цьому сприятиме використання RAID-систем жорстких дисків, катастрофостійкої системи дублювання резервних копій дисків у віддалених вузлах, розміщених у різних будівлях, тощо. Але не слід знімати з рахунку дублювання базових серверів: DNS, NTP (якщо вони потрібні), поштових серверів, серверів баз даних та ін Всередині локальної мережі підвищенню надійності може сприяти застосування протоколу STP, що може автоматично забезпечити обхід що відмовив ділянки LAN (якщо застосування динамічного протоколу внутрішньої маршрутизації неможливо або небажано, наприклад, з міркувань безпеки). У багатьох випадках украй важливо задубліровать шлюз мережі, що веде в Інтернет, тому що його відмова залишить усіх користувачів мережі без зв'язку. Компанія CISCO і багато інших фірм розробили протоколи резервування маршрутизаторів. У цих протоколах два або більше пристроїв спільно використовують віртуальні IP й Мас-адреси, які зазначені в мережевому сегменті для шлюзу за замовчуванням. Для реалізації такої схеми існує три протоколи:

   * HSRP (Hot Standby Router Protocol - протокол гарячого резервування маршрутизаторів) компанії CISCO;
   * IPSTB (IP Standby Protocol) компанії DEC;
   * VIRP (Virtual Router Redundancy Protocol - протокол надлишкового віртуального маршрутизатора).

Компанія CISCO підтримує тільки протокол HSRP. У цьому протоколі один з маршрутизаторів є основним (primary), а другий - резервним (standby). Після введення цього протоколу в дію всі запити і весь трафік шлюзу обслуговуються основним маршрутизатором. Дублюючий маршрутизатор залишається пасивним до виходу з ладу основного (рішення не найдешевше, якщо врахувати вартість маршрутизатора, навіть якщо дублюючий прилад простіше і дешевше основного).

При розгляді мережевий надійності мережа зазвичай описується графом, де ребра відображають мережеві канали, а в якості вузлів виступають робочі станції, сервери, повторювачі, перемикачі, маршрутизатори або інші пристрої.

Вихід з ладу робочої станції (термінальний вузол) створює проблеми її користувачеві, решта користувачів Інтернет, швидше за все, цього не помітять, але відмова сервера позначиться на роботі всіх його клієнтів, в тому числі і віддалених. Вихід же з ладу маршрутизатора (якщо це транзитний вузол) може вплинути на роботу цілого регіону. Звідси видно, що окремі вузли можуть по-різному впливати на роботу мережі в цілому. Навіть у класі серверів можна виділити групи різного впливу на рівень надійності. Наприклад, відмова сервера IN-ADDR.ARPA практично паралізує роботу всіх програм traceroute. Ще гірше вплив надасть вихід з ладу регіонального DNS-сервера. Саме з цієї причини такі сервери зазвичай дублюються (навіть у локальних мережах). Існують і інші сервери, які впливають на реалізацію певних мережевих функцій (поштові сервери, сервери баз даних в системах платежів, сервери центрів сертифікації та ін.) Очевидно, що вплив на надійність мережі може надавати не тільки устаткування або ОС, але і прикладні програми.

Цим список факторів, що впливають на надійність, не вичерпується. Якщо користувач не може отримати доступ до певного мережного ресурсу, це дуже часто пов'язане не з відмовою обладнання або програми, а просто з перевантаженням однієї з ділянок мережі по дорозі до зазначеного ресурсу (некомпетентність користувача в даному аналізі не розглядається). Тут мається на увазі не тільки обмеження пропускної здатності, але й можливе збільшення затримки доставки, що досить критично у випадку, наприклад, IP-телефонії або відео-конференцій. Таким чином, параметри надійності часто залежать від вектора завантажень (список значень завантажень каналів, що впливають на доступ та якість обслуговування). З цієї причини, формулюючи завдання оцінки надійності, потрібно визначити, які з параметрів важливі: зв'язність, пропускна здатність, час відновлення зв'язності або мінімізація затримок обслуговування.

Якщо ми розглянемо як приклад повний граф з чотирма вузлами, розміщеними в вершинах квадрата (6 ребер), то розрахунок зв'язності такої мережі буде включати комбінаторики перебору ребер і облік розподілу ймовірності обриву кожної з зв'язків. Неважко зрозуміти, що якщо спробувати проаналізувати надійність структурованої локальної мережі з сотнею ЕОМ, завдання виявиться на багато порядків складніше, я вже не кажу про Інтернет в цілому. Зазвичай множинність в таких завданнях дорівнює N! (Де N - кількість вузлів у графі зв'язків). У будь-якому випадку в якості вихідних даних повинні використовуватися значення надійності окремих вузлів і каналів, обчислені або виміряні з урахуванням тих факторів, вплив яких ви хочете врахувати. У багатьох випадках буває потрібно зробити припущення щодо розподілу ймовірності відмови розглянутих мережевих елементів. Крім того, треба вирішити, яка оцінка вам потрібна: для роботи мережі в середньому або для функціонування в екстремальних умовах. Заради спрощення проблеми часто робиться припущення про ідентичність розподілів і навіть рівність ймовірності відмови для всіх вузлів. Зрозуміло, що такі припущення роблять отриманий результат дуже приблизними. З цієї причини навіть оцінки кордонів надійності досить часто коректні лише по порядку величини. У багатьох випадках, коли потрібно отримати оцінку надійності конкретної мережі, непогані результати може дати розрахунок за методом Монте-Карло.

З цієї причини, перш ніж писати і запускати програму розрахунку надійності мережі треба навчитися оцінювати: а чи вистачить наявних обчислювальних ресурсів для вирішення поставленого завдання в поточному тисячолітті. Для цього існує математичні методи оцінки складності алгоритмів [А. V. AHO, J. D. Ullman, "Foundation of Computer Science", Computer Science Press, 1992, або VV Leeuwen, "Algorithms and Complexity", The MIT Cambridge, Massachusetts, Elsevier Science Publishers, 1990]. Через складність прямих обчислень багато дослідників обмежуються лише оцінкою можливих меж надійності. На практиці, навіть використовуючи самі продуктивні обчислювальні системи, можна оцінити надійність мережі з обмеженим числом вузлів. Для великих мереж доступними є лише оцінки нижній або верхньої межі надійності.

За відправну точку приймемо мережа G = (V, E), в якій V - набір вузлів або вершин графа мережі, а Е - набір неорієнтованих ребер або набір орієнтованих дуг. Більшість досліджень з мережевої надійності присвячені до-термінальним заходів. Нехай є набір з К вузлів і вузол sK (k = | K |). Задано мережа G, і всі дуги графа, що описує мережу, мають ймовірність надійності р. Тоді до-термінальна міра надійності визначається як (Pr - ймовірність):

Rel (G, s, K, p) = Pr [існує хоча б один працюючий шлях від s до кожного вузла з набору До]

Тобто, надійність мережі з графом G для набору вузлів К і вибраного вузла s при ймовірності мати надійний зв'язок для всіх ребер графа p дорівнює ймовірності того, що вузол s має хоча б один доступний шлях до кожного з вузлів К. Зазвичай ця величина відповідає певному часового інтервалу. Слід пам'ятати, що для локальних мереж не може бути двох шляхів від s до будь-якого з вузлів K.

Існує два важливих окремих випадку заходів: 2-термінальна мера з | К | = 2 і всетермінальная захід, де К = V. Ці заходи прийнято позначати Rel2 (G, s, p) і RelА (G, s, p), відповідно (Rel - надійність).

Читачеві, розраховує знайти якісь формули, підставивши в які число вузлів, ймовірності відмови каналів і вимоги до пропускної здатності, можна отримати оцінку надійності мережі, читати далі дану лекцію не варто. Таких формул просто не може існувати для скільки-небудь складних мережевих топологій (мережі з декількома десятками машин і структурованої схеми з'єднань вже ставляться до такого типу). Формули, які представлені нижче, демонструють алгоритми або моделі оцінки надійності та, як правило, не мають практичного значення. В решті частини цієї статті верхній індекс U - відповідає обмеженню надійності зверху, а L - обмеженню знизу.

Мережева надійність містить ряд аспектів, що стосуються проектування та аналізу мереж, які залежать від випадкових відмов їх компонентів. На прикладі порівняно простих і в той же час узагальнених сіткових моделей можна розглядати більшість пристроїв збоїв, які виникають на практиці. Мережеві класи та моделі охоплюють мережі передачі даних і голосу, комунікаційних мережі, архітектури ЕОМ, мережі електропередачі і системи управління.

У найперших моделях ЕОМ пам'ять організовувалася з безлічі окремих реле та вакуумних ламп. Комп'ютерні системи, які відмовляли при виході з ладу одного з їхніх елементів, були вкрай ненадійні, тому що ймовірність відмови одного елемента з тисяч є високою, навіть якщо ймовірність відмови окремого компонента низька.

Перші активні розробки в області систем підвищеної надійності проводилися для систем, чия відмова міг спричинити катастрофи та загибель людей. Прикладами таких систем є авіа-і космічні системи, управління ядерними реакторами, системи управління оборонними комплексами. Останнім часом широко поширена думка, що в ряді промислових галузей з економічної точки зору вигідніше застосовувати системи підвищеної надійності. Наприклад, це економічно виправдано в телекомунікаційних мережах, банківських системах - мережах підтвердження кредитоспроможності і в системах оформлення замовлень.

Основною метою досліджень в галузі мережевої надійності є прагнення розробити методи для інженерів-проектувальників, що спрощують проектування мереж, які вимагають підвищеної надійності. В ідеалі, бажано сформувати моделі проектування мереж та алгоритми, які використовують в якості вхідних даних характеристики мережевих компонентів, а також критерії проектування, і видають на виході оптимальну структуру мережі. Так як точні вирази для надійності мережі дуже складні, в моделях для проектування мереж замість явних виразів надійності використовуються замінники. У цьому розділі ми розглядаємо проблему аналізу заходи мережевий надійності. Різні моделі дослідження застосовуються спільно з процедурами проектування мережі. Якщо значення заходи надійності виявиться незадовільним, то слід змінити вхідні параметри проектної моделі. В іншому випадку, проектувальник може вручну скоректувати схему мережі. Коли одним з вищезгаданих методів отримана чергова топологія мережі, обчислюється нове значення заходи мережевий надійності. Побудувавши, таким чином, ітераційний процес, ми доб'ємося відповідності між знов отриманим та бажаним значенням заходи мережевий надійності.

У результаті розрахунків надійності спрощеної моделі мережі можуть бути вироблені рекомендації і критерії щодо вибору топології і структури, які допоможуть досягти більш високої надійності.

Области применения

Сети с коммутацией пакетов, уровень опорной сети

Перші мережі з комутацією пакетів були розроблені в 1960-х. Їх створили з метою поділити високошвидкісні канали між великою кількістю користувачів. Трафік, породжуваний одним користувачем, має багато сплесків і пауз. Трафік декількох користувачів можна динамічно рознести за часом і передавати по одному з'єднанню. ARPANET була першою великою мережею з комутацією пакетів. Велика частина досліджень в галузі мережевої надійності до і після 1970 велася саме для ARPANET. Надійність ARPANET в основному розглядалася з точки зору пов'язаності мережі. Вважалося, що мережа функціонує, якщо вона залишається пов'язаної, тобто поки кожен з користувачів специфікованого субнабора пов'язаний один з одним. Такий підхід був виправданий, тому що в ARPANET використовувалася динамічна маршрутизація, так що дані могли бути спрямовані в обхід які відмовили вузлів. Хоча існувала можливість транспортування даних за іншим маршрутом, в мережі могли виникнути перевантаження і затримки, викликані падінням загальної пропускної здатності мережі.

При порівнянні ARPANET з комерційними опорними мережами з комутацією пакетів, що використовуються в 1980-х роках, такими, як Telnet і Tymnet, ясно, що комерційні мережі багато компактнішим. Як наслідок, імовірність порушення зв'язаності в комерційних мережах багато менше, але, як правило, завантаження каналів там досить висока. Звідси напрошується висновок, що слід більш детально обчислювати параметри мережевий надійності і враховувати перевантаження і пропускну здатність мережі. Будемо вважати, що мережа працездатна, якщо вона пов'язана і параметри мережевий працездатності, якими можуть бути середні затримки, не перевищують заданих меж.

Сьогодні мережа ArpaNet може здатися топологічно досить простий, але навіть для такої мережі розрахунок надійності аж ніяк не просте завдання навіть при оцінці простий зв'язності.

Для того щоб мінімізувати перебір, можна використовувати різні методи еквівалентного перетворення графа мережі, мiнiмiзуючого число вузлів або ребер при збереженні значення надійності.

Опорный уровень в сетях с коммутацией каналов

На сьогоднішній день найбільші телекомунікаційні мережі є мережами з комутацією каналів, які утворюють всесвітні телефонні мережі загального призначення. У таких мережах пара користувачів займає канал на час розмови. Відмова в роботі деяких мережевих компонентів знижує повну пропускну здатність мережі, і скорочується максимально можливу кількість з'єднань. Це несприятливо позначається на користувачах, зростає ймовірність того, що, коли людина захоче подзвонити, лінія буде зайнята. Це явище називається "блокуванням виклику". У разі пошкодження вузлів у мережі з комутацією пакетів може збільшитися затримка передачі даних, але блокування виклику не відбудеться. Звичайно, для обох типів мереж вірно, що, якщо відсутня зв'язаність мережі між двома користувачами, вони не зможуть один з одним спілкуватися. У ранніх роботах з мережевої надійності пропонувалися моделі мережі з комутацією каналів, де мережеві канали вважалися несправними, якщо вони виявилися блокованими.

Связные сети

Особливий випадок мереж з комутацією каналів виникає при проектуванні зв'язкових мереж в паралельних обчислювальних архітектурах для об'єднання паралельних процесорів і пам'яті. Моделі, засновані на пов'язаності мережі, однаково застосовні і до відмов з причини перевантажень, і до відмов у роботі мережевих вузлів. Еквівалентом продуктивності системи вважається середнє значення параметра пов'язаності мережі між її вхідний і вихідний точками.

Локальные оптоволоконные сети для передачи голоса

Оптичні кабелі - одне з останніх досягнень сучасної технології. Телекомунікаційні мережі всього світу переводяться на використання цієї техніки (дивись, наприклад, T. Flanagan, "Fiber Network Survivability" IEEE Communication Magazine 28 (1990) 46-53). Основною перевагою оптичного середовища передачі в порівнянні з передачею по мідних кабелях є істотне зростання пропускної спроможності та зниження рівня шумів. Саме з цієї причини багато телефонні мережі загального користування здійснюють швидкий перехід на оптику. Як, проте, виявилося, у проблематиці надійності мереж існують більш важливі проблеми, і саме їх потрібно вивчати. А саме: пропускна здатність оптоволоконних мереж надзвичайно висока, тому структура таких мереж, на відміну від звичайних, має більш розподілений характер. Старі мережі були більш розгалуженими і мали велике число зв'язків, питання мережевий надійності стояв не так гостро. При проектуванні сучасних мереж слід серйозно поставитися до проблеми мережевий надійності, тому що перебої в роботі навіть одного з оптичних каналів можуть викликати розрив мережі.

До оптичних каналах додають канали-дублери з можливістю перемикання між основним і дублюючим каналом. При цьому бажано, щоб траси їх прокладки не збігалися (по країні нишпорять бульдозери та екскаватори, так і норовлять порвати будь-які кабелі). У результаті ми зможемо застосувати до оптичної мережі вже існуючі методи оцінки надійності.

Архитектуры переключателей и компьютеров, устойчивые к сбоям

Комп'ютерна система називається стійкою до збоїв, якщо при відмові одного з її компонентів вона продовжує функціонувати. У 1970-х роках такі комп'ютери використовувалися як перемикачів в опорних телекомунікаційних мережах. І сьогодні вони широко застосовуються у багатьох додатках. Пізніше були розроблені паралельні обчислювальні архітектури. З метою підвищення продуктивності паралельні ЕОМ збиралися з безлічі однотипних елементів. Однак паралельні архітектури мають також і підвищені характеристики надійності. Зазвичай такі відмовостійкі і паралельні комп'ютерні системи при аналізі надійності моделювались як мережі. Оскільки більша частина досліджень з оцінки мережевий надійності велася для мереж передачі даних, основний упор робився на алгоритми аналізу топології мереж. Стимулом робіт з мережевої надійності послужили комп'ютерні архітектури, в основі роботи яких лежать сильно структуровані мережі, поєднані з певними архітектурами ЕОМ. Зазвичай використовуються заходи, що базуються на пов'язаності мережі. Проте особливо у випадку паралельних ЕОМ з великою кількістю процесорів повинні розглядатися параметри надійності, які враховують міркування пропускної здатності.

Прочие применения

Існує велика різноманітність мережевих моделей, частина з них застосовується в інших галузях науки. У всіх аналізованих випадках мережа підтримує роботу багатьох користувачів, трафік кожного з них потрібно через мережу одним або кількома маршрутами. Зазвичай мається на увазі, що можна зробити більш точну оцінку надійності, якщо врахувати в розрахунках параметри маршрутизації. На завершення потрібно відзначити, що потрібно враховувати величини пропускної здатності. Одна з найбільш цікавих галузей застосування - міські мережі наземного транспорту. У цьому контексті інциденти, такі, як аварії на автомагістралях, викликають відмову мережевих вузлів або дуг. Хоча порушення зв'язаності в мережі міського транспорту відбуваються дуже рідко, все-таки цілком типово, коли відмова сайту або зв'язку викликає ситуацію значною перевантаження.

Нарешті, застосування багатьох засобів оцінки надійності мережі, які розроблені для заходів, що базуються на зв'язності, поширюється на зовсім інші проблеми надійності, наприклад, у сфері диспетчеризації та розподілу ресурсів (в тому числі операційних систем або мереж електропостачання).

Причины возникновения сбоев

Механізми втрат і причини їх виникнення відносно добре вивчені в класичній теорії надійності. Наприклад, в електронних системах деградація вузлів відбувається, коли вони піддаються безперервному теплового впливу. У результаті такі вузли випадковим чином виходять з ладу. Аналіз надійності для подібних систем звичайно включає в себе вивчення цих випадкових процесів і параметри їх розподілів. При аналізі мережевий надійності частина механізмів, що викликають втрати, відома також як і параметри їх функцій розподілу. Але залишається багато не менш важливих механізмів, про функції розподілу яких ми нічого не можемо сказати. Наприклад, існує багато публікацій про виникнення відмов у роботі оптоволоконних мереж, викликаних природними причинами, такими, як пожежі, або помилками оператора транзитної мережі, який спільно використовував канал. Таким чином, важко побудувати модель збоїв в каналі, що задовольняє реальній частоті збоїв. Зазвичай, прогноз частоти збоїв у мережі будується на основі історичного аналізу або результатів вимірювань. Більш докладний розгляд проблеми представлено в книзі MO Ball, C.J. Colbourn, J.S. Provan, "Network Reliability".

Основные определения

Через відсутність прийнятної моделі механізму втрат в мережі і властивої складності розрахунку мережевий надійності використовуються времязавісімие моделі з дискретною ймовірністю. Тут ми розглянемо найбільш популярну модель. У ній передбачається, що мережеві компоненти (вузли та ребра на мові графів) можуть приймати лише два стани: працює чи не працює. Стан мережевого компонента - випадкова величина, яка не залежить від стану інших компонентів (у загальному випадку це може бути і не так). Постановка завдання обчислення надійності: для кожного компонента мережі задана ймовірність того, що він знаходиться в робочому стані, і потрібно обчислити міру надійності мережі.

Розглянемо якесь узагальнення цієї моделі. Зокрема, будемо розглядати моделі, в яких кожен компонент може знаходитися в одному з декількох станів, або моделі, в яких робочий стан характеризується чисельною значенням. Чисельні значення цих характеристик зазвичай прирівнюються метриці відстані або величиною пропускної здатності. Проста модель з двома станами добре підходить для обчислення заходи пов'язаності. Коли виникає необхідність порахувати більш складну міру, наприклад, продуктивність системи, застосовують більш складні характеристики станів компонентів.

Для моделі з двома станами ймовірність працездатності компонента або, простіше, надійність, можна розуміти по-різному. Найбільш поширеними є формулювання:

  1. доступність компонента;
  2. надійність компонента.

Взагалі в цьому розділі домовимося застосовувати термін надійність для позначення ймовірності того, що компонент або система працює. Тут ми обговорюємо більш окрему ухвалу. Доступність використовується в контексті ремонтоспособних систем. Зі сказаного випливає, що компонент може знаходитися в одному з трьох станів: працює, не працює, у процесі відновлення. Доступність компонента визначається як ймовірність його роботи у випадковий момент часу. Оцінка величини доступності проводиться з урахуванням середнього часу відновлення в робочий стан і середнього часу в неробочому стані. Надійність можна записати так: Example.jpg

Введение к сложности анализа надежности

цацуацацацаца

Сложность анализа сетевой надежности

цуацуацацуацу

k терминалов

цуацацу

2 терминала

цуацуацац

Всетерминальная мера

Поняття надійності

Типи відмов

Якість обслуговування

Засоби підвищення надійності

...

http://infsis.ru/nad/1.html


Поняття надійності



Наді́йність — властивість технічних об'єктів зберігати у часі у встановлених межах значення всіх параметрів, необхідних для виконання технічних (технологічних та ін.) функцій в заданих режимах і умовах застосування. Під технологічними об'єктами розуміють пристрої, прилади, механізми, машини, комплекси обладнання, буд. конструкції і споруди, технол. операції і процеси, системи зв'язку, інформаційні системи, автоматизов. системи управління технол. процесами тощо.


Типи відмов


Мережу Інтернет (спочатку відому під назвою ARPANET) було створено в 1969 р. як результат досліджень на замовлення Міністерства Оборони Сполучених Штатів Америки. Початкова мета розробки полягала у створенні відкритої мережі для обміну науковими ресурсами між вченими. Внаслідок цього було розроблено мережу на основі комутації пакетів (packet switching), яка принципово відрізнялася від відомих тоді систем комутації ліній (circuit switching), таких як телефонна мережа. Це дозволило значно підвищити гнучкість, життєздатність та масштабність, однак успіх був досягнуто ціною ослаблення безпеки. В мережі Інтернет будь-хто може надіслати будь-який пакет будь-кому, і при цьому одержувач має обробити пакет, який прийшов належним чином. Ослаблення безпеки полягає в тому, що зловмисник може вказувати в пакетах фальшиве джерело і надсилати від його імені шкідливі пакети. Тому всі системи, з’єднані з мережею Інтернет, перебувають у потен- ційній небезпеці, оскільки відкритість робить їх доступними для атакуючого. З розвитком мереж кількість фактів зловмисної діяльності почала швидко зростати. Згідно з даними CERT (Computer Emergency Response Team) , центру експертизи безпеки Інтернет, розташованому у Сполучених Штатах, кількість задокументованих випадків порушення безпеки або вторгнень стрімко зросла в 1994 р. до 137539 . Починаючи з 2004 р. CERT відмовився від підрахунку загальної кількості вторгнень і перейшов до практики детальних звітів зі статистикою та аналізом по окремих типах атак. Графік росту кількості вторгнень на протязі часу показано на рис. 1.