Відмінності між версіями «Метод узагальнених стохастичних градієнтів для розв’язання двохетапної задачі СП. Загальний алгоритм.»

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук
Рядок 35: Рядок 35:
  
 
<math> \left | a_s \left ( x^{(0)}, x^{(1)},..., x^{(s)}  \right ) \right | \le l_s </math>;  <math> \left \| m^{(s)} \left ( x^{(0)}, x^{(1)},..., x^{(s)}  \right ) \right \| \le  r^{(s)}</math>
 
<math> \left | a_s \left ( x^{(0)}, x^{(1)},..., x^{(s)}  \right ) \right | \le l_s </math>;  <math> \left \| m^{(s)} \left ( x^{(0)}, x^{(1)},..., x^{(s)}  \right ) \right \| \le  r^{(s)}</math>
 +
 +
Нехай <math> min \varphi(x)= \varphi(x^{*})>-\mathcal {1} </math>
 +
 +
'''Теорема.''' Нехай
 +
 +
а) відома величина <math> h_s\left ( x^{(0)}, x^{(1)},..., x^{(s)}  \right ) </math>, така що
 +
<math> ~M \left ( \left \| \xi^{(s)} \right \|^2 \mid x^{(0)}, x^{(1)},..., x^{(s)}  \right ) \le h^2_s \le \sigma^2_ \beta < \mathcal {1}</math>

Версія за 19:26, 11 квітня 2013

Метод узагальнених стохастичних градієнтів не припускає диференціювання цільової функції задачі і не вимагає завдання статистичних характеристик випадкових параметрів умов задачі. Метод стохастичних градієнтів є загальним методом стохастичної апроксимації. Для ітеративного розв’язання задачі використовується послідовність реалізації матриці Неможливо розібрати вираз (невідома помилка): \ A(\omega)

і векторів  Неможливо розібрати вираз (невідома помилка): \ b(\omega) 
та Неможливо розібрати вираз (невідома помилка): \ c(\omega) 

.

Метод стохастичних градієнтів може бути використаний також для розв’язання нелінійної двохетапної стохастичної задачі. Застосування методу узагальнених стохастичних градієнтів базується на наступних міркуваннях. Нехай потрібно мінімізувати опуклу вниз функцію Неможливо розібрати вираз (невідома помилка): \ \varphi(\omega)

  на опуклій множині Неможливо розібрати вираз (невідома помилка): \ K 

. Розглянемо наступний ітеративний процес випадкового пошуку розв’язання задачі

Неможливо розібрати вираз (невідома помилка): \ x^{s+1}=\pi_K \left ( x^{(s)}-\rho_s \gamma_s \xi^{(s)} \right ) . (29.1)


Тут Неможливо розібрати вираз (невідома помилка): \ x^{(0)}

- довільний n-вимірний вектор, який належить множені Неможливо розібрати вираз (невідома помилка): \ K 
- початкова точка процесу;

Неможливо розібрати вираз (невідома помилка): \rho_s

- величина кроку на s-й ітерації;

Неможливо розібрати вираз (невідома помилка): \gamma_s

- нормований множник;

Неможливо розібрати вираз (невідома помилка): \xi^{(s)}

- випадковий вектор, умовне математичне сподівання яке відносно Неможливо розібрати вираз (невідома помилка):  x^{(0)}, x^{(1)},..., x^{(s)}
залежить лінійно від узагальненого градієнта Неможливо розібрати вираз (невідома помилка): \ \varphi_x 
(субградієнта або опорного функціоналу) функції Неможливо розібрати вираз (невідома помилка): \ \varphi(x) 
в точці Неможливо розібрати вираз (невідома помилка): \ x^{(s)} 

Неможливо розібрати вираз (невідома помилка): ~M \left (\xi^{(s)}\mid x^{(0)}, x^{(1)},..., x^{(s)} \right ) = a_s \varphi_x(x^{(s)}) +m^{(s)}

(29.2)

В формулі (29.2) Неможливо розібрати вираз (невідома помилка): a_s

- деяке число, Неможливо розібрати вираз (невідома помилка):  m^{(s)}
- n-вимірний вектор.

Неможливо розібрати вираз (невідома помилка): \pi_{K}(x)

- оператор проектування на множині Неможливо розібрати вираз (невідома помилка):  K 

, тобто такої, що

Неможливо розібрати вираз (невідома помилка): \pi_{K}(x) \in K

і Неможливо розібрати вираз (невідома помилка):  \left \| x- \pi_{K}(x) \right \|^2 \le \left \| y-x \right \|^2 
для будь-якого Неможливо розібрати вираз (невідома помилка):  y \in K 

.

Іншими словами, оператор проектування Неможливо розібрати вираз (невідома помилка): y=\pi_K(x)

являє собою розв’язок наступної задачі опуклого програмування з квадратичною цільовою функцією: 

Неможливо розібрати вираз (невідома помилка): inf \left \| x-y \right \|^2, y\in K


Значення Неможливо розібрати вираз (невідома помилка): a_s

і Неможливо розібрати вираз (невідома помилка):  m^{(s)} 
в (29.2) можуть залежати від Неможливо розібрати вираз (невідома помилка):  x^{(0)}, x^{(1)},..., x^{(s)} 

. Проте пропонується, що існують постійні Неможливо розібрати вираз (невідома помилка): l_s

і Неможливо розібрати вираз (невідома помилка):  r^{(s)}= \left \{r_j^{(s)} \right  \}

, такі, що

Неможливо розібрати вираз (невідома помилка): \left | a_s \left ( x^{(0)}, x^{(1)},..., x^{(s)} \right ) \right | \le l_s

Неможливо розібрати вираз (невідома помилка): \left \| m^{(s)} \left ( x^{(0)}, x^{(1)},..., x^{(s)} \right ) \right \| \le r^{(s)}


Нехай Неможливо розібрати вираз (невідома помилка): min \varphi(x)= \varphi(x^{*})>-\mathcal {1}


Теорема. Нехай

а) відома величина Неможливо розібрати вираз (невідома помилка): h_s\left ( x^{(0)}, x^{(1)},..., x^{(s)} \right ) , така що Неможливо розібрати вираз (невідома помилка): ~M \left ( \left \| \xi^{(s)} \right \|^2 \mid x^{(0)}, x^{(1)},..., x^{(s)} \right ) \le h^2_s \le \sigma^2_ \beta < \mathcal {1}