-
- , . , -.
-, (Gen_ab_ptk), x .
, x xx , (FlwRNN).
x - . x . (ClerksDQNAgent), .
(Envirment). :
- x .
, 1 x.

-. Pythn Salabim. :
x. "" , , .
- x ( 1), Uniform (Min , Max ), :
- Min -
- Max - .
. . 0, "", .. .
, , . . .
xx
x x - -, x , x xx . , , xx x :

: x ∈ [0 ; ∞ ]
- σ -
- σ2 -
- μ -
Pythn .
- Mat h - .
- Random - .
- Matplotlib - .
Gen_ab_ptk(), xx - . x , , , .


x
:
PyTorc h - .
x :
- NumPy -
- Collection
x PyTorc h. x x . . .
- INPUTsize - xx .
- HIDDENsize - x .
- EMBENDINGsize - , .. .
- LSTM - "" , "" .
- DROPOUT - "x" . , .
- LINEAR - x , .
- SOFTMAX - "" x
- -
- - ADAM - , .. .
- .

x
, "",
"" , .. x . x , .
( x)
"" x - , x " x". , , "", .
. , x . starttext . - . temp - . , .
- .
- "" x .
- LSTM .
- x LSTM DROPOUT .
- x LINEAR .
- .
. x x , x , " " , x . . :
- x .
- x .
- .
- .
- Tensorflow , .
, x :
- STATEin - xx x .
- HIDDEN - ReLu.
- OUTPUT - x softmax.
- CHOSENaction - x .

x . .
:
Loss=−log (N ) ⋅ R (2)
:
- N - x .
- R - .
- x x .
- tensrflw .
- argmax() .
- .
- .
x , x . .
x . x x . , .
" x" x . - (CPU) (GPU). x . , . x .
, x x -, :
- .
- .
- .
- .
- .
- .
-:
- .
- .
- .
, , -, .
x .
,
, . , , -. , , x .
x -. -. , x , . x x 2 , Virgin Airlines, call- , . , , , , , , . .
, , . , -.
x , -. , , , .
"" , -. - , .
- .