Временной ряд — значения меняющихся во времени признаков, полученные в некоторые моменты времени.
Пусть $(y_t, t \in \mathbb{N})\ -\$ временной ряд, для которого известны значения $y_1, \dots , y_T.$ Требуется построить прогноз - функцию**$\ f$,** такую что величина $y_{T + h} = f(y_1, \dots, y_t, h)$ как можно лучше приближает значение $y_{T+h}$, где $h \in {1, \dots, H}\ -\$ количество шагов, на которое нужно построить прогноз, а величина $H$ - горизонт планирования, то есть максимальное количество шагов для прогноза. Иными словами, прогноз значения ряда в момент времени $T + h$ строится на основе известных значений ряда до момента времени $T$. Кроме этого имеет значение строить предсказательный интервал, то есть интервал $(d_{T+h}, u_{T+h}),$ такой что $\mathbb{P}(d_{T+h} \leq y_{t + h} \leq u_{t+h}) \geq \alpha.$
Основная идея – подадим известные зеленые значения ряда в какую-то регрессионную функцию, получив тем самым предсказания. При этом можем брать не все известные значения ряда, а только $p$ последних значений. Иначе говоря, модель имеет вид $y_t = f(y_{t-1}, \dots , y_{t -p}),$ где $f$ – произвольная функция.
Признаки*:*
Построение прогноза*:*
Модели для нескольких временных рядов: разделяем объекты на категории и для каждой категории строим одну модель.
Кросс-валидация: