HudsonThames/ArbitrageLab

[ArbLab] 2. TS Approach (1) Quantile Time Series Strategy

알파트로스 2024. 7. 21. 22:48

이 모델은 가격 스프레드를 기반으로 하는 전략이다 . 원래는 세 가지 접근 방식이 제안되었으나, 테스트를 통해 세 번째 접근 방식인 미래 스프레드 값을 먼저 예측한 후, 예측된 값과 실제 값의 차이를 기반으로 거래 신호를 생성하는 방법으로 구현되었다. 투자자는 스프레드 값의 급격한 움직임에서 이익을 얻을 수 있다   

Auto ARIMA Model

일반적으로, 이 목적을 위한 예측 알고리즘은 크게 parametric model 과 non-parametric model 두가지로 나눠진다. parametric model은 기본 프로세스가 적은 수의 파라미터로 설명될 수 있는 특정 구조를 가지고 있다고 가정한다. 하지만 이 접근 방식의 모델들은 한계가 있다.non-parametric model은 기본 프로세스의 구조에 대해 아무런 가정을 하지 않는다. 여기에는 인공 신경망이 포함될 수 있다.
이 포스트에서는 자동으로 파라미터가 맞춰지는 Auto ARIMA 모델을 사용하여 스프레드 값을 예측한다. 이 전략의 입력 가격 시리즈는 공적분되어야 한다. 이는 스프레드 형성 기간 동안 정상성을 가진다는 것을 의미한다.


ARIMA(p,d,q) Model

  • Autoregression (AR) : 시계열 변수를 자기 자신의 시차된 값에 회귀시키는 다항식.
  • Moving Average (MA) : 예측 오차를 시차된 오차 항과 시계열의 기대값으로 모델링하는 다항식.
  • Integrated (I) :시계열의 차분을 통해 정상성을 갖게 만드는 부분.

\[ x_t = c + \epsilon_t + \sum_{i=1}^{p} \phi_i x_{t-i} + \sum_{i=1}^{q} \Theta_i \epsilon_{t-i} \]

  • 여기서 \( c \)는 상수로 \( x_t \) 시리즈의 평균 값을 포함한다.
    \( \epsilon_t \), \( \epsilon_{t-1} \), ..., \( \epsilon_{t-q} \)는 해당 시간에 백색 잡음 오차 항에 해당하는 무작위 변수이다.
    \( \phi_1, ..., \phi_p, \Theta_1, ..., \Theta_q \)는 모델 파라미터이다
  • 공적분 차수가 0이면, \( x_t = X_t \)이다. (\( X_t \)는 입력 시계열)
    공적분 차수가 1이면, \( x_t = X_t - X_{t-1} \)와 같이 표현된다
  • 가장 적합한 ARIMA 모델은 Akaike Information Criterion (AIC)를 사용하여 선택한다
    \[ AIC = 2k - 2 \ln(L) \]

Auto ARIMA 접근법을 사용하여 예측된 스프레드 값과 실제 스프레드 값을 비교한 예시

 

 

Quantile Time Series Strategy

 \( S_t \)와 \( S_t^* \)는 각각 시간 \( t \)에서의 실제 스프레드 값과 예측된 스프레드 값으로 정의된다. 신호 생성은 예측된 변화를 기반으로 한다.
\[ \Delta_{t+1} = \frac{S_{t+1}^* - S_t}{S_t} \times 100 \]

Market Entry Conditions
시장 진입 조건은 다음의 임계값 (\(\alpha_L\), \(\alpha_S\))에 기반한다.

\[
\text{Position} = 
\begin{array}{ll}
\text{Long,} & \text{if } \Delta_{t+1} \geq \alpha_L \\
\text{Short,} & \text{if } \Delta_{t+1} \leq \alpha_S \\
\text{No Position,} & \text{otherwise.}
\end{array}
\]

 

 

Maximization Approach
하나의 접근 방식은 최대 수익을 달성하기 위해 진입 및 종료 조건을 찾는 최대화 문제를 해결하는 것이다. 그러나 저자들이 언급했듯이, 이는 데이터 스누핑(data-snooping)과 추가 복잡성을 초래할 수 있다.

Quantile Approach
이 전략에서 사용된 접근 방식은 형성 기간 동안 퍼센트 변화 분포의 분위수를 선택하는 것이다.
먼저, 특정 시간 \( t \)에서 스프레드 비율은 다음과 같이 계산된다
\[ x_t = \frac{S_t - S_{t-1}}{S_{t-1}} \times 100 \]

이후, 퍼센트 변화의 분포 \( f(x) \)를 통해 음의 변화와 양의 변화를 각각 따로 고려하여 필요한 분위수 값을 얻는다. 

분위수를 임계값으로 선택하는 것은 자주 발생하는 급격한 변화를 목표로 하는 아이디어와 일치한다. 저자들은 임계값으로 10% 또는 20% 분위수를 선택할 것을 권장한다. 아래는 분위수 시계열 전략의 예시이다

삼각형은 임계값 중 하나가 트리거된 시점을 나타내며, 사각형은 예측된 방향에 대한 정보를 제공

 

 

https://hudson-and-thames-arbitragelab.readthedocs-hosted.com/en/latest/time_series_approach/quantile_time_series_strategy.html

 

Quantile Time Series Strategy — arbitragelab 1.0.0 documentation

© Copyright . Revision 32ccd567.

hudson-and-thames-arbitragelab.readthedocs-hosted.com

 

https://hudsonthames.org/notebooks/arblab/quantile_time_series.html

 

quantile_time_series

Usually, when a mean-reverting spread is constructed, a researcher will use the Z-score Bollinger Band strategy to trade a portfolio. However, the time series approach may be applied to model the spread dynamics and enter long/short spread positions.

hudsonthames.org