알파트로스

[ArbLab] 1. Cointegration (1) An Introduction to Cointegration for Pairs Trading 본문

HudsonThames/ArbitrageLab

[ArbLab] 1. Cointegration (1) An Introduction to Cointegration for Pairs Trading

알파트로스 2024. 7. 3. 23:59

Intergrated time series of order d

Cointegration은 두 개 이상의 시계열 데이터가 장기적인 균형 관계를 유지하는 현상을 말한다. 적분이라는 말때문에 들을때마다 적분기호가 떠오르지만, 전혀 관계가 없고 time series 분석에서의 "integrated time series of order d : I(d) "라는 개념에서 비롯된 것이다

  • I(d) 시계열
    시계열이 I(d)라고 할 때, 이는 d차 차분을 통해 정상성(stationary)을 얻을 수 있다는 의미이다. 예를 들어, 가격(price), 이자율(rate), 수익률(yield) 데이터는 I(1)으로 표현 가능하다 즉 한 번의 차분을 통해 정상성을 얻을 수 있다는 뜻이다.
  • I(0) 시계열
    정상성 시계열을 의미한다. 금융분야에서는 약한 의미의 정상성(weak-sense stationarity)만으로도 충분하다. weak-sense stationarity은 시계열의 평균과 분산이 유한하고 시간에 따라 변하지 않는 것을 의미한다. 이를 좀 더 쉽게 표현하면 시계열이 평균으로부터 너무 멀리 벗어나면 다시 평균으로 되돌아오는 경향이 있다는 뜻이다. 이 성질이 평균 회귀 전략의 기반이 된다

수익률은 정상시계열이지만 우리는 수익률을 갖고 매매할 수 없다. 가격을 매매할 수 있지만 가격은 정상적이지 않은 I(1)시계열이다. 즉 하나의 가격 시계열로는 정상성을 활용한 평균회귀전략을 실행 할 수 없다


Cointegration 

Definition

\( x_t \) and \( y_t \) are cointegrated, if \( x_t \) and \( y_t \) are \(I(1)\) series and \(\exists \beta\) such that: \(z_t = x_t - \beta y_t \), is an \(I(0)\) series


금융 시장에 적용해보면 두 자산의 가격이 \(I(1)\) 시계열이고, 특정 가중치 β에 대해 두 자산의 가격 차이(선형조합)가 \(I(0)\) 시계열이라면, 이 두 자산은 cointegrated (=공적분되었다)라고 한다.

Cointegration Test

우리는 적절한 가중치(β)를 찾아 두 자산을 동시에 거래하는 정상적인 시계열(스프레드)을 만들고  자산 가격이 장기적으로 균형을 유지하는 정상 시계열의 특성을 활용해 평균 회귀 전략을 적용할 수 있다. 이 관계를 찾기 위해 Engle-Granger 테스트나 Johansen 테스트와 같은 통계적 방법을 사용한다.

  • Engle-Granger 테스트
    두 자산의 가격 간의 선형 회귀 분석을 통해 잔차(residual)가 정상성을 가지는지 확인하는 방법이다. 잔차가 정상성을 가지면, 두 자산은 cointegrated 되었다고 볼 수 있다.
    이때 어느 자산을 종속 변수로 선택해야 하는가?보통 두 자산 각각을 종속 변수로 두 번의 회귀 분석을 수행하여. 더 유의미한 ADF 테스트 결과를 얻는 계수를 최종 β 로 선택한다

  • Johansen 테스트
    두 개 이상의 자산을 분석할 때는 Johansen 테스트를 사용한다. 이 방법은 모든 자산을 독립 변수로 취급하고,  VECM을 사용하여 cointegration 벡터를 찾는다
    Johansen 테스트의 가장 큰 장점은 모든 자산을 독립 변수로 취급한다는 것이다. 또한, 고유값 통계(eigenvalue statistics)와 추적 통계(trace statistics) 두 가지 테스트 통계를 제공하여 자산 가격이 통계적으로 유의미하게 cointegrated 되었는지 확인할 수 있다.

Cointegration 테스트를 할때 price를 사용할지 log price을 사용할지에 대한 논의가 있다. 중요한 점은 가격(log price포함)이 I(1) 시계열이고 수익률이 I(0) 시계열이라는 것이다. I(1) 시계열은 차분을 통해 I(0) 시계열로 만들 수 있다. 로그 가격의 차분은 로그 수익률인데 반해 가격의 차분은 바로 수익률이 아니기에 log price를 쓰는 것이 더 좋을 수 있으나 그냥 가격을 사용해도 무방하다는 연구도 있다.

Intuitive Interpretation of Cointegration

Cointegration을 이해하기 위해서는 두 개의 \(I(1)\) 시계열 \( x_t \)와 \( y_t \)가 공적분 상태에 있다는 정의를 먼저 살펴보는 것이 중요하다. 이를 위해 \( x_t \)와 \( y_t \)를 비정상성 요소 (\(\nu\)) 와 정상 요소(\(\epsilon\)) 로 분해하여 보자
\[ 
x_t = \nu_{x_t} + \epsilon_{x_t} \\
y_t = \nu_{y_t} + \epsilon_{y_t} 
\]
cointegration 계수 \( \beta \)를 사용하여 \( x_t \)와 \( y_t \)의 스프레드(=공적분된 시계열) \( z_t \)를 구성할 수 있다 이 시계열은 정의에 따라 정상성 시계열이다 : \(I(0)\) 
\[z_t = x_t - \beta y_t = (\nu_{x_t} - \beta \nu_{y_t}) + (\epsilon_{x_t} - \epsilon_{y_t})\]

이 식으로부터 다음 두가지를 알 수 있다.

  • cointegration은 두 자산의 유사도에 대한 측정치로 쓰일 수 있다
    \(\nu_{x_t} = \beta \nu_{y_t}\)  : \( x_t \)와 \( y_t \)는 공통의 비정상성 요소(추세,계절성,stochastic) 를 공유한다. 이 말은 두 자산이 공적분상태일 때 두 자산의 가격을 비정상적으로 만드는 기저가 유사 해야한다는 의미이다. 이를 금융적 용어로 쓰면 두 자산이 비슷한 risk exposure를 갖는다라고도 표현할 수 있다. 따라서 같은 섹터의 주식이나 WTI유와 브렌트유는 좋은 공적분 후보가 될 수 있다.

  • \( z_t \)는  정상성 시계열이다
    \( z_t \)는 정상성 시계열로, 이 시계열의 평균이 시간이 지나도 변하지 않는다는 것은 두가지를 의미한다. 하나는  공적분이 두 자산의 장기적인 관계를 뜻한다는 것이고, 다른 하나는 스프레드 평균의 불변성으로 인해 두 자산의 가격이 묶인 상태로 유지된다는 것이다. 즉 공적분이 유지되는 한 어느 한 자산의 가격이 다른 한 자산의 가격에 비해 지나치게 높거나 낮을 수 없다

Cointegration vs Correlation

  •  cointegration 과 correlation은 잘 정의된 관계가 존재하지 않는다. 공적분된 시계열이 상관 관계가 낮을 수 있으며, 상관 관계가 높은 시계열이 전혀 공적분되지 않을 수도 있다.
  • Coinegration은 price의 장기적 관계를 나타낸다,  Correlation은 return의 단기적 관계를 나타낸다

위 그림은 공적분 시계열의 예와 20일 rolling correlation 의 변동을 보여준자. 두 자산 가격 시계열이 공적분되어 함께 움직이더라도 수익률 간의 상관 관계가 음의 상관관계를 갖는 기간이 존재함을 알 수 있다

 

공적분되지 않은 상관관계가 높은 두 가지 가격 시리즈의 예시이다. Engle-Granger 테스트는 ADF 통계 값은 0.41로이는 90% 유의성에서도 귀무 가설(계열이 공적분되지 않음)을 기각할 수 없다

 

 

 

https://hudsonthames.org/an-introduction-to-cointegration/

 

An Introduction to Cointegration for Pairs Trading - Hudson & Thames

This post covers the basic concepts of cointegration for pairs trading, cointegrated pairs' simulation, and the most used cointegration tests

hudsonthames.org