알파트로스

Graph - Laplacian Matrix 본문

Financial ML Playground/Network&Graph

Graph - Laplacian Matrix

알파트로스 2024. 6. 29. 14:34

 

Laplacian Matrix

  • 정의 :
    L=DA
    D는 노드의 차수를 나타내는 대각 행렬 각 대각 원소 Dii는 노드 i의 차수
    A는 그래프의 인접 행렬

  • 금융 네트워크에서의 활용
    • 커뮤니티 구조 식별
      라플라시안 행렬은 금융 네트워크 내의 클러스터 또는 커뮤니티를 식별하는 데 사용될 수 있다
    • 위험 관리
      라플라시안 행렬의 고유값과 고유벡터를 분석하여, 네트워크에 중요한 노드를 식별하고, 해당 노드의 실패가 네트워크에 미치는 영향을 평가할 수 있다.

Signed Laplacian Matrix

  • 정의 
    Lsigned=DAsigned

  • 금융 네트워크에서의 활용
    • 신뢰/불신 네트워크 분석
      신뢰 네트워크에서는 양수 엣지가 높은 신뢰도를 나타내고, 음수 엣지가 높은 리스크나 불신을 나타내므로, 이를 통해 네트워크의 전반적인 리스크를 평가할 수 있다.
      기업들 간의 신뢰 관계는 긍정적인 협력 관계로, 불신 관계는 경쟁 관계로 볼 수 있다. Signed Laplacian Matrix를 사용하여 다음과 같은 분석을 수행할 수 있다
      - 네트워크 내에서 신뢰 관계가 강한 부분을 식별하고, 이 부분이 네트워크의 안정성에 미치는 영향을 평가
      - 불신 관계가 집중된 부분을 식별하고, 이러한 관계가 전체 네트워크의 리스크에 어떻게 영향을 미치는지 평가
      - 신뢰/불신 관계를 기반으로 커뮤니티를 식별하여, 금융 네트워크 내에서 협력적 또는 경쟁적 집단을 분석
  • 예시
    Asigned=[0110101111010110] D=[2000030000300002] Lsigned=DAsigned=[2000030000300002][0110101111010110]=[2110131111310112]


Symmetric Normalized Laplacian

  • 정의:
    Lsym=ID12AD12
    • 대각 원소 (Lsym[i,i]): 항상 1이다.
      이는 노드가 자신과의 관계를 나타내며, 자기 자신과의 정규화된 연결 강도는 항상 1로 유지된다.
    • 비대각 원소 (Lsym[i,j], ij)
      인접 노드 간의 관계를 나타내며, 정규화된 값으로 표현된다. 이는 노드의 연결 강도를 균형 있게 반영한다.
  • 금융 네트워크에서의 활용
    • 정규화된 영향 분석
      각 노드의 영향력을 정규화하여 비교할 수 있다. 이는 다양한 크기의 주체들이 있는 네트워크에서 중요하다.
    • 스펙트럴 클러스터링
      스펙트럴 클러스터링에 사용되어, 금융 네트워크 내의 유사한 행동을 보이는 주체들을 식별할 수 있다.
  • 예시
    A=[0110101111010110] D=[2000030000300002] D12=[12000013000013000012] D12AD12=[12000013000013000012][0110101111010110][12000013000013000012]=[016160160131321613013201321320] Lsym=ID12AD12=[1000010000100001][016160160131321613013201321320]=[116160161131321613113201321321]


Random Walk Normalized Laplacian

  • 정의
    Lrw=ID1A
    • 대각 원소 (Lrw[i,i]) : 항상 1이다. 
    • 비대각 원소 (Lrw[i,j], ij) : 인접 노드 간의 관계를 나타내며, 정규화된 값으로 표현된다.
  • 금융 네트워크에서의 활용:
    • 확산 과정 모델링
      금융 네트워크 내에서의 정보나 충격의 확산 과정을 모델링할 수 있다.
    • 랜덤 워크 기반 분석
      랜덤 워크 프로세스를 통해 네트워크 내에서 특정 노드의 중요성을 평가하거나, 자산의 상관 관계를 분석할 수 있다.
  • 예시
    A=[0110101111010110] D=[2000030000300002] D1=[12000013000013000012] D1A=[12000013000013000012][0110101111010110]=[01212013013131313013012120] Lrw=ID1A=[1000010000100001][01212013013131313013012120]=[11212013113131313113012121]


Symmetric Normalized Laplacian 와 Random Walk Normalized Laplacian 의 차이점 비교

 

두 라플라시안은 서로 다른 방식으로 그래프 구조를 표현하며, 각각의 장단점이 있다. Lsym은 그래프의 전체적인 구조를 분석하는 데 더 적합하고, Lrw는 노드 간의 전이 확률을 직접적으로 표현하여 확산 과정을 모델링하는 데 더 유용하다. 사용 목적과 분석하고자 하는 그래프의 특성에 따라 적절한 라플라시안을 선택하는 것이 중요하다.

  1. 대칭성
    Lsym은 대칭 행렬 이는 행렬의 고유값이 모두 실수이며, 고유벡터가 직교한다는 의미이다
    Lrw는 일반적으로 비대칭 행렬 이는 행렬의 고유값이 실수 또는 복소수일 수 있음을 의미한다

  2. 고유값 & 고유벡터
    Lsym고유값이 [0, 2] 구간에 위치하며, 작은 고유값은 그래프의 클러스터 구조를 반영한다.
    Lrw 고유값이 [0, 1] 구간에 위치하며, 작은 고유값은 느린 확산 과정을 반영한다
    Lsym과 Lrw는 같은 고유값을 가진다. 이는 두 행렬이 스펙트럼 특성을 공유함을 의미한다.
    Lsym의 고유벡터 vLrw의 고유벡터 u 사이에는 u=D(1/2)v 관계가 있다.

  3. 해석
    Lsym: 노드의 차수에 따라 양방향으로 정규화된다. 이는 무방향 그래프의 구조를 잘 보존한다
    Lrw: 랜덤 워크의 전이 확률을 직접 나타낸다. 각 행의 합이 0이 되어, 확률 해석이 용이하다

  4. 그래프 표현:
    Lsym: 엣지의 가중치가 양 끝 노드의 차수에 의해 정규화된다.
    Lrw: 엣지의 가중치가 출발 노드의 차수에 의해서만 정규화된다.

  5.  응용:
    Lsym 은스펙트럴 클러스터링에 주로 사용되며, 그래프의 전체적인 구조를 분석하는 데 유용하다.
     Lrw는 랜덤 워크 관점에서 그래프 내에서 정보나 충격이 확산되는 과정을 모델링. 이는 네트워크에서 노드의 중요도와 연결성을 평가하는 데 유용하다
     Lrw  구글의 페이지랭크 알고리즘에서 사용하는 행렬은 랜덤 워크 정규화 라플라시안과 유사하다 웹 페이지 간의 링크 구조를 모델링하여 페이지의 중요도를 평가한다.