본문 바로가기
LG Aimers(AI 전문가 과정)/Module 5. 인과추론

Part 1. Causality

by 전주혁 2022. 7. 29.

Module 5. 인과추론은 서울대학교 이상학 교수님이 강의를 하셨고 Module 5에 관한 모든 내용은 LG Aimers 및 서울대학교 이상학 교수님으로부터 나왔다.

 

 

Causality(인과성)

인과성과 AI, ML, DS는 어떤 관계인가?

1. AI

  - 주어진 상황에서 어떤 행동을 취할지 학습(ex, 강화학습)

    -> 환경에 변화를 줘서 원하는 상태로 변화시키는 인과관계로 해석 가능

 

2. ML(Machine Learning)

  - 데이터의 상관성 학습

 

3. DS(Data Science)

  - 상관성과 인과성 모두 복합적으로 고려

 

 

 

Pearl's Causal Hierarchy

Level 1 : 관측 계층(Associational or Observational)

 - 시스템을 구성하고 있는 변수들의 상관성 파악 가능

Level 2 : 실험 계층(Interventional or Experimental)

 - 실험을 통해 나오는 결과 파악 가능

Level 3 : 반사실적 계층(Counterfactual)

 - 관측값과 실험에 의한 값을 동시에 고려하는 반사실적 계층

 

 

데이터를 분석하고자 할 때 고려해야 하는 두 가지

1. 주어진 데이터가 상관성을 지니는지 인과성을 지니는지

2. 우리가 알고자 하는 그 질문이 그냥 단순히 조건부 확률 같은 상관성에 관한 것인지, 인과성에 관한 것인지

 

 

인과추론

 - 인과적인 통찰을 이용하는 모든 추론 즉, causal inference라고 정의

 - 알 수 없는 실험 결과를 관측 데이터와 연결하는 것

  -> 블랙박스에 대한 형식적, 수학적인 이해 필요

 

 

 Causal Framework : SCM(Structural Causal Model)

  - 4-tuple  <V, U, F, P(U)>

   -> U : 관측되지 않은 변수

   -> P(U) : 관측되지 않은 변수에 대한 불확실성을 확률분포로 정의

   -> V : 관측 가능한 변수

   -> F : 관측가능한 변수에 대해서 값들이 어떻게 계산되는지 정의하는 함수

 

 

 

중재

 - 주어진 모델에서 변수 x를 중재한다고 하는 것은 해당 변수가 원래 f(x)라는 함수에 의해서 값이 결정됐는데 그 값을 임의의 상수로 고정하는 것이다.

 - 변수 x가 고정되면 기존의 모델이 아닌 고정된 모델이 만들어지므로 기존의 f(x)를 Mx라 표현하고 submodel이라고 정의함

 

 

Summary

 - SCM은 인과추론을 공부하기 위한 기본적, 수학적 Framework를 제공하고 4가지 요소로 이루어져 있음

 - SCM의 3가지 분포가 모두 수학적 분포로 정의가 된다

 - 모델의 부분적인 정보를 causal diagram을 가정을 해서 관계 파악

 - causal diagram은 가정에 의해 만들어지고 상식, 전문가의 지식에 의해 생성

 - 모델을 통해서 중재를 수학적으로 정의했고 중재를 통해 원래 모델이 아닌 submodel을 만들어서 중재된 변수를 삭제시킨 그래프 그림

 - 인과 효과는 변수 y가 중재를 했을 때 어떤 식으로 변할 것인가를 의미