Module 5. 인과추론은 서울대학교 이상학 교수님이 강의를 하셨고 Module 5에 관한 모든 내용은 LG Aimers 및 서울대학교 이상학 교수님으로부터 나왔다.
Causality(인과성)
인과성과 AI, ML, DS는 어떤 관계인가?
1. AI
- 주어진 상황에서 어떤 행동을 취할지 학습(ex, 강화학습)
-> 환경에 변화를 줘서 원하는 상태로 변화시키는 인과관계로 해석 가능
2. ML(Machine Learning)
- 데이터의 상관성 학습
3. DS(Data Science)
- 상관성과 인과성 모두 복합적으로 고려
Pearl's Causal Hierarchy
Level 1 : 관측 계층(Associational or Observational)
- 시스템을 구성하고 있는 변수들의 상관성 파악 가능
Level 2 : 실험 계층(Interventional or Experimental)
- 실험을 통해 나오는 결과 파악 가능
Level 3 : 반사실적 계층(Counterfactual)
- 관측값과 실험에 의한 값을 동시에 고려하는 반사실적 계층
데이터를 분석하고자 할 때 고려해야 하는 두 가지
1. 주어진 데이터가 상관성을 지니는지 인과성을 지니는지
2. 우리가 알고자 하는 그 질문이 그냥 단순히 조건부 확률 같은 상관성에 관한 것인지, 인과성에 관한 것인지
인과추론
- 인과적인 통찰을 이용하는 모든 추론 즉, causal inference라고 정의
- 알 수 없는 실험 결과를 관측 데이터와 연결하는 것
-> 블랙박스에 대한 형식적, 수학적인 이해 필요
Causal Framework : SCM(Structural Causal Model)
- 4-tuple <V, U, F, P(U)>
-> U : 관측되지 않은 변수
-> P(U) : 관측되지 않은 변수에 대한 불확실성을 확률분포로 정의
-> V : 관측 가능한 변수
-> F : 관측가능한 변수에 대해서 값들이 어떻게 계산되는지 정의하는 함수
중재
- 주어진 모델에서 변수 x를 중재한다고 하는 것은 해당 변수가 원래 f(x)라는 함수에 의해서 값이 결정됐는데 그 값을 임의의 상수로 고정하는 것이다.
- 변수 x가 고정되면 기존의 모델이 아닌 고정된 모델이 만들어지므로 기존의 f(x)를 Mx라 표현하고 submodel이라고 정의함
Summary
- SCM은 인과추론을 공부하기 위한 기본적, 수학적 Framework를 제공하고 4가지 요소로 이루어져 있음
- SCM의 3가지 분포가 모두 수학적 분포로 정의가 된다
- 모델의 부분적인 정보를 causal diagram을 가정을 해서 관계 파악
- causal diagram은 가정에 의해 만들어지고 상식, 전문가의 지식에 의해 생성
- 모델을 통해서 중재를 수학적으로 정의했고 중재를 통해 원래 모델이 아닌 submodel을 만들어서 중재된 변수를 삭제시킨 그래프 그림
- 인과 효과는 변수 y가 중재를 했을 때 어떤 식으로 변할 것인가를 의미
'LG Aimers(AI 전문가 과정) > Module 5. 인과추론' 카테고리의 다른 글
Part 3. Modern Identification (0) | 2022.07.29 |
---|---|
Part 2. Causal Effect Identification (0) | 2022.07.29 |
Module 5. 인과추론 (0) | 2022.07.29 |