hojeomi blog
Day 11-1. 조건부 확률, 베이즈 정리 본문
1. 조건부 확률이란?
- 조건부확률 P(A|B)는 사건 B가 일어났을 때, 사건 A가 발생할 확률
- A 교집합 B = P(B)*P(A|B) = P(A)*P(B|A)
- 베이즈 통계학을 이해하기 위해 조건부확률의 개념을 이해해야 함
- 베이즈 정리는 조건부확률을 이용하여 정보를 갱신하는 방법을 알려줌
2. 베이즈 정리
- 베이즈 정리를 통한 정보의 갱신
- 베이즈 정리를 통해 새로운 데이터가 들어왔을 때 앞서 계산한 사후확률을 사전확률로 사용하여 갱신된 사후확률을 계산할 수 있음
- 예제정리 '베이즈 정리 예제' 참고
3. Confusion Matrix
- P(D|ㄱtheta)
- 예) 코로나에 걸리지 않았을 때, 걸렸다고 검진결과가 나왔을 때(측정한 데이터 D)
- 이를 오탐, 즉 False alarm이라고 함
- P(ㄱtheta)*P(D|ㄱtheta)는 False Positive, 즉 1종 오류
- False alarm을(1종 오류) 조금 포기하더라도, 2종 오류를 줄이는 것에 더 노력을 기울임
- 2종 오류는 코로나에 걸렸으나 걸리지 않았다고 검진결과가 나오는 경우
3. 조건부 확률과 인과관계
- 조건부 확률은 유용한 통계적 해석을 제공하지만 인과관계(casuality)를 추론할 때 함부로 사용해서는 안 됨
- 인과관계는 데이터의 분포의 변화에 강건한 예측모형을 만들 때 필요
- 단, 인과관계만으로는 높은 예측 정확도를 담보하기 어려움
- 다음과 같은 경우가 생길 수 있으므로, 인과관계를 파악하는 것이 중요
- 인과관계를 알아내기 위해서는 중첩요인(confounding factor)의 효과를 제거하고 원인에 해당하는 변수만의 인과관계를 계산해야 함
- 중첩효과를 제거하지 않으면 가짜 연관성(spurious correlation)이 나옴
- 예제정리 '베이즈 정리 → 인과관계 추론 예제' 참고
'AI > Course' 카테고리의 다른 글
Day 12-2. CNN (0) | 2021.02.02 |
---|---|
Day 12-1. 최적화 (0) | 2021.02.02 |
Day 10. 통계학 맛보기 (0) | 2021.01.29 |
Day 8. 딥러닝 학습방법 이해하기 (0) | 2021.01.29 |
Day 7. 경사하강법 (0) | 2021.01.26 |
Comments