빅데이터에서의 거짓관계 분석

2018 
최근 자동으로 수집되거나 머신러닝(machine learning)에서 얻어지는 빅데이터에서 두 변수간의 거짓관계(spurious relations) 여부가 관심인 경우가 많다. 거짓관계는 두 변수의 관계가 서로 인과적으로(causally) 관계있지 않으나 제 3의 변수인 교락변수(confounding variable)에 의해 잘못 해석될 수 있는 관계로 정의된다. 본 연구에서는 교락변수의 정의, 교락변수의 종류, 교락변수와 구분되는 매개변수(mediators) 및 효과변경인자(effect modifier), 교락변수를 찾는 방법 등에 관해 사례와 함께 논하고자 한다.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []