주택실거래가 데이터 구축 및 활용에 관한 연구

2016 
국토교통부에서 제공하는 주택실거래가 데이터는 대표적인 공공데이터이다. 주택실거래가 데이터를 활용하면 주택정책에 대한 다양한 제언과 주택시장 참가자들에게 가치 있는 정보를 제공할 수 있다. 주택실거래가 데이터는 2006년 이후 거래 건수가 약 1,390만건 이상으로 양적인 측면에서 빅데이터로서의 자격을 충분히 갖고 있다. 하지만 현재 주택실거래가 엑셀파일의 시트 개수가 9,900여개에 육박하고 앞으로도 계속 늘어나는 상황에서 이처럼 방대한 엑셀시트를 하나의 데이터세트로 만들기 위해서는 엄청난 시간의 작업이 요구된다. 본 연구에서는 주택실거래가의 공개된 원자료와 연구용 데이터 사이의 갭을 메우기 위한 방법을 제안한다. Stata 통계프로그램을 이용해 주택실거래가 데이터를 자동으로 불러와 연구자가 원하는 연구용 데이터세트로 만드는 시스템을 구축하여 이를 공개한다. 또한 연구자가 이렇게 만든 연구용 데이터를 통해 어떠한 가치를 창출할 수 있는지 간단한 예시적 분석을 통해 보여준다. 예제는 최근 주택임대차 시장이 전세에서 월세로 전환되는 상황을 반영하여 임대차 시장에서 월세거래가 차지하는 비율을 지수화 시킨 소위 월세전환지수를 쉽게 만들 수 있음을 보였다. 본 연구에서 제안한 시스템을 활용하면 주택실거래가 연구용 데이터를 구축하는 데 들어가는 시간과 노력을 대폭 절약할 수 있다. 이를 통해 연구자들은 데이터 구축보다는 분석 자체에 더 많은 노력을 기울여 연구의 질을 높이고, 주택실거래가 데이터의 공공데이터로서의 가치도 더 높일 수 있을 것으로 예상된다.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []