본문 바로가기 주메뉴 바로가기

국가수리과학연구소

검색 ENGLISH 메뉴 전체보기

문제해결 보고서

구글로 퍼가기 프린트하기

실거래가 패턴분석을 통한 지역 및 개별 아파트 군집화

  • 산업문제명실거래가 패턴분석을 통한 지역 및 개별 아파트 군집화
  • 기업(주)지인플러스
  • 키워드시계열 데이터, 유사도 분석, 군집화, K-means, 정규화
  • 산업문제 내용· 기업소개: (주)지인플러스는 빅데이터 기반의 부동산 정보를 제공하는 스타트업 기업으로 지역 분석 및 아파트 가치에 대한 데이터 플랫폼 부동산 지인을 개발 운영하고 있다. · 산업문제: 세대수가 많고 거래가 활발한 아파트는 실거래가 시계열 데이터를 활용해서 해당 가치 상승 하락 시세 패턴을 분석하기 쉽다. 또한, 이 실거래가 시계열 데이터를 활용해서 해당 아파트와 패턴이 유사한 아파트를 쉽게 찾을 수 있다. 하지만 거래량이 적거나 세대수가 적은 아파트는 실거래가 자료가 없어서 어떠한 시세 패턴(가격 상승 및 하락)을 따르는지 파악하기가 어렵다. 그래서 기업은 공개된 다양한 부동산 공공 데이터를 활용하여 실거래가 없는 아파트들에 대해서 합리적이고 수학적인 가치평가 방법을 찾고자 연구소에 문제를 의뢰하였다. 거래가 충분한 아파트의 거래 정보로부터 시세 패턴을 추출하여 대표 패턴 (representatives)을 생성하고 거래가 없는 아파트가 어떠한 시세 패턴을 보일 것인지 추정하는 수학적인 방법을 찾는 것을 목표하였다.
  • 문제해결 결과· 제시된 해결방안: 1. (실거래가 패턴 추출) 거래가 많은 아파트의 기준을 설정하고 분석 대상인 시계열 시세 패턴을 추출하는 방법을 찾아서 제시하였다. 단순 거래량이 아닌 거래가 있는 유 개월 수의 비율을 통해서 아파트를 필터링하고 평활화(smoothing)와 선형보간(linear interpolation)을 수행하였다. 평활화 방법으로는 사이즈를 5로 한 rolling median을 적용하였다. 2. (시계열 패턴 군집화) 아파트 대표 패턴의 유사도를 측정하는 방법과 군집화하는 유의미한 방법을 찾아서 제시하였다. 시계열 데이터를 L1 정규화하고 Euclidean 거리로 유사도를 측정하였다. 그리고 L1 정규화된 공간에서 K-means 알고리즘으로 군집화하였다. 3. 아파트를 클러스터로 라벨링하고 아파트의 특성 정보(위치, 평균거래가, 건축연도, 용적률, 연면적 등)로 분류하는 모델을 적용하여 특성 정보로 시세 패턴 매칭이 가능한지 확인하였다. 또한 어떤 특성 정보가 상승 하락 시세 패턴에 큰 영향을 미치는지 분석하였다. · 활용계획 및 기대성과: 1. 스케일이 다른 시계열 데이터의 패턴 유사도 분석 방법을 기업의 플랫폼에 탑재 예정에 있다. 또한 수학적으로 의미있고 설명 가능한 시계열 데이터 군집화 방법을 제시하였다. 2. 시계열 데이터의 선행 후행 분석 및 일반 거리를 활용한 군집화 방법 연구라는 새로운 연구 주제를 발굴하여 향후 연구소에서 연구할 예정이다.

이 페이지에서 제공하는 정보에 대해 만족하십니까?

icim 산업수학혁신센터

Ranking TOP5
채용공고
조직도
산업수학기반연구부
의료수학연구부
인사말

nims insight

TOP