파이썬(Python)/고양시 아파트 현황 조사 10

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (4부)

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (4부) 시각화를 주제로 벌써 4부까지 흘러 왔습니다. 이제 마지막 (3)번 질문으로 matplotlib 살짝 들여다 보기를 완결해 보도록 하겠습니다. (3) 공동주택 건물 유형별로 공급되어 있는 세대수는 얼마나 될까? 이번 질문에 대한 data processing은 [부동산 | Phase2] 지역단위 아파트 현황조사 - Python coding (4부)에서 다루었습니다. 그리고, 우리는 a12_APTstat_Goyang과 a13_APTstat_Goyang이라는 파일명을 가진 엑셀파일로 a12 DataFrame과 a13 DataFrame을 저장해 두었습니다. a12 DataFrame에서는 피벗테이블 형식으로 '행정동별 건물유..

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (3부)

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (3부) 지난 포스팅에서 예고했던 행정동별 세대수 수직막대그래프와 행정동별 건령 선형그래프를 한 개의 chart에 그리는 방법을 살펴 보도록 하겠습니다. 우선 행정동별 세대수 막대그래프는 지난 시간에 수평막대그래프로 그려 보았습니다. 그런데, 선형 그래프를 수평막대그래프와 매치하는 것은 최종 결과물의 시인성을 추정해 보았을 때 그리 좋지 못합니다. 해서 행정동별 세대수 그래프는 수직막대그래프로 다시 고쳐 그려 보겠습니다. x1 = b1['행정동'] y1 = b1['세대수'] plt.bar(x1, height=y1, width=0.5, align='center', color='blue', alpha=1.0, edgecolor=..

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (2부)

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (2부) 지난 시간 포스팅에 연이어 (2)번 질문으로 이번에는 '행정동별 공급된 세대수'를 수평막대그래프로 시각화해 보겠습니다. matplotlib의 기초를 어느 정도 익혔으니, 곧바로 코딩을 살펴 보겠습니다. b1 = pd.read_excel('C:\\Users\\USER\\Desktop\\example\\a8_APTstat_Goyang.xlsx') x1 = b1['세대수'] y1 = b1['행정동'] plt.barh(y1, width=x1, height=0.5, align='center', color='blue', alpha=1.0, edgecolor='grey', linewidth=0.3) plt.tick_params(..

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (1부)

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (1부) {금번 포스팅부터 경어체로 바꾸도록 하겠습니다. } 지난 포스팅까지 Phase2를 통해 데이터 가공작업을 완료하였고, 이번 포스팅부터는 가공된 데이터를 시각화해 보도록 하겠습니다. matplotlib 소개 Python에서 널리 사용되는 시각화 라이브러리로는 matplotlib이 있습니다. matplotlib의 공식 사이트를 방문해 보시면 이 라이브러리가 얼마나 다양한 유형의 전문화된 통계 데이터 시각화 방법을 제공하는지 확인이 가능하신데요. 아래 링크를 걸어 드리니, 한 번 들르려서 참조해 보시면 좋겠습니다. 공식사이트 홈페이지 : https://matplotlib.org/ 제공되는 도표 형식의 예제 Gallery:..

[부동산 | Phase2] 아파트 현황조사(고양시) - Python pandas 기본 (4부)

[부동산 | Phase2] 아파트 현황조사(고양시) - Python pandas 기본 (4부) 이제 마지막 물음에 도달하였다. (3) 공동주택 건물 유형별로 공급되어 있는 세대수는 얼마나 될까? 건물 유형별 공급 세대수는 앞선 포스팅에서와 마찬가지로 groupby.sum()을 이용하면 되겠다. 지난 번 포스팅의 기억을 되살리며, 필요한 series부터 추출해 보자.a9 = apt_Goyang[['건물유형','세대수','행정동','건령']] a10 = a9[['건물유형','세대수']].groupby(by="건물유형", as_index=False).sum() a11 = a10.sort_values(by="세대수", ascending=False) 파이참 터미널로 확인한 결과는 다음과 같다. 건물유형 세대수 3..

[부동산 | Phase2] 아파트 현황조사(고양시) - Python pandas 기본 (3부)

[부동산 | Phase2] 아파트 현황조사(고양시) - Python pandas 기본 (3부) 이제 두번째 질문으로 이어 나가 보자. (2) 고양시 공동주택의 건물나이(건령)는 어느 정도 되었고, 어떤 분포를 가지고 있을까? 지은지 5년 이내 신규 아파트는 얼마나 될까? 지난 시간에 data frame을 다루는 방법 몇 가지를 익혔고, 건령을 구하는 방법도 이미 진행하였다. 여러 개의 검색 조건 중 건령을 제일 먼저 계산 반영하였기에, 실질 질문 안에 들어 있는 건령에 대한 부분은 이미 계산이 끝났다. z = apt_Goyang['사용검사일'] apt_Goyang['사용승인연도'] = z.str[0:4] apt_Goyang['사용승인연도'] = apt_Goyang['사용승인연도'].astype(int) ..

[부동산 | Phase2] 아파트 현황조사(고양시) - Python pandas 기본 (2부)

[부동산 | Phase2] 아파트 현황조사(고양시) - Python pandas 기본 (2부) 이제 지난 시간 가졌던 몇가지 예시 물음에 대해 답을 찾아가보자. (1) 행신동에 지은지 20년 이내 아파트 단지는 어떤 것이 있을까? 우선 우리의 물음에 대한 정의 부터 파악해 보자. '지은지 20년 이내'에서 지었다라고 표현하려면 어느 항목이 적합할까? 사용검사일이라는 항목의 정의를 검색해 보았더니, 아래의 간략한 정의를 찾을 수 있었다. 준공일을 의미하며 입주 개시 약 2~5일 전이 일반적으로 사용 검사일이 됩니다 정의로 보아, 사용검사일을 지은 날로 보는 것이 타당하겠다. 이제 그렇다면 우리가 할 일은 오늘날짜로부터 사용검사일까지의 시간차가 20년 이내에 있는 아파트만 계산상 분리해 내면 되겠다. 정확히..

[부동산 | Phase2] 아파트 현황조사(고양시) - Python coding (1부)

[부동산 | Phase2] 아파트 현황조사(고양시) - Python coding (1부) 지난 두 번의 포스팅에서는 데이터의 전처리 과정을 진행하였다. 이제 어느 정도 오류값이 정리된 데이터 파일을 가지고 시각화를 진행해 보도록 하겠다. 필자로서는 독자분들이 어느 정도 수준으로 Python을 알고 계시고, 현재 활용하고 계신지 알 수 없다. 다만, 이미 Python에 대해 매우 높은 수준의 활용능력을 가지고 계신 분들이라면 사실 이 글에 대한 관심도가 떨어질 수 밖에 없어 검색하여 들어오시지도 않으셨으리라 생각된다. 아마도 Python을 이제 공부하고 계시고, 어떻게 실제 데이터를 들고 활용할 것인지에 대해 공부 중이신 분들이 대부분 이시지 않을까 생각된다. 필자도 처음 Python을 익힐 때엔 파이썬에..

[부동산 | Phase1] 아파트 현황조사(고양시) - Data Mining & Refining (2부)

[부동산 | Phase1] 아파트 현황조사(고양시) - Data Mining & Refining (2부) Data Refining 지난 포스팅에 이어 Data refining에 대해 얘기해 보자. 우리가 작성하게 될 code는 일관된 규칙을 가지고 입력된 데이터에 적용된다. 간단히, 사칙연산을 예로 들어보자. a = b + c라는 형태의 코드를 작성했다면, b와 c값을 주면 a값을 도출해 준다. 그런데, 모두가 다 아시다시피 사칙연산이라는 것은 숫자를 입력했을 때 적용된다. b = 3 , c = 월 이라고 값을 준다면 python은 a라는 값을 계산할 수 없다는 오류를 return한다. 즉, 해당 code의 적용을 위해 제한이 주어진 자료형을 일치시켜 주어야 한다는 것이다. 이제 우리 실생활에서의 업무 ..

[부동산 | Phase1] 아파트 현황조사(고양시) - Data Mining & Refining (1부)

[부동산 | Phase1] 아파트 현황조사(고양시) - Data Mining & Refining (1부) 가장 먼저 다뤄볼 주제로 무엇이 좋을지 고민을 거듭하였다. 앞선 글에서 언급한 Data의 요건 기준으로 유용한 Data 분석 가치를 가진 것이 무엇이 있을지를 깊이 고려해 보았고, 결론적으로 우리가 몸 뉘우는 우리의 집에 관한 이야기로 가볍게 이 여정을 시작하기로 하였다. 앞으로 주제를 가지고 글을 올릴 때엔 다음과 같은 형태를 갖추어 글을 세분류해 올리고자 한다. (1) Phase 1 - Data Mining 및 Refining과 항목 이해 (2) Phase 2 - Data analysis(분석 알고리즘 구성) (3) Phase 3 - 정보 도출과 의미 파악하기 Phase 1에서는 우리가 수집하게 ..