주제별 카테고리 분류 115

[무역 | Phase2] 보건용 마스크 수출입 동향 - Python pandas 기본 (1부)

[무역 | Phase2] 보건용 마스크 수출입 동향 - Python pandas 기본 (1부)   제 1번 자료  2019.1~ 2020.4 완제 마스크 (HS code 6307909000)의 월별 수출입실적 데이터 가공  작성한 code를 먼저 보여 드리고, 각 라인별로 의미를 설명 드리겠습니다. import pandas as pdimport matplotlib.pyplot as pltfrom matplotlib import font_manager, rcfont_name = font_manager.FontProperties(fname="c:/Windows/Fonts/batang.ttc").get_name()rc('font', family=font_name)# 품목별 수출입실적 xlsx 파일을 pand..

[무역 | Phase1] 보건용 마스크 수출입 동향 - 공공데이터포털 데이터수집 (2부)

[무역 | Phase1] 보건용 마스크 수출입 동향 - 공공데이터포털 데이터수집 (2부)   지난 포스팅을 통해 보건용 마스크의 월별 수출입실적 raw data mining을 하였는데요. 이 주제에 대해서는 추가적으로 국가별 수출입실적도 살펴 보는 것이 좋을 것 같습니다. 이에, Data mining을 추가로 진행해 보겠습니다. 지난 시간 포스팅에서의 링크를 아래의 제 1유형 사용에 관한 문구를 명시하면서 다시 타고, 들어가 보겠습니다.  "본 저작물은 관세청에서 2020년 작성하여 공공누리 제1유형으로 개방한 '(수출입무역통계정보) HS 품목별 국가별 수출입 실적(작성자:관세청 정보화기획 담당관)'을 이용하였으며, 해당 저작물은 '관세청, https://unipass.customs.go.kr/ets/i..

[무역 | Phase1] 보건용 마스크 수출입 동향 - 공공데이터포털 데이터수집 (1부)

[무역 | Phase1] 보건용 마스크 수출입 동향 - 공공데이터포털 데이터수집 (1부)   직전까지 작성한 부동산 카테고리에서는 고양시 아파트 현황조사 데이터를 이용해 데이터 수집/가공/시각화의 기본기를 닦았습니다. 이제 이번 카테고리 무역 주제를 통해서 파이썬 활용능력을 좀 더 고도화 해 보도록 하겠습니다.   무역카테고리의 제 1주제로 필자는 온 국민의 관심사가 될 수 밖에 없는 아이템.. 보건용 마스크에 대한 통계를 다루어 보도록 하겠습니다. 그리고 보건용 마스크의 시장성이나 우리나라 업계의 생산능력 등에 대해 유추해 볼까 합니다.      필자는 무역/통관업계 종사자로서 네이버 블로그를 통해 수출입에 관련한 전반적인 법령 요건 등에 대해 정보 제공을 병행하고 있습니다. 아래의 네이버 블로그에서 ..

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (4부)

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (4부) 시각화를 주제로 벌써 4부까지 흘러 왔습니다. 이제 마지막 (3)번 질문으로 matplotlib 살짝 들여다 보기를 완결해 보도록 하겠습니다. (3) 공동주택 건물 유형별로 공급되어 있는 세대수는 얼마나 될까? 이번 질문에 대한 data processing은 [부동산 | Phase2] 지역단위 아파트 현황조사 - Python coding (4부)에서 다루었습니다. 그리고, 우리는 a12_APTstat_Goyang과 a13_APTstat_Goyang이라는 파일명을 가진 엑셀파일로 a12 DataFrame과 a13 DataFrame을 저장해 두었습니다. a12 DataFrame에서는 피벗테이블 형식으로 '행정동별 건물유..

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (3부)

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (3부) 지난 포스팅에서 예고했던 행정동별 세대수 수직막대그래프와 행정동별 건령 선형그래프를 한 개의 chart에 그리는 방법을 살펴 보도록 하겠습니다. 우선 행정동별 세대수 막대그래프는 지난 시간에 수평막대그래프로 그려 보았습니다. 그런데, 선형 그래프를 수평막대그래프와 매치하는 것은 최종 결과물의 시인성을 추정해 보았을 때 그리 좋지 못합니다. 해서 행정동별 세대수 그래프는 수직막대그래프로 다시 고쳐 그려 보겠습니다. x1 = b1['행정동'] y1 = b1['세대수'] plt.bar(x1, height=y1, width=0.5, align='center', color='blue', alpha=1.0, edgecolor=..

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (2부)

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (2부) 지난 시간 포스팅에 연이어 (2)번 질문으로 이번에는 '행정동별 공급된 세대수'를 수평막대그래프로 시각화해 보겠습니다. matplotlib의 기초를 어느 정도 익혔으니, 곧바로 코딩을 살펴 보겠습니다. b1 = pd.read_excel('C:\\Users\\USER\\Desktop\\example\\a8_APTstat_Goyang.xlsx') x1 = b1['세대수'] y1 = b1['행정동'] plt.barh(y1, width=x1, height=0.5, align='center', color='blue', alpha=1.0, edgecolor='grey', linewidth=0.3) plt.tick_params(..

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (1부)

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (1부) {금번 포스팅부터 경어체로 바꾸도록 하겠습니다. } 지난 포스팅까지 Phase2를 통해 데이터 가공작업을 완료하였고, 이번 포스팅부터는 가공된 데이터를 시각화해 보도록 하겠습니다. matplotlib 소개 Python에서 널리 사용되는 시각화 라이브러리로는 matplotlib이 있습니다. matplotlib의 공식 사이트를 방문해 보시면 이 라이브러리가 얼마나 다양한 유형의 전문화된 통계 데이터 시각화 방법을 제공하는지 확인이 가능하신데요. 아래 링크를 걸어 드리니, 한 번 들르려서 참조해 보시면 좋겠습니다. 공식사이트 홈페이지 : https://matplotlib.org/ 제공되는 도표 형식의 예제 Gallery:..

[부동산 | Phase2] 아파트 현황조사(고양시) - Python pandas 기본 (4부)

[부동산 | Phase2] 아파트 현황조사(고양시) - Python pandas 기본 (4부) 이제 마지막 물음에 도달하였다. (3) 공동주택 건물 유형별로 공급되어 있는 세대수는 얼마나 될까? 건물 유형별 공급 세대수는 앞선 포스팅에서와 마찬가지로 groupby.sum()을 이용하면 되겠다. 지난 번 포스팅의 기억을 되살리며, 필요한 series부터 추출해 보자.a9 = apt_Goyang[['건물유형','세대수','행정동','건령']] a10 = a9[['건물유형','세대수']].groupby(by="건물유형", as_index=False).sum() a11 = a10.sort_values(by="세대수", ascending=False) 파이참 터미널로 확인한 결과는 다음과 같다. 건물유형 세대수 3..

[부동산 | Phase2] 아파트 현황조사(고양시) - Python pandas 기본 (3부)

[부동산 | Phase2] 아파트 현황조사(고양시) - Python pandas 기본 (3부) 이제 두번째 질문으로 이어 나가 보자. (2) 고양시 공동주택의 건물나이(건령)는 어느 정도 되었고, 어떤 분포를 가지고 있을까? 지은지 5년 이내 신규 아파트는 얼마나 될까? 지난 시간에 data frame을 다루는 방법 몇 가지를 익혔고, 건령을 구하는 방법도 이미 진행하였다. 여러 개의 검색 조건 중 건령을 제일 먼저 계산 반영하였기에, 실질 질문 안에 들어 있는 건령에 대한 부분은 이미 계산이 끝났다. z = apt_Goyang['사용검사일'] apt_Goyang['사용승인연도'] = z.str[0:4] apt_Goyang['사용승인연도'] = apt_Goyang['사용승인연도'].astype(int) ..

[부동산 | Phase2] 아파트 현황조사(고양시) - Python pandas 기본 (2부)

[부동산 | Phase2] 아파트 현황조사(고양시) - Python pandas 기본 (2부) 이제 지난 시간 가졌던 몇가지 예시 물음에 대해 답을 찾아가보자. (1) 행신동에 지은지 20년 이내 아파트 단지는 어떤 것이 있을까? 우선 우리의 물음에 대한 정의 부터 파악해 보자. '지은지 20년 이내'에서 지었다라고 표현하려면 어느 항목이 적합할까? 사용검사일이라는 항목의 정의를 검색해 보았더니, 아래의 간략한 정의를 찾을 수 있었다. 준공일을 의미하며 입주 개시 약 2~5일 전이 일반적으로 사용 검사일이 됩니다 정의로 보아, 사용검사일을 지은 날로 보는 것이 타당하겠다. 이제 그렇다면 우리가 할 일은 오늘날짜로부터 사용검사일까지의 시간차가 20년 이내에 있는 아파트만 계산상 분리해 내면 되겠다. 정확히..