전체 글 117

[무역 | Phase2] 보건용 마스크 수출입 동향 - Python pandas 기본 (3부)

[무역 | Phase2] 보건용 마스크 수출입 동향 - Python pandas 기본 (3부)   제 2번 자료  2019.1~ 2020.4 완제 마스크 (HS code 6307909000)의 월별 국가별 수출입실적 데이터 가공  코딩 전문부터 보시겠습니다. # 품목별 국가별 수출입실적 xlsx 파일을 pandas DataFrame으로 불러오기b1 = pd.read_excel('C:\\Users\\USER\\Desktop\\example\\Trade\\품목별 국가별 수출입실적_6307909000.xlsx')# 불필요한 1번~4번행 지우기b2 = b1.drop(b1.index[0:3])# 불필요한 6번행 지우고, DataFrame의 index값을 다시 부여하기b3 = b2.drop(b1.index[4]..

[무역 | Phase2] 보건용 마스크 수출입 동향 - Python pandas 기본 (2부)

[무역 | Phase2] 보건용 마스크 수출입 동향 - Python pandas 기본 (2부)    1부에 이어, 7)번 코딩부터 살펴 보겠습니다.   코딩 전문은 지난 포스팅을 참조해 주세요.  링크 : [무역 | Phase2] 보건용 마스크 수출입 동향 - Python coding (1부)  df.rename()   pandas DataFrame Series 이름 다시 짓기   7) a5 = a4.rename(columns=a4.iloc[0])   상기 이미지상 a4 DataFrame을 보시면 0번 index행이 우리가 이 DataFrame의 각 Series의 이름임을 알 수 있습니다. 즉, 이 DataFrame은 아직 Series이름이 {품목별 수출입실적, Unnamed:1, ..., Unnamed..

[무역 | Phase2] 보건용 마스크 수출입 동향 - Python pandas 기본 (1부)

[무역 | Phase2] 보건용 마스크 수출입 동향 - Python pandas 기본 (1부)   제 1번 자료  2019.1~ 2020.4 완제 마스크 (HS code 6307909000)의 월별 수출입실적 데이터 가공  작성한 code를 먼저 보여 드리고, 각 라인별로 의미를 설명 드리겠습니다. import pandas as pdimport matplotlib.pyplot as pltfrom matplotlib import font_manager, rcfont_name = font_manager.FontProperties(fname="c:/Windows/Fonts/batang.ttc").get_name()rc('font', family=font_name)# 품목별 수출입실적 xlsx 파일을 pand..

[무역 | Phase1] 보건용 마스크 수출입 동향 - 공공데이터포털 데이터수집 (2부)

[무역 | Phase1] 보건용 마스크 수출입 동향 - 공공데이터포털 데이터수집 (2부)   지난 포스팅을 통해 보건용 마스크의 월별 수출입실적 raw data mining을 하였는데요. 이 주제에 대해서는 추가적으로 국가별 수출입실적도 살펴 보는 것이 좋을 것 같습니다. 이에, Data mining을 추가로 진행해 보겠습니다. 지난 시간 포스팅에서의 링크를 아래의 제 1유형 사용에 관한 문구를 명시하면서 다시 타고, 들어가 보겠습니다.  "본 저작물은 관세청에서 2020년 작성하여 공공누리 제1유형으로 개방한 '(수출입무역통계정보) HS 품목별 국가별 수출입 실적(작성자:관세청 정보화기획 담당관)'을 이용하였으며, 해당 저작물은 '관세청, https://unipass.customs.go.kr/ets/i..

[무역 | Phase1] 보건용 마스크 수출입 동향 - 공공데이터포털 데이터수집 (1부)

[무역 | Phase1] 보건용 마스크 수출입 동향 - 공공데이터포털 데이터수집 (1부)   직전까지 작성한 부동산 카테고리에서는 고양시 아파트 현황조사 데이터를 이용해 데이터 수집/가공/시각화의 기본기를 닦았습니다. 이제 이번 카테고리 무역 주제를 통해서 파이썬 활용능력을 좀 더 고도화 해 보도록 하겠습니다.   무역카테고리의 제 1주제로 필자는 온 국민의 관심사가 될 수 밖에 없는 아이템.. 보건용 마스크에 대한 통계를 다루어 보도록 하겠습니다. 그리고 보건용 마스크의 시장성이나 우리나라 업계의 생산능력 등에 대해 유추해 볼까 합니다.      필자는 무역/통관업계 종사자로서 네이버 블로그를 통해 수출입에 관련한 전반적인 법령 요건 등에 대해 정보 제공을 병행하고 있습니다. 아래의 네이버 블로그에서 ..

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (4부)

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (4부) 시각화를 주제로 벌써 4부까지 흘러 왔습니다. 이제 마지막 (3)번 질문으로 matplotlib 살짝 들여다 보기를 완결해 보도록 하겠습니다. (3) 공동주택 건물 유형별로 공급되어 있는 세대수는 얼마나 될까? 이번 질문에 대한 data processing은 [부동산 | Phase2] 지역단위 아파트 현황조사 - Python coding (4부)에서 다루었습니다. 그리고, 우리는 a12_APTstat_Goyang과 a13_APTstat_Goyang이라는 파일명을 가진 엑셀파일로 a12 DataFrame과 a13 DataFrame을 저장해 두었습니다. a12 DataFrame에서는 피벗테이블 형식으로 '행정동별 건물유..

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (3부)

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (3부) 지난 포스팅에서 예고했던 행정동별 세대수 수직막대그래프와 행정동별 건령 선형그래프를 한 개의 chart에 그리는 방법을 살펴 보도록 하겠습니다. 우선 행정동별 세대수 막대그래프는 지난 시간에 수평막대그래프로 그려 보았습니다. 그런데, 선형 그래프를 수평막대그래프와 매치하는 것은 최종 결과물의 시인성을 추정해 보았을 때 그리 좋지 못합니다. 해서 행정동별 세대수 그래프는 수직막대그래프로 다시 고쳐 그려 보겠습니다. x1 = b1['행정동'] y1 = b1['세대수'] plt.bar(x1, height=y1, width=0.5, align='center', color='blue', alpha=1.0, edgecolor=..

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (2부)

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (2부) 지난 시간 포스팅에 연이어 (2)번 질문으로 이번에는 '행정동별 공급된 세대수'를 수평막대그래프로 시각화해 보겠습니다. matplotlib의 기초를 어느 정도 익혔으니, 곧바로 코딩을 살펴 보겠습니다. b1 = pd.read_excel('C:\\Users\\USER\\Desktop\\example\\a8_APTstat_Goyang.xlsx') x1 = b1['세대수'] y1 = b1['행정동'] plt.barh(y1, width=x1, height=0.5, align='center', color='blue', alpha=1.0, edgecolor='grey', linewidth=0.3) plt.tick_params(..

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (1부)

[부동산 | Phase3] 아파트 현황조사(고양시) - matplotlib 기본 (1부) {금번 포스팅부터 경어체로 바꾸도록 하겠습니다. } 지난 포스팅까지 Phase2를 통해 데이터 가공작업을 완료하였고, 이번 포스팅부터는 가공된 데이터를 시각화해 보도록 하겠습니다. matplotlib 소개 Python에서 널리 사용되는 시각화 라이브러리로는 matplotlib이 있습니다. matplotlib의 공식 사이트를 방문해 보시면 이 라이브러리가 얼마나 다양한 유형의 전문화된 통계 데이터 시각화 방법을 제공하는지 확인이 가능하신데요. 아래 링크를 걸어 드리니, 한 번 들르려서 참조해 보시면 좋겠습니다. 공식사이트 홈페이지 : https://matplotlib.org/ 제공되는 도표 형식의 예제 Gallery:..

[부동산 | Phase2] 아파트 현황조사(고양시) - Python pandas 기본 (4부)

[부동산 | Phase2] 아파트 현황조사(고양시) - Python pandas 기본 (4부) 이제 마지막 물음에 도달하였다. (3) 공동주택 건물 유형별로 공급되어 있는 세대수는 얼마나 될까? 건물 유형별 공급 세대수는 앞선 포스팅에서와 마찬가지로 groupby.sum()을 이용하면 되겠다. 지난 번 포스팅의 기억을 되살리며, 필요한 series부터 추출해 보자.a9 = apt_Goyang[['건물유형','세대수','행정동','건령']] a10 = a9[['건물유형','세대수']].groupby(by="건물유형", as_index=False).sum() a11 = a10.sort_values(by="세대수", ascending=False) 파이참 터미널로 확인한 결과는 다음과 같다. 건물유형 세대수 3..