주제별 카테고리 분류 96

[부동산 | Phase2] 아파트 현황조사(고양시) - Python pandas 기본 (2부)

[부동산 | Phase2] 아파트 현황조사(고양시) - Python pandas 기본 (2부) 이제 지난 시간 가졌던 몇가지 예시 물음에 대해 답을 찾아가보자. (1) 행신동에 지은지 20년 이내 아파트 단지는 어떤 것이 있을까? 우선 우리의 물음에 대한 정의 부터 파악해 보자. '지은지 20년 이내'에서 지었다라고 표현하려면 어느 항목이 적합할까? 사용검사일이라는 항목의 정의를 검색해 보았더니, 아래의 간략한 정의를 찾을 수 있었다. 준공일을 의미하며 입주 개시 약 2~5일 전이 일반적으로 사용 검사일이 됩니다 정의로 보아, 사용검사일을 지은 날로 보는 것이 타당하겠다. 이제 그렇다면 우리가 할 일은 오늘날짜로부터 사용검사일까지의 시간차가 20년 이내에 있는 아파트만 계산상 분리해 내면 되겠다. 정확히..

[부동산 | Phase2] 아파트 현황조사(고양시) - Python coding (1부)

[부동산 | Phase2] 아파트 현황조사(고양시) - Python coding (1부) 지난 두 번의 포스팅에서는 데이터의 전처리 과정을 진행하였다. 이제 어느 정도 오류값이 정리된 데이터 파일을 가지고 시각화를 진행해 보도록 하겠다. 필자로서는 독자분들이 어느 정도 수준으로 Python을 알고 계시고, 현재 활용하고 계신지 알 수 없다. 다만, 이미 Python에 대해 매우 높은 수준의 활용능력을 가지고 계신 분들이라면 사실 이 글에 대한 관심도가 떨어질 수 밖에 없어 검색하여 들어오시지도 않으셨으리라 생각된다. 아마도 Python을 이제 공부하고 계시고, 어떻게 실제 데이터를 들고 활용할 것인지에 대해 공부 중이신 분들이 대부분 이시지 않을까 생각된다. 필자도 처음 Python을 익힐 때엔 파이썬에..

[부동산 | Phase1] 아파트 현황조사(고양시) - Data Mining & Refining (2부)

[부동산 | Phase1] 아파트 현황조사(고양시) - Data Mining & Refining (2부) Data Refining 지난 포스팅에 이어 Data refining에 대해 얘기해 보자. 우리가 작성하게 될 code는 일관된 규칙을 가지고 입력된 데이터에 적용된다. 간단히, 사칙연산을 예로 들어보자. a = b + c라는 형태의 코드를 작성했다면, b와 c값을 주면 a값을 도출해 준다. 그런데, 모두가 다 아시다시피 사칙연산이라는 것은 숫자를 입력했을 때 적용된다. b = 3 , c = 월 이라고 값을 준다면 python은 a라는 값을 계산할 수 없다는 오류를 return한다. 즉, 해당 code의 적용을 위해 제한이 주어진 자료형을 일치시켜 주어야 한다는 것이다. 이제 우리 실생활에서의 업무 ..

[부동산 | Phase1] 아파트 현황조사(고양시) - Data Mining & Refining (1부)

[부동산 | Phase1] 아파트 현황조사(고양시) - Data Mining & Refining (1부) 가장 먼저 다뤄볼 주제로 무엇이 좋을지 고민을 거듭하였다. 앞선 글에서 언급한 Data의 요건 기준으로 유용한 Data 분석 가치를 가진 것이 무엇이 있을지를 깊이 고려해 보았고, 결론적으로 우리가 몸 뉘우는 우리의 집에 관한 이야기로 가볍게 이 여정을 시작하기로 하였다. 앞으로 주제를 가지고 글을 올릴 때엔 다음과 같은 형태를 갖추어 글을 세분류해 올리고자 한다. (1) Phase 1 - Data Mining 및 Refining과 항목 이해 (2) Phase 2 - Data analysis(분석 알고리즘 구성) (3) Phase 3 - 정보 도출과 의미 파악하기 Phase 1에서는 우리가 수집하게 ..

정부 공공데이터포털 살펴보기

정부 공공데이터포털   본격적인 분석 Agenda를 시작하기에 앞서, 우리가 Data 수집활동을 하게 될 정부 공공데이터포털에 대해 살펴 보도록 하자. 이 블로그의 작성 취지 중 하나는 공공데이터포털이 제공하는 다양한 정부제공 데이터를 어떻게 내 생활, 내 업무, 내 사업에서 실속있게 사용해 볼 것이냐를 탐구하고자 하는데 있다.    갖고 놀기 좋은 Data의 요건   사실 Data를 수집하는데 있어서 얼마나 1) 공신력이 있고, 얼마나 2) 장기적으로 동일한 유형의 Data를 제공해 줄 수 있느냐 그리고 얼마나 3) 많은 사람들에게 유용한 Data이냐를 따지지 않을 수 없다. 수집처를 알 수 없는 Data는 오류가 가득한 정보를 양산할 수 있다. 또한, 일정 기간 지속적인 관찰값을 살펴보아야 할 경우엔..

소개 2020.06.03

소개의 글

시작하며. 데이터, 정보의 힘 우리는 흔히 '정보의 홍수 시대'에 살고 있다고 한다. 과거 매체라고 해봐야 공중파 방송사나 몇몇 신문사 정도 있던 시절에는 이러한 매체들이 대중을 향한 정보의 주된 제공자 역할을 하였다. 아시다시피, 해당 매체들이 편향성을 가지고 생산해 낸 정보들이 대중에게 전달되면 그러한 정보는 그대로 대중에게 사실로 받아들여졌던 시대가 있었다. 특정데이터에 접근할 수 있고 또한, 그 데이터를 가공할 수 있고, 의미를 부여할 수 있고, 다시 이를 급속으로 배포할 수 있는 능력만 있다면 비폭력의 방법으로 얼마든지 대중에게 의도된 자의를 심어주어 대중심리를 요동시키는 힘이 생기는 것이다. 정보력은 우리 생활의 많은 부분에서 중요한 능력으로 평가된다. 부동산으로 부자되길 꿈꾸시는 분들은 '어..

소개 2020.06.02