공간분석 - pytho
5월 쯤에 했던 공간분석 중 김제 남원의 인구와 인프라시설들의 상관관계와 공급과 수요에대해 GIs 로 분석을 진행했었다.
10월 진행했던 분석을 프로젝트로 진행해보자 한다.
먼저 필요한 데이터들은 가지고 있기에
프로그래밍에 필요한 세팅부터 준비해보겠다.
클라우드 환경과 로컬 환경 중 어디서 프로그래밍 할 지 선택해야하는데, 활용할 데이터들의 형태를 먼저 고려해야한다.
먼저 사용할 데이터들의 형태는
1. shp데이터
2. 엑셀데이터
100개 이하의 데이터 들을 사용할 예정이고 용량은 모두 Gb 이하로 대용량 데이터로 구분 되지 않는다.
하지만 나중에 데이터를 시각화 해야하기때문에 로컬활경에서의 작업흐름을 추천받았다.
로컬 환경을 세팅해보자.
1. 아나콘다 설치
Anaconda는 파이썬 및 데이터과학에 필요한 많은 패키지를 포함하고 있다.
2.필요한 라이브러리를 설치
conda install pandas geopandas matplotlib seaborn folium
아나콘다 프롬포트에 명령어를 입력하여 필요한 라이브러리들을 다운받는다.
3. Jupyter Notebook 설치
주피터 노트북은 코드 작성과 시각화를 한 곳에서 쉽게 할 수 있다.
4. 데이터 준비
앞서 말했던 shp 데이터와 엑셀 파일들을 로컬 컴퓨터에 다운받아 준다.
파이썬은 파일의 경로를 잘 정리해둬야 하기때문에 작업 폴더의 위치를 잘 설정해 준다.
5. IDE 선택
VSCODE 비주얼 스튜디오 코드는 코드 편집과 디버깅에 유용한 IDE이다.
위에서 설치한 주피터 노트북을 사용할 경우 웹브라우저에서 노트북을 실행할 수 있다.
세팅이 완료 되면 이제 프로젝트 구조를 설정하자.
먼저 프로젝트 폴더를 생성하고 그안에 데이터 파일들과 분석 코드를 작성할 스크립트를 저장한다.
이 때, 파일명을 의미있게 설정하여 가독성을 높이면 파일명 해석 등 불필요한 시간을 줄여준다.
이제 코드를 작성하자 .
기본 코드를 작성해보자.
주피터 노트북에서 기본적인 분석과 시각화 코드를 작성하자.
shp를 Geopandas로 불러오고 데이터의 기본정보를 확인하는 코드를 알아보자.
import geopandas as gpd
# SHP 파일 불러오기
gdf = gpd.read_file('path_to_your_file.shp')
# 데이터 확인
print(gdf.head())