2. 데이터 분석 기초 (2) 썸네일형 리스트형 dropna() 메서드와 duplicated() 메서드로 nan 결측치와 중복값 없애기 import pandas as pda_df= pd.read_csv('filename', incoding= UTF-8)a_df2=a_df.dropna(axis=1 ) - 열의 내용 중 nan 값이 하나라도 있으면 드랍한다. a_df2=a_df.dropna(axis=1 , how ='all' ) - 열의 내용이 모두 nan 일 경우 드랍한다.axis=0 으로 바꾼다면 nan 이 포함된 행이 드랍(삭제) 될 것이다.axis=0은 기본 형태이므로 행이 삭제되길 원한다면 dropna() 로 비워두어도 된다. #데이터 프레임의 중복된 행 찾기sum(df.duplicate())결과 : 0 - 출력된 값이 이라면 중복된 행이 없다는 것 dup_rows = df.duplicate(subset=[ ] , keep = F.. shape 속성으로 데이터프레임 형태 확인하기. shape는 괄호 없이 사용이 가능하며, 데이터프레임의 크기를 간단히 알려주는 속성(attribute)이다.연산이 필요하지 않으므로 괄호가 필요 없다.df. shape : DataFrame의 (행의 수, 열의 수) 형태의 튜플을 반환합니다. 즉, 데이터프레임의 **크기(차원)**를 알려줍니다. 예 1 ) df.shape = (5,100) 이라면 5행 100열의 데이터 프레임의 형태를 갖고 있음예 2 ) df.shape[0] = df의 첫번째 인덱스를 반환해라. 첫번째 필드의 행의 개수을 가져오라는 의미. ㄴ geodataframe 이라면, 이는 행의 개수가 객체의 개수가 될 수 있다. 이전 1 다음