Susan and Data

파이썬(판다스)_결측값을 확인해보자! 본문

IT/Python

파이썬(판다스)_결측값을 확인해보자!

IamSusan 2023. 4. 5. 15:33

2021년 상반기 지역별 배달음식 평균주문금액

[데이터사이언스 라이브러리]

1. import pandas as pd: 파이썬 언어로 작성된 데이터를 분석 및 조작하기 위한 라이브러리

 

[함수]

1. pd.read_csv: 판다스 라이브러리 호출 후 csv 파일 불러오기

2. isin: 컬럼이 list의 값을 포함하고 있는지 검사

3. df.info: 열 타입 및 결측값 갯수 확인 가능

4. df.isna: 결측치 유무 확인 가능

5. isnull: 결측치 행 확인

6. notnull: 결측치가 아닌 행 확인

 

[DataFrame 인덱싱]

  방법 내용
df[] df['column'] 해당 컬럼 인덱싱
df['column', 'column'] 해당 리스트의 컬럼 인덱싱
df['row':'row'] 첫번째 지정한 row부터 마지막으로 지정한 row까지 인덱싱
df.loc[] df.loc[:, 'column'] 모든 row의 해당 컬럼 인덱싱
df.loc[:, ['column', 'column']] 모든 row의 해당 리스트의 컬럼 인덱싱
df.loc[:, 'column':'column'] 모든 row의 첫번째 지정한 column부터 마지막으로 지정한 column까지 인덱싱
df.iloc[] df.iloc[인덱스값] 지정한 인덱스 값에 해당하는 row 및 column 인덱싱
df.iloc[:, column의 인덱스 값] 모든 row의 해당 컬럼 인덱싱
df.iloc[:, [column의 인덱스 값, column의 인덱스 값]] 모든 row의 해당 리스트의 컬럼 인덱싱
df.iloc[:, column의 인덱스 값:column의 인덱스 값] 모든 row의 첫번째 지정한 column부터 마지막으로 지정한 column까지 인덱싱

 

Q. 카테고리 컬럼만 출력

Q. 0행부터 10행까지 출력

Q. 목적지(광역시도명)와 주문금액 컬럼만 출력

Q. 0행부터 10행의 목적지(광역시도명)와 주문금액 컬럼만 출력

Q. 0행부터 10행의 카테고리, 목적지(광역시도명), 목적지(시군구명), 주문금액 컬럼만 출력

Q. 목적지(광역시도명)와 주문금액 컬럼만 출력(iloc 활용)

Q. index 5까지 목적지(광역시도명)와 주문금액 컬럼만 출력(iloc 활용)

Q. 주문금액이 60000원 이상인 배달건만 출력

Q. 주문금액이 60000원 이상인 배달건에 대해 목적지(광역시도명)과 주문금액만 출력

Q. 주문금액이 60000원 이상인 배달건에 대해 목적지(광역시도명)과 주문금액만 출력(loc 활용)

Q. 목적지(광역시도명)이 경기도와 서울인 배달건만 출력(loc, isin 활용)

Q. 결측값 확인

Q. null값이 있는지 확인

Q. null값만 뽑아내기

Q. null이 아닌 값만 뽑아내기

Comments