파이썬(판다스)_결측값을 채워보자!

Notice

Recent Posts

Tags more

Archives

관리 메뉴

Susan and Data

IT/Python

IamSusan 2023. 4. 11. 22:36

[함수]

1. df.info: 열 타입 및 결측값 갯수 확인 가능

2. mode: 가장 빈번하게 측정되는 값

3. fillna: 데이터프레임에서 결측값을 원하는 값으로 변경

* axis: {0:index / 1:columns} / inplace: 원본 변경 여부(True일 경우, 원본 변경)

4. dropna: 데이터프레임 내 결측값이 포함된 레이블을 제거

* axis: {0:index / 1:columns} / how: {'any': 결측치가 존재하면 제거 / 'all': 모두 결측치면 제거}

5. reset_index: 설정 인덱스를 제거하고 기본 인덱스로 변경

6. df.drop: 열 삭제

* axis: {0:index / 1:columns} / inplace: 원본 변경 여부(True일 경우, 원본 변경)

[DataFrame 인덱싱]

	방법	내용
df[]	df['column']	해당 컬럼 인덱싱
	df['column', 'column']	해당 리스트의 컬럼 인덱싱
	df['row':'row']	첫번째 지정한 row부터 마지막으로 지정한 row까지 인덱싱
df.loc[]	df.loc[:, 'column']	모든 row의 해당 컬럼 인덱싱
	df.loc[:, ['column', 'column']]	모든 row의 해당 리스트의 컬럼 인덱싱
	df.loc[:, 'column':'column']	모든 row의 첫번째 지정한 column부터 마지막으로 지정한 column까지 인덱싱
df.iloc[]	df.iloc[인덱스값]	지정한 인덱스 값에 해당하는 row 및 column 인덱싱
	df.iloc[:, column의 인덱스 값]	모든 row의 해당 컬럼 인덱싱
	df.iloc[:, [column의 인덱스 값, column의 인덱스 값]]	모든 row의 해당 리스트의 컬럼 인덱싱
	df.iloc[:, column의 인덱스 값:column의 인덱스 값]	모든 row의 첫번째 지정한 column부터 마지막으로 지정한 column까지 인덱싱

Q. 키의 결측값을 최빈값으로 채우기

Q. 결측값이 있는 행 제거 후 인덱스를 다시 부여

Q. 결측치가 있는 컬럼 삭제

Q. 행 전체가 결측값인 행만 삭제

Q. 키와 혈액형 컬럼 제거

파이썬(판다스)_데이터 타입을 변경해보자! (0)	2023.04.13
파이썬(판다스)_concat과 merge를 사용해보자! (0)	2023.04.12
파이썬(판다스)_데이터프레임을 복사한 후 변경해보자! (0)	2023.04.07
파이썬(판다스)_결측값을 확인해보자! (0)	2023.04.05
파이썬(판다스)_info, describe, sort를 사용해보자! (0)	2023.04.03

'IT/Python' Related Articles

Comments