Susan and Data

파이썬(판다스)_info, describe, sort를 사용해보자! 본문

IT/Python

파이썬(판다스)_info, describe, sort를 사용해보자!

IamSusan 2023. 4. 3. 09:49

2021년 상반기 지역별 배달음식 평균주문금액

 

[데이터사이언스 라이브러리]

1. import pandas as pd: 파이썬 언어로 작성된 데이터를 분석 및 조작하기 위한 라이브러리

 

[함수]

1. pd.read_csv: 판다스 라이브러리 호출 후 csv 파일 불러오기

2. df.info: 열 타입 및 결측값 갯수 확인 가능

3. df.describe: 통계량을 요약하여 출력

4. df.head: 데이터의 상단부분 출력

5. df.tail: 데이터의 하단부분 출력

6. df.sort_index: index를 기준으로 오름차순 정렬

7. df.sort_index(ascending=False): index를 기준으로 내림차순 정렬

8. df.sort_values(by='정렬할 컬럼'): 특정 컬럼을 기준으로 오름차순 정렬

9. df.sort_values(by='정렬할 컬럼', ascending=False): 특정 컬럼을 기준으로 내림차순 정렬

 

[판다스 데이터프레임 속성]

속성명 내용
df.index DataFrame의 인덱스 반환
df.columns DataFrame의 열 레이블 반환
df.dtypes DataFrame에서 데이터타입을 반환
df.values DataFrame을 Numpy 형식으로 반환
df.axes DataFrame의 축을 나타내는 목록을 반환
df.ndim 차원을 나타내는 int를 반환
df.size DataFrame의 크기를 나타내는 int를 반환
df.shape DataFrame의 크기를 나타내는 튜플을 반환
df.empty DataFrame이 비어 있는지 여부를 나타내는 bool을 반환

 

Q. csv 파일을 불러온 후 아래의 내용으로 컬럼명 변경

['날짜', '시간', '카테고리', '목적지(광역시도명)', '목적지(시군구명)', '주문금액']

Q. 파일의 열 타입 및 결측값 갯수 확인

Q. 통계 정보 확인

Q. row와 column의 갯수 확인

Q. 상위 5개 row 출력

Q. 하위 5개 row 출력

Q. 오름차순으로 정렬

Q. 내림차순으로 정렬

Q. 주문금액 기준으로 오름차순 정렬

Q. 주문금액 기준으로 내림차순 정렬

Q. 주문금액이 동일한 경우, 날짜로 오름차순 정렬

Q. 주문금액이 동일한 경우, 날짜로 내림차순 정렬

 

Comments