Susan and Data
파이썬(판다스)_info, describe, sort를 사용해보자! 본문
2021년 상반기 지역별 배달음식 평균주문금액
[데이터사이언스 라이브러리]
1. import pandas as pd: 파이썬 언어로 작성된 데이터를 분석 및 조작하기 위한 라이브러리
[함수]
1. pd.read_csv: 판다스 라이브러리 호출 후 csv 파일 불러오기
2. df.info: 열 타입 및 결측값 갯수 확인 가능
3. df.describe: 통계량을 요약하여 출력
4. df.head: 데이터의 상단부분 출력
5. df.tail: 데이터의 하단부분 출력
6. df.sort_index: index를 기준으로 오름차순 정렬
7. df.sort_index(ascending=False): index를 기준으로 내림차순 정렬
8. df.sort_values(by='정렬할 컬럼'): 특정 컬럼을 기준으로 오름차순 정렬
9. df.sort_values(by='정렬할 컬럼', ascending=False): 특정 컬럼을 기준으로 내림차순 정렬
[판다스 데이터프레임 속성]
속성명 | 내용 |
df.index | DataFrame의 인덱스 반환 |
df.columns | DataFrame의 열 레이블 반환 |
df.dtypes | DataFrame에서 데이터타입을 반환 |
df.values | DataFrame을 Numpy 형식으로 반환 |
df.axes | DataFrame의 축을 나타내는 목록을 반환 |
df.ndim | 차원을 나타내는 int를 반환 |
df.size | DataFrame의 크기를 나타내는 int를 반환 |
df.shape | DataFrame의 크기를 나타내는 튜플을 반환 |
df.empty | DataFrame이 비어 있는지 여부를 나타내는 bool을 반환 |
Q. csv 파일을 불러온 후 아래의 내용으로 컬럼명 변경
['날짜', '시간', '카테고리', '목적지(광역시도명)', '목적지(시군구명)', '주문금액']
Q. 파일의 열 타입 및 결측값 갯수 확인
Q. 통계 정보 확인
Q. row와 column의 갯수 확인
Q. 상위 5개 row 출력
Q. 하위 5개 row 출력
Q. 오름차순으로 정렬
Q. 내림차순으로 정렬
Q. 주문금액 기준으로 오름차순 정렬
Q. 주문금액 기준으로 내림차순 정렬
Q. 주문금액이 동일한 경우, 날짜로 오름차순 정렬
Q. 주문금액이 동일한 경우, 날짜로 내림차순 정렬
'IT > Python' 카테고리의 다른 글
파이썬(판다스)_데이터프레임을 복사한 후 변경해보자! (0) | 2023.04.07 |
---|---|
파이썬(판다스)_결측값을 확인해보자! (0) | 2023.04.05 |
파이썬(판다스)_데이터프레임을 생성해보자! (0) | 2023.03.26 |
파이썬_카페 주문 프로그램을 만들어보자! (0) | 2023.03.17 |
파이썬_클래스를 활용해보자! (0) | 2023.03.12 |