'판다스' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/08 »
일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Tags more

Archives

Today

Total

관리 메뉴

목록판다스 (5)

Susan and Data

파이썬(판다스)_원핫인코딩을 해보자!

원핫인코딩 [원핫인코딩] - scikit-learn의 머신러닝 알고리즘은 입력값으로 문자열을 받는 것을 허락하지 않음. - 이를 위한 전처리 방법이 원핫인코딩 - 고유값에 해당하는 컬럼에만 1, 나머지 컬럼에는 0 [함수] 1. select_dtyps: 열에 포함된 데이터들을 type 기준으로 인덱싱 * include=None, exclude=None 2. map: 각 요소에 특정한 함수를 적용시킬 때 사용하는 함수(단일컬럼) 3. pd.get_dummies: 더미로 가변수화 * 수치형 데이터로만 변환을 하게 되면 서로 간의 관계성이 생성되어(ex. B형과 AB형은 0형이다.) 잘못된 학습일 일어날 수 있으므로 0과1이라는 False, True값을 넣어줌으로서 문제를 막아줌. 4. prefix: 공통된 ..

IT/Python 2023. 4. 16. 01:56

파이썬(판다스)_데이터프레임 연산을 해보자!

데이터프레임 연산 Q. 아래의 내용으로 데이터프레임 생성 '통계':[60,70,80,85,75], '미술':[50,55,80,100,95], '체육':[70,65,50,95,100] Q. 통계+미술+체육의 합계 Q. '합계' 컬럼 생성 후 통계+미술+체육 합계 데이터 추가 Q. '평균' 컬럼 생성 후 합계/3으로 계산한 데이터 추가

IT/Python 2023. 4. 16. 01:00

파이썬(판다스)_apply, lambda, map을 활용해보자!

apply, lambda, map [DataFrame 인덱싱] 방법 내용 df[] df['column'] 해당 컬럼 인덱싱 df['column', 'column'] 해당 리스트의 컬럼 인덱싱 df['row':'row'] 첫번째 지정한 row부터 마지막으로 지정한 row까지 인덱싱 df.loc[] df.loc[:, 'column'] 모든 row의 해당 컬럼 인덱싱 df.loc[:, ['column', 'column']] 모든 row의 해당 리스트의 컬럼 인덱싱 df.loc[:, 'column':'column'] 모든 row의 첫번째 지정한 column부터 마지막으로 지정한 column까지 인덱싱 df.iloc[] df.iloc[인덱스값] 지정한 인덱스 값에 해당하는 row 및 column 인덱싱 df.il..

IT/Python 2023. 4. 15. 16:56

파이썬(판다스)_concat과 merge를 사용해보자!

concat & merge [함수] 1. df.copy: 데이터 복사 2. pd.concat: 데이터프레임 합치기 * 열: axis=1 3. pd.merge: 데이터프레임을 설정한 기준대로 합치는 것(어떤 column을 기준으로 하는 지 등) 4. reset_index: 설정 인덱스를 제거하고 기본 인덱스로 변경 5. df.drop: 열 삭제 * axis: {0:index / 1:columns} / inplace: 원본 변경 여부(True일 경우, 원본 변경) Q. row 기준으로 데이터 합친 후 index 재정의 Q. column 기준으로 데이터 합치기 Q. 결측값이 있는 데이터 합치기(merge 사용) Q. 정렬 순서가 다른 2개의 데이터프레임을 '이름'을 기준으로 합치고, 정렬기준은 df로 지정 Q..

IT/Python 2023. 4. 12. 22:33

파이썬(판다스)_데이터프레임을 생성해보자!

데이터프레임 [데이터사이언스 라이브러리] 1. import pandas as pd: 파이썬 언어로 작성된 데이터를 분석 및 조작하기 위한 라이브러리 Q. 아래의 내용을 list로 만든 후 데이터프레임에 저장 ['1호선', '서울역', 17896, 15468] ['2호선', '강남역', 22794, 21657] ['3호선', '신사역', 24131, 25592] Q. 아래의 내용으로 컬럼명 변경 ['지하철노선', '역명', '승차총승객수', '하차총승객수'] Q. 아래의 내용을 list로 만든 후 데이터프레임에 저장하고, 컬럼명 변경 list: ['1호선', '서울역', 17896, 15468], ['2호선', '강남역', 22794, 21657], ['3호선', '신사역', 24131, 25592] co..

IT/Python 2023. 3. 26. 16:12

이전 Prev 1 Next 다음

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Susan and Data

목록판다스 (5)

Susan and Data

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역