목록pandas (2)
가볍게 배우고 깊게 즐기고 오래 남기기

여러 개의 Series 유형을 하나로 묶은 DataFrame의 정보요약을 보고 싶을 때, 사용하는 Pandas의 DataFrame.describe() (1) 데이터프레임(일반적으로 CSV 데이터) 전체의 요약정보 (주로 요약통계량)를 확인할 경우 , → Count : 컬럼별 총 데이터수 mean / std : 컬럼별 데이터의 평균 / 표준편차 min / max : 컬럼별 데이터 최소값 / 최대값 25% / 50% / 75% : 백분위수의 각 지점으로, 분포를 반영해 평균을 보완하는 목적으로 사용 (2) 특정 컬럼/ 특정 시리즈의 요약정보를 확인할 경우 , → Count : 총 데이터수 Unique : 중복없이 나오는 고유한 데이터값 Top : 가장 값이 많은 데이터 (최빈값인 항목) Freq : 최빈 데..

Pandas 함수 중 DataFrame , Array 형태의 차원 확인을 위한 Shape 함수 titcsv = pd.read_csv('titanic.csv', index_col = 'PassengerId') print(titcsv.shape) # 결과 : (891, 11) print(titcsv.shape[0]) # 결과 : 891 print(titcsv.shape[1]) # 결과 : 11 이 때 Shape의 자체가 Tuple 형태이기 때문에 Shape[0]으로 행의 개수를 , Shape[1]로 열의 개수를 설정 가능하다. len(list)를 반복문 for문돌릴 때 사용하는 것 처럼 df.shape[i]도 반복문이나 타 연산에 사용하는 방향으로 활용하는 것이 스마트한 코딩의 길 + 한 가지 팁 추가 →여..