개인 공부 (2) 썸네일형 리스트형 긴 꼬리 분포, 카이제곱 분포 추가 정리 # 긴 꼬리 분포 - Long Tail : 파레토 분포의 그래프 형태를 설명하기 위한 용어 - 파레토 분포 : 대부분의 사건이 중심 근처에 집중되어 있고 극단적인 사건들은 드물게 발생하는 경향 - 이 극단적인 사건들을 나타내는 부분이 롱 테일과 형태가 같다는 것------------------------------------------------------------------------------------------------------------------------------------------------------- - 데이터의 일부가 많은 영향을 끼칠 때 나타나는 분포 형태(비대칭적)이다.- 따라서 데이터의 개수가 많아져도 정규분포의 형태가 될 수 없다.- 20 : 80- 메이저 : 마이너-.. 데이터 전처리 새롭게 알아낸 함수 정리 import matplotlib.pyplot as pltimport seaborn as snsiris = sns.load_dataset("iris")iris.corr(numeric_only=True)데이터중에서 숫자형 데이터끼리의 상관관계를 확인하는 방법type(df_shops.dtypes)(df_shops 파일에 해당되는 모든 컬럼의 자료형을 조회) 의 타입(type()) = 시리즈라고 출력df_shops.dtypes.value_counts()컬럼들의 데이터 타입별 개수 / .value_counts() 는 컬럼이 가지고 있는 value 값들을 그룹화하고 각 그룹의 개수를 출력 floor_mode = df_shops['층정보'].mode()[0].mode()데이터 프레임의 '층정보' 열에 있는 최빈값(가.. 이전 1 다음