본문 바로가기

sesac

SeSAC 전z전능 분석가 성동2기 데이터 분석가 #21 | 파이썬 교육(4)_데이터 분석 및 시각화

Python 데이터 분석 및 시각화

그래프 만들기

sns.scatterplot() 산점도 만들기

  • 데이터를 x축과 y축에 점으로 표현한 그래프를 산점도라고 함
  • 나이, 소득처럼 연속값으로 된 두 변수의 관계를 표현할 때 사용 가능
Copy
import saborn as sns # 시본 불러오기
sns.scatterplot(data = mpg, x = 'displ', y = 'hwy')
x축 범위 제한 (xlim)
Copy
sns.scatterplot(data = mpg, x =  'displ', y = 'hwy')\
		.set(xlim = [3,6], ylim = [10,30])
		#x축 범위를 3-6으로 제한, y축 범위를 10-30으로 제한

sns.barplot() 막대 그래프 만들기

  • 집단 간 차이를 표현할 때 막대 그래프 자주 사용
  • 평균 막대그래프, 빈도 막대 그래프 등으로 활용 가
sns.countplot() 빈도 막대 그래프 만들기

구동방식 별 고속도로 연비 평균

Copy
df_mpg = mpg.groupby('drv')\
    .agg(mean_hwy = ('hwy', 'mean'))
#drv 별 분리
#hwy 평균 구하기
df_mpg

집단별 빈도표 만드는 작업을 생략하고 원자료를 이용해 바로 빈도 막대 그래프를 만들 수 있음

Copy
sns.countplot(data = mpg, x = 'drv')
4,f,r 순으로 막대 정렬
Copy
sns.countplot(data= mpg, x = 'drv', order = ['4','r','f'])
빈도 높은 순으로 정렬하기
Copy
#drv의 값을 빈도가 높은 순으로 출력
mpg['drv'].value_counts().index

Index(['f', '4', 'r'], dtype='object', name='drv')

라는 값이 나옴 해당 식을 order에 파라미터를 주고 넣으면 빈도 순으로 막대를 정렬할 수 있

Copy
#drv 빈도 높은 순으로 막대 정렬
sns.countplot(data = mpg, x = 'drv', order = mpg['drv'].value_counts().index)