Python 데이터 분석 및 시각화
그래프 만들기
sns.scatterplot() 산점도 만들기
- 데이터를 x축과 y축에 점으로 표현한 그래프를 산점도라고 함
- 나이, 소득처럼 연속값으로 된 두 변수의 관계를 표현할 때 사용 가능
Copy
import saborn as sns # 시본 불러오기
sns.scatterplot(data = mpg, x = 'displ', y = 'hwy')
x축 범위 제한 (xlim)
Copy
sns.scatterplot(data = mpg, x = 'displ', y = 'hwy')\
.set(xlim = [3,6], ylim = [10,30])
#x축 범위를 3-6으로 제한, y축 범위를 10-30으로 제한
sns.barplot() 막대 그래프 만들기
- 집단 간 차이를 표현할 때 막대 그래프 자주 사용
- 평균 막대그래프, 빈도 막대 그래프 등으로 활용 가
sns.countplot() 빈도 막대 그래프 만들기
구동방식 별 고속도로 연비 평균
Copy
df_mpg = mpg.groupby('drv')\
.agg(mean_hwy = ('hwy', 'mean'))
#drv 별 분리
#hwy 평균 구하기
df_mpg
집단별 빈도표 만드는 작업을 생략하고 원자료를 이용해 바로 빈도 막대 그래프를 만들 수 있음
Copy
sns.countplot(data = mpg, x = 'drv')
4,f,r 순으로 막대 정렬
Copy
sns.countplot(data= mpg, x = 'drv', order = ['4','r','f'])
빈도 높은 순으로 정렬하기
Copy
#drv의 값을 빈도가 높은 순으로 출력
mpg['drv'].value_counts().index
Index(['f', '4', 'r'], dtype='object', name='drv')
라는 값이 나옴 해당 식을 order에 파라미터를 주고 넣으면 빈도 순으로 막대를 정렬할 수 있
Copy
#drv 빈도 높은 순으로 막대 정렬
sns.countplot(data = mpg, x = 'drv', order = mpg['drv'].value_counts().index)
'sesac' 카테고리의 다른 글
SeSAC 전z전능 분석가 성동2기 데이터 분석가 | SQL 교육(1)_SQL 설치 및 조건 찾기 (MY SQL, SQL 불러오기) (1) | 2024.07.05 |
---|---|
SeSAC 전z전능 분석가 성동2기 데이터 분석가 | 엑셀 교육(1)_엑셀과 가설검정 (0) | 2024.06.24 |
SeSAC 전z전능 분석가 성동2기 데이터 분석가 #18-20 | 파이썬 교육(3)_데이터 프레임, 시각 (0) | 2024.06.24 |
SeSAC 전z전능 분석가 성동2기 데이터 분석가 #17 | 파이썬 교육(3)_반복문 for, while (0) | 2024.06.05 |
SeSAC 전z전능 분석가 성동2기 데이터 분석가 #16 | 파이썬 교육(2)_스트링 및 리스트, 마크다운 (0) | 2024.06.04 |