본문 바로가기

공부방/Upstage AI Lab 4기

7/10 학습일지 | 파이썬으로 그래프 그리기

파이썬에서 데이터프레임을 시각화할 때 가장 많이 쓰는 툴로는 Matplotlib, Seaborn, Plotly가 있다.

특징 Matplotlib Seaborn Plotly
기반 독립 라이브러리 Matplotlib 기반 독립 라이브러리
장점 매우 유연하고 강력한 기능 제공 다양한 그래프와 커스터마이징 옵션 제공 간단한 문법으로 고급 시각화 가능 다양한 테마와 색상 팔레트 제공 통계적 시각화에 강점 대화형 그래프 지원 간단한 문법으로 복잡한 시각화 가능 웹 브라우저에서 바로 시각화 확인 가능
단점 초보자에게 다소 복잡할 수 있음 Matplotlib보다 다소 기능이 제한적일 수 있음 초기 학습 곡선이 있을 수 있음
사용 사례 모든 종류의 시각화 특히 정교한 커스터마이징이 필요할 때 통계적 데이터 시각화 간단하고 빠른 시각화가 필요할 때 대화형 그래프 웹 기반 시각화가 필요할 때
사용법   sns.~plot(data=OOO, x=" ", y=" ", hue=" ") px.~~(데이터, x=' ', y=' ', ...)

Seaborn 튜토리얼

https://seaborn.pydata.org/tutorial/introduction.html

# Import seaborn
import seaborn as sns

# Apply the default theme
sns.set_theme()

# Load an example dataset
변수명 = sns.load_dataset("불러올 데이터 이름")

# Create a visualization
sns.relplot(
    data=tips,
    x="total_bill", y="tip", col="time",
    hue="smoker", style="smoker", size="size",
)

이렇게 생긴 데이터를 Seaborn으로 불러올 때

  total_bill tip sex smoker day time size
0 16.99 1.01 Female No Sun Dinner 2
1 10.34 1.66 Male No Sun Dinner 3
2 21.01 3.50 Male No Sun Dinner 3
3 23.68 3.31 Male No Sun Dinner 2
4 24.59 3.61 Female No Sun Dinner 4
... ... ... ... ... ... ... ...
239 29.03 5.92 Male No Sat Dinner 3
240 27.18 2.00 Female Yes Sat Dinner 2
241 22.67 2.00 Male Yes Sat Dinner 2
242 17.82 1.75 Male No Sat Dinner 2
243 18.78 3.00 Female No Thur Dinner 2

244 rows × 7 columns

sns.barplot(
    data=tips,
    x="day", y="total_bill"
)

똑같은 데이터를 plotly로 불러올 때

import plotly.express as px
df=px.data.tips()
df

plotly는 대시보드를 활용하면 더 좋다고 한다. 드롭다운으로 더 많은 메뉴(?)를 만들어서 선택해가면서 볼 수 있게 할 수 있다.

 

Plotly 튜토리얼

https://plotly.com/python/