๐ ์คํ๋ฅดํค ์์ !
์ 3ํ ์คํ๋ฅดํค์ด ์์๋์๋ค. (์ฒํ์ ์ผ ๋ฐค์๋ํ...)
์๋ ๊ฒ์๋ฌผ์ ์คํ๋ฅดํค์์์ ๊ธฐ๋ก์ ๋ด์... ์์กด์ผ์ง์ด๋ค.
๋ค์ ์คํ๋ฅดํค ์ฐธ์ฌํ ์ฌ๋๋ค์ ์ฐธ๊ณ ํ๋ฉด ์ข์ ๊ฒ ๊ฐ๋ค..!
(์คํ๋ฅดํค์ ๋ํด์ ์ ๋ชจ๋ฅด๊ฒ ๋ค๋ฉด ๋งํฌ ์ฐธ๊ณ !)
๋ณธ๊ฒฉ ์์กด Start !
๐ 23:00 ~ 24:00 ; '์ด๋ ค์กฐ'์ ํ์ ; HP ๐โ๏ธ(100%)
๐จ ํ๋ ๋ด์ฉ
- ๊ฐ๋จํ๊ฒ OT๋ฅผ ๋ฃ๊ณ ๊ฐ์์ค๋ก ํฅํ๋ค.
- ๋ญ ํด์ผํ ์ง ๋ชฐ๋ผ์ ๊ฐ๋งํ ์์๋ค๊ฐ "์ ๋ฏธ" ์กฐ๊ต๋์ ๋ถ๋ฆ์ C-4 ์กฐ์ ํฉ๋ฅํ๋ค.
- ์กฐ๊ต๋์ ์ฐ๋ฆฌ๋ค์ ์๊ณ ์์คํ ์ง์ค๋ ฅ์ 6์๊น์ง ์ ์ง์์ผ์ฃผ์ค ๋ถ์ด๋ค.
- ์์ฃผ์์ฃผ ์ด์ํ ์๊ธฐ์๊ฐ ์๊ฐ์ด ์ง๋๊ณ ์กฐ์ด๋ฆ์ "์ด๋ ค์กฐ"๋ก ์ ํ๋ค.
- ์ด๋๋ก ์ฐ๋ฆฌ ๊ด์ฐฎ์ ๊ฑธ๊น?? ( ์กฐ์ด๋ฆ์ ์์กด์ผ์ง์ ์ ์ ํด ๋ณด์ธ๋ค ใ ใ ใ )
๐ 24:00 : 01:00 ; Pandas(์ ํ ๋ฐ์ดํฐ ๋ถ์) ; HP ๐โ๏ธ(100%)
๐จ ๊ณต๋ถ ๋ด์ฉ
- ๊ฐ๋ฐ ํ๊ฒฝ ๊ตฌ์ถ์ ์ ์ ๋ง๋ค์ด ๋ ๊ฐ์ํ๊ฒฝ์ด ์์ด์ ๊ฑฐ๊ธฐ์ ์งํํ์๋ค.
- ์์ ์ ์จ์ผํ ์ง ? ํ๋ค์ค๋ฅผ ์จ์ผํ ์ง? ์ ๋ํด์ ๊ณ ๋ฏผํด๋ณด์๋ค.
- ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉํ๋ Alias๋ฅผ ์ ๋ฆฌํ๋ค.
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++
- ์์ : ์๊ท๋ชจ ๋ฐ์ดํฐ ํธ๋ค๋ง์ ์ฉ์ดํ๋ค.
- python-pandas : ๋น ๋ฐ์ดํฐ(์ ํ) ํธ๋ค๋ง์ ์ฉ์ดํ๋ค.
- ์ฆ, ๋ชฉ์ ์ ๋ฐ๋ผ์ ํ์ํ ๋๊ตฌ๋ฅผ ์ฌ์ฉํ๋ฉด ๋๋ค.
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++
- import pandas as pd ;
- import matplotlib.pyplot as plt
๐ 01:00 ~ 02:00 ; Matplotlib(์๊ฐํ ๋๊ตฌ) ; HP ๐ถโ๏ธ(85%)
๐จ ๊ณต๋ถ ๋ด์ฉ
- Pandas์์ ๋ฐ์ดํฐ ๋ถ๋ฌ์ค๊ธฐ ์ ๋ ์๋ ค์ฃผ์ จ๋ค.
- matplotlib.pyplot์ ๊ธฐ๋ณธ์ ์ธ ๊ธฐ๋ฅ์ ๋ํด์ ๋ฐฐ์ ๋ค.
- matplotlib.pyplot์ Font๊ฐ ๊นจ์ง ๋ ์ ์ฉํ ์ ์๋ ๋ฐฉ๋ฒ์ ๋ํด ๋ฐฐ์ ๋ค.
- matplotlib.pyplot์ ์ฌ์ฉํด, Bar chart, sort, reindexํ๋ ๋ฐฉ๋ฒ์ ๋ํด ๋ฐฐ์ ๋ค.
- 2์๊ฐ ๊ฐ๊น์ ์ง๋ ์ ์ .. ์กธ๋ ค์จ๋ค.. ( ์นดํ์ธ์ด ํ์ํด..!)
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++
- DataFrame.groupby(A).B() - A : Index(column name), B : aggregate function
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++
- matplotlib์ ์ฌ์ฉํ ๋, Font๊ฐ ๊นจ์ง ๊ฒฝ์ฐ
#์ฐจํธ์ ์ ์ฉ๋ ํฐํธ ๋ณ๊ฒฝ
plt.rcParams['font.size'] # Font size ํ์ธํ๋ ์ฝ๋
plt.rcParams['font.family'] # Font๊ฐ ์ด๋ค ๊ฒ์ธ์ง ์ ์ ์๋ ์ฝ๋
plt.rcParams['font.family'] = "Malgun Gothic" # "๋ง์ ๊ณ ๋"์ผ๋ก ์ค์ ํด์ค
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++
- matplotlib์ ์ฌ์ฉํ์ฌ bar chart ์์ฑ(๊ธฐ๋ณธ)
# ํฌ๊ธฐ ์ค์
plt.figure(figsize=(4,6))
#์ฐจํธ ์ข
๋ฅ(x,y์ถ)
plt.bar(df_Sex_Avg.index, df_Sex_Avg)
#์ฐจํธ ์ด๋ฆ ์ค์
plt.title("์ฑ๋ณ์ ๋ฐ๋ฅธ ๋์ด ํ๊ท ")
#์ฐจํธ ์ถ๋ ฅ
plt.show()
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++
- ๊ทธ๋ํ ์ ๋ ฌ(Data์ ํฌ๊ธฐ๋ฅผ ๊ธฐ์ค์ผ๋ก ์ ๋ ฌํ๊ธฐ) - (sort_values ๋ฉ์๋)
# ์ฐจํธ ์ ๋ ฌ
df_Sex_Avg_sorted = df_Sex_Avg.sort_values(ascending = True)
#์ฐจํธ ์ข
๋ฅ(x,y์ถ)
plt.bar(df_Sex_Avg_sorted.index, df_Sex_Avg_sorted)
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++
- Index ์ํ๋ ์์๋ก ์ ๋ ฌํ๊ธฐ - (reindex ๋ฉ์๋)
#Index๋ฅผ ๋ค์ ์ง์ ํด์ฃผ๊ณ ๊ทธ ์์๋๋ก ์ ๋ ฌํ๊ธฐ
#Index list ์์ฑ
man_or_woman1 = ["์ฌ์", "๋จ์"]
man_or_woman2 = ["male", "female"]
# Series ๋ฐ์ดํฐ ์์ฑ
df_Sex_Avg = df.groupby('Sex')['Age'].mean()
print(df_Sex_Avg)
# reindex๋ ์๋ก์ด Index๋ก ๊ต์ฒดํด์ฃผ๋ ๊ฒ์ด ์๋๋ผ,
# ๊ธฐ์กด์ Index๋ฅผ ์ ๋ ฌํด์ฃผ๋ ๊ฐ๋
์ด๋ค.
# ๊ธฐ์กด Index์ ์์ ์ ๋ ฌ
df_Sex_Avg = df_Sex_Avg.reindex(man_or_woman2)
print(df_Sex_Avg)
#์ฐจํธ ์ข
๋ฅ(x,y์ถ)
print(plt.bar(df_Sex_Avg.index, df_Sex_Avg))
# ์๋ก์ด Index
df_Sex_Avg = df_Sex_Avg.reindex(man_or_woman1)
print(df_Sex_Avg)
#์ฐจํธ ์ข
๋ฅ(x,y์ถ)
print(plt.bar(df_Sex_Avg.index, df_Sex_Avg))
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++
- [Pandas ๋ฐ์ดํฐ ๋ถ์ ๋ฌด๋ฃ ๊ฐ์ 1์ฃผ์ฐจ ] ์๊ฐ ์๋ฃ !
- ๋ฐ์ดํฐ ํธ๋ค๋ง์ ๊ธฐ์ด๊ฐ์ข๋ก์ ๋ฐ์ดํฐ ๋ถ์์ ์ํด ๊ฐ๋จํ ํธ๋ค๋ง๋ถํฐ ์๊ฐํ๊น์ง ๊ฒฝํํ ์ ์๋ค.
- ๋ถ์์์ ํ์ํ ๊ณผ์ ์ ๊ฒฝํํด๋ณผ ์ ์๊ฒ ์ ๋ น์๋ธ ๊ฐ์ข๋ผ๊ณ ์๊ฐํ๋ค. ( ์ ๋ฌธ์ฉ์ผ๋ก ๊ฐ์ถ )
- ์ผ์....์ฌ์ฌ ์กธ๋ฆฐ๋ค..( ใ ใ ) ๋ฏธ๋ ๊ฒ์ ์๊ฐ ์ง๋๊ณ ๋ 2์ฃผ์ฐจ ์๊ฐํ ๊ณํ !
๐ 02:00 ~ 03:00 ; ๊ฒ์(๋ณธ์ธ) = ํจ๋ฐฐ ; HP ๐งโ๏ธ (60%)
๐จ ํ๋ ๋ด์ฉ
- ๊ฒ์ ์ฐธ์ฌ : O/X ํด์ฆ : ๊ดํ(1๋ฒ๋ฌธ์ ์์์...)
- ๊ฒ์ ์ฐธ์ฌ : ๋ฅํผํ๊ธฐ : ์ข ๋ฒํ ผ์ผ๋... ๋ฅ์ด ์ด์๊ฐ์ด ๋ ๋ผ์ค๋ ๋ฐ๋์ ์ ์ฌ..
- ๊ฒ์ ์ฐธ์ฌ : ๋ฌ๋ฆฌ๊ธฐ ( 12๋ฑ ๋๋ฆ ์ ๋ฐฉ ใ )
- ๊ฒ์ ์ฐธ์ฌ : ๋ ๋ฐ๋จน๊ธฐ (์๋์ ์ผ๋ก ์ก๋ค.)
- ๊ฒ์์ ์น๋ฆฌํ ์๋ ์์ง๋ง ํจ๋ฐฐํ ์๋ ์๋ ๋ฒ, ํ์ง๋ง ์ ๋ถ ํจ๋ฐฐํ ์๋ ์์๊น์?
- ๊ฒ์์ ํ๊ณ ๋์ ๊ฐ์๊ธฐ ๋ ํผ๋กํด์ง๊ธฐ ์์ํ๋ค...์ด๊ฒผ์ผ๋ฉด ๋ ํผ๊ณค ํ์ ์ง๋..
- HP๊ฐ 60์ผ๋ก ๊น์ฌ๋ฒ๋ ธ๋ค..
๐ 03:00 ~ 04:00 ; Data Processing ; HP ๐งโ๏ธ (35%)
๐จ ํ๋ ๋ฐ ๊ต์ก ๋ด์ฉ
- ๊ฐ์๊ธฐ "์ ๋ฏธ" ์กฐ๊ต๋๊ป์ ์ง์ค์ ๋ฐฉ์ผ๋ก ์ค๋ผ๊ณ ํ์ จ๋ค.
- ์ด์๋จ์ "์ด๋ ค์กฐ" ์กฐ์๋ผ๋ฆฌ ์ฌ์ง์ ํ๋ฐฉ ๋จ๊ฒผ๋ค.. ํ๋ง์์ ๋ช๋ช ์ด๋ ์ด์๊ณ์ค๊น..?
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++
- DataFrame → List, Dict ๋ณํํ๋ฉด ์ทจํ๋ ๊ฐ์?
# DataFrame → List = ํค(์ปฌ๋ผ๋ช
)
list(df)
# DataFrame → Dict = ํค(Index(axis=1) = ์ค์ ๋ฐ์ดํฐํ๋ ์ ์ปฌ๋ผ๋ช
) : ๊ฐ(Data =์ปฌ๋ผ๋ฐ์ดํฐ)
dict(df)
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++
- Series → List, Dict ๋ณํํ๋ฉด ์ทจํ๋ ๊ฐ์? ( ๋ฒ์ธ๋ก ํด๋ดค์ ใ ใ )
# Series → List = ๊ฐ(์ปฌ๋ผ๋ช
)
list(df['Survived'])
# Series → Dict = ํค(Index(axis=1) = ์ ์ํ ์ธ๋ฑ์ค) : ๊ฐ(์๋ฆฌ์ฆ= ์ปฌ๋ผ๋ฐ์ดํฐ)
dict(df['Survived'])
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++
- ๋ฐ์ดํฐ ์ค๋ณต ํ์ธ(+ unique_values๋ ์ ์ฌํ ๊ฐ๋ )
# ์ค๋ณต์ ํ์ธํ๊ณ ์ถ์ ์ด์ ํ ์ธ๋ฑ์ค๋ก ์ค์ ํ๊ณ ,
# ํด๋น ํ ์ธ๋ฑ์ค๋ฅผ ๊ธฐ์ค์ผ๋ก ์ค๋ณต๋๋ ๋ฐ์ดํฐ๊ฐ ๋ด๊ธด ์ด(์ปฌ๋ผ)์ ์๋ฆฌ์ฆ๋ก ๋ฝ๊ณ ,
# groupby()[].count().sort_values(ascending=False) ํด์ ๊ฐ์๋ฅผ ํ์ธํ๋ค.
print(df.groupby('Survived')['Name'].count().sort_values(ascending=False))
print(df.groupby('Name')['Survived'].count().sort_values(ascending=False))
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++
- ํ์ฌ ์ํ... ์ด๋ ค์กฐ...( HP : 35%...)
๐ 04:00 ~ 05:00 ; ์๋ฒฝ๊ฐ์ฑ ๋ฌ๋ฆฌ๊ธฐ + Visualization ; HP ๐จ๐ฆฏ(20%)
๐จ ํ๋ ๋ฐ ๊ต์ก ๋ด์ฉ
- ์๊น ๊ฒ์ ์งํ ์์ ๋ ์ด ์ฌํด์ ์ด๋ฒ์๋ A, B, C ๊ฐ๊ฐ์ Section ๋ณ๋ก ๋ฌ๋ฆฌ๊ธฐ ์ํฉ์ด ์ด์๋ค.
- ์น๋ฆฌ๋ฅผ ์ํด ๊ธฐ๊บผ์ด ์ถ๋ฐ์ ์ ์์๋ ์ฌ๋๋ค์๊ฒ ์ฝ๋ผ๋ฆฌ ์ฝ ๋๊ณ ๋ฌ๋ ค์ผํ๋ค๊ณ ์ถ๋ฐ์ ์์ ์ด์ผ๊ธฐํ๋๋ฐ...
- ๊ทธ๋ฐ ๋ ธ๋ ฅ ์๋ ๋ถ๊ตฌํ๊ณ 10๋ฑ๋ฐ์ ๋ชปํ๋ค. ( ๋ฌผ๋ก ์ฐ๋ฆฌ์กฐ์์ ๋ด๊ฐ 1๋ฑ ใ )
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++
- ์ ์ ์๊ฐ์ ์ ์ฒ๋ฆฌํ ๋ฐ์ดํฐ๋ฅผ ๋ค์ ํ์ฉํ์ฌ ์๊ฐํ ํด๋ณผ ๊ฒ์ด๋ค.
# Group์ ์์์ ๋ฐ๋ฅธ ์ง๊ณ ๋ฐ์ดํฐ๋ฅผ ์ค๋นํ๋ค.
๋ง๋ ๋ฐ์ดํฐ ํ๋ ์์ ์ด๋ฆ์ = sorted_chicken_count_gu # Bar Chart ์ฉ
๋ง๋ ๋ฐ์ดํฐ ํ๋ ์์ ์ด๋ฆ์ = chicken_count_gu # Map Chart ์ฉ
- ์ฒซ๋ฒ์งธ๋ Bar Chart ์๊ฐํ !
# ์๊ฐํ๋ฅผ ํ ๊ฑด๋ฐ ๋จผ์ Bar Chart์ ํํํ ๊ฒ์ด๋ค.
import matplotlib.pyplot as plt
# ์ผ๋จ ์ฐจํธ ์ ๋ชฉ์ ๊ธ๊ผด์ด ๊นจ์ง๋ฉด ๋ฐ๊ฟ์ค๋ค.
# Apple์ 'AppleGothic', Windows๋ 'Malgun Gothic'
plt.rcParams['font.family'] = "Malgun Gothic"
# ๋ง๋ค ์ฐจํธ์ ๊ทธ๋ํ ์ฌ์ด์ฆ๋ฅผ ์ ํด์ค๋ค.
plt.figure(figsize= (10,5))
# ์ฐจํธ์ x,y ์ถ์ ๋ฃ์ ๋ฐ์ดํฐ ํ ๋นํด์ฃผ๊ณ ์ฐจํธ ์์ฑ
plt.bar(sorted_chicken_count_gu.index, sorted_chicken_count_gu)
# ์ฐจํธ ์ ๋ชฉ ์ ํด์ฃผ๊ธฐ
plt.title('๊ตฌ์ ๋ฐ๋ฅธ ์นํจ๊ฐ๊ฒ ์์ ํฉ๊ณ')
# ๊ฐ๋ก์ถ ๋๊ธ ๋ ์ด๋ธ 90๋ ํ์ ์ํค๊ธฐ
# (x์ถ์ ์ด์ฐ๋ณ์๊ฐ ๋ง๊ณ ๊ฐ๊ฐ์ ๋ณ์๊ฐ ๊ธธ๋ฉด ๊ฐ์์ฑ์ด ๋จ์ด์ ธ์ ์ธ์์ ํ๊ธฐํด์ค ๋ชฉ์ ! )
plt.xticks(rotation=90)
# ์ฐจํธ ๊ทธ๋ฆฌ๊ธฐ
plt.show()
- ์์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์๊ฐ !
# ๋จผ์ ์์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์๊ฐ
import folium # map์ ๋ณด์ฌ์ฃผ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๊ฐ๋ค.
import json # json file์ loadํ ๋ ์ฌ์ฉํ ์ฉ๋์ธ ๊ฒ ๊ฐ๋ค.
- ๋๋ฒ์งธ๋ Map ์๊ฐํ !
# Json์ผ๋ก ์ด๋ค์ง ํ์ผ์ utf-8๋ก encodingํด์ folium์์ ์ฌ์ฉ๊ฐ๋ฅํ ๋ฐ์ดํฐ๋ก ๋ถ๋ฌ์จ๋ค.
seoul_state_geo = 'ํ์ผ๋ช
.json'
geo_data = json.load(open(seoul_state_geo, encoding='utf-8'))
#์ง๊ณํ ๋ฐ์ดํฐ๋ฅผ ํ์ํ ์ง๋์ ์์น์ ์ถ์ฒ์ ์ ํด์ค๋ค
map = folium.Map(location=[37.5502, 126.982], zoom_start=10)
# Json์ผ๋ก ์ป์ ๊ฐ ๊ตฌ์ ์์น ๋ฐ์ดํฐ์, ์ง๊ณํ ๋ฐ์ดํฐ, ์ถ๊ฐ, ์์กฐํฉ ๋ฑ์ ๋ฐ์ดํฐ๋ฅผ map์ ํ๊ธฐํด์ค๋ค.
folium.Choropleth(geo_data=geo_data,
data=chicken_count_gu,
columns=[chicken_count_gu.index, chicken_count_gu],
fill_color='PuRd',
key_on='feature.properties.name').add_to(map)
# ๋ง์ง๋ง์ map ์คํ
map
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++
- ์ด๊ฒ์ ๋์ผ๋ก Data Processing & Visualization Part ๊น์ง ์๊ฐํ๋ค.
- [Pandas ๋ฐ์ดํฐ ๋ถ์ ๋ฌด๋ฃ ๊ฐ์ 2์ฃผ์ฐจ ] ์๊ฐ ์๋ฃ !
- ๋ฌด๋ฃ ์ธ๊ฐ์ผ๋ก๋ ์ด๋์ ๋ ํธ๋ค๋ง ์ญ๋๋ง ๊ฐ์ง๊ณ ์๋ค๋ฉด ์ถฉ๋ถํ ๋์์ด ๋ ๋งํ ๋ด์ฉ์ด์๋ค.
- ๋ฐ์ดํฐ ์๊ฐํ์ ๋ํ ๊ตฌ์ฒด์ ์ธ ์๋ฅผ ๋ฐ๋ผํ๋ฉด์ ์ค์ ํ๋ก์ ํธ์ ์ฌ์ฉํด๋ ์ข์ ๊ต์ก ๋ด์ฉ์ด๋ค.
- ์งง์ ์๊ฐ ๋ด ๋ฃ๊ธฐ ์ํด ์ด๋ฐ์ ๋ด๊ฐ ๊ฐ์ง๊ณ ์๋ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ๋ค.
- ๋๋ฌธ์ ๋ช๊ฐ์ง ๊ธฐ๋ฅ์ ์ฝ๋๋ฅผ ํด์ํ๋ ์์ค์ผ๋ก ๊ทธ์ณค์ง๋ง ์๊ฐ๊ฐ๋ฅํ ๊ฐ์์๊ฐ์ด ์ฐ์ฅ๋์๊ณ ,
- ํ์จ ์๊ณ ๋์.. ๋ง์ ์ ์ ์ผ๋ก ํ๋ฒ ๋ ๋ฐ๋ผํ๋ฉด ์ข์ ๊ฒ ๊ฐ๋ค ใ ใ (์ ๊ณง ๋ฐฉ์ ๋ฉ๋๋ค ๐ฃ)
๐ 05:00 ~ 06:00 ; No pain, No gain.. ; HP ๐ต(10%)
๐จ 1์ฃผ์ฐจ ๋ฐ์ดํฐ ๋ถ์ ์ดํดํ๊ธฐ (ํ์ต ์ ๋ฆฌ)
- ์ด๋ฒ ์์ ์ ํตํด์ Pandas์์ ๋ด๊ฐ ๋์น๊ณ ์๋ ํฌ์ธํธ์ ๋ํด์ ํ์ตํ ์ ์์๋ค.
- ๋ํ์ ์ผ๋ก list(DataFrame)์ ๊ฒฐ๊ณผ๊ฐ ์ปฌ๋ผ๋ช ์ด ๋์จ๋ค๋ ์
- Set()์๋ฃํ๋ณํ์ ํ์ฉํ์ฌ ์ค๋ณต๋ ๋ฐ์ดํฐ ๊ฐ์ ์์ ๋ฒ๋ฆฌ๋ ๋ฐฉ๋ฒ
- Dict(DataFrame)์ ํ๋ฉด ํค= ์ปฌ๋ผ๋ช , ๊ฐ= data๋ก ๋๋๋ค๋ ์
- ์ฌ๋ฌ๊ฐ์ง ์ค์ ๋ฐ์ดํฐ ํธ๋ค๋ง์์ ์ฌ์ฉํด๋ณผ ๋ฒํ ์์ค์ ๋ด์ฉ๋ค์ด ๋์๊ณ
- ๋ฌด๋ฃ์ด์์ ๊ฐ์ด์น๋ฅผ ํ๋ ๊ฐ์๋ค๋ก ๊ตฌ์ฑ๋์๋ค. ( ์ ๋ง ์ ๋ฌธ์์ค ๊ฒฝํํด๋ณด๊ณ ์ถ์ ๋ถ๋ค ์ถ์ฒ~)
๐จ 2์ฃผ์ฐจ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๋ฐ ์๊ฐํ (ํ์ต ์ ๋ฆฌ)
- matplotlib.pyplot ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ ๋ฌธ์์ค์ผ๋ก ์ ํ ์ ์๋ ๊ธฐํ์๋ค.
- ๊ธฐ๋ณธ์ ์ธ Graph ์์ฑ ์ฝ๋๊ฐ ์ด๋ค ์์ผ๋ก ์ง์ฌ์ง๋ ์ง ํ์ตํ ์ ์์๋ค.
- figsize, xticks(rotation=๊ฐ๋) ๋ฑ
- folium, json์ ํ์ฉํ Map visualization์ ํ๊ธฐํ๋ ๋ฐฉ๋ฒ
- Bar Chart๋ฅผ ํํํ๋ ๋ฐฉ๋ฒ์ ๋ํด์ ํ์ตํ๋ค.
๐ข ์คํ๋ฅดํค ์ฐธ๊ฐ ํ๊ธฐ
- ์ฌ์ค ์๊ฐํ๋ ๊ฒ๋ณด๋ค ํจ์ฌ ์ ๊ด๋ฆฌ๋๊ณ ์ด์๋์ด์ง๋ ํ์ฌ์๋ค๊ณ ์๊ฐ๋๋ค.
- ๋งค๋์ ๋๋ค๋ ์ฐธ๊ฐ์๋ค์ด ์ค๊ฐ์ ๋์คํ์ง ์๋๋ก ์ํ๋ฅผ ๊ณ์ ์ฒดํฌํด์ฃผ์ จ๊ณ ..(๋ฉ๋์ปฌ ์ฒดํฌ)
- ๋ชจ๋๊ฐ ํ๋ ์ํฉ์์ ๋๊น์ง ์ฐ๋ฆฌ ์์ ์ง์ผ์ฃผ์ จ๋ค.
- ์ด๋ฐ ์ฐ๋๊ฐ ์์์ ์ค๋ ํ๋ฃจ ์ด์ฌํ ๊ณต๋ถํ ๋ ์ค์ค๋ก์๊ฒ๋ ์นญ์ฐฌ๊ณผ ๋ฐ์๋ฅผ ๋ณด๋ด๊ณ ์ถ๋ค.
- ํจ๊ป ๊ณต๋ถํ "์ด๋ ค์กฐ" ํ์๋ค์๊ฒ ๋ฐ์๋ฅผ ๋ณด๋ด๊ณ ์ถ๋ค. ๋ค๋ค ์ฑ์คํ๊ฒ ๋๋ฌด ์ด์ฌํ ๊ณต๋ถํ์๋ค.
- ๋ค์์ผ๋ก ์คํ๋ฅดํค์์ ์ ๊ณตํด์ค ๊ฐ์์ ๋ํด์ ์ด์ผ๊ธฐํด๋ณด๊ณ ์ ํ๋ค.
- ์ฒ์์๋ ๋ฌด๋ฃ์ธ๊ฐ์ด๋ผ ๊ธ๋ฐฉ ๋๋ ์ค ์์๊ณ ํ๋ฆฌํฐ์ ๋ํด์๋ ํฐ ๊ธฐ๋๋ฅผ ํ์ง ์์๋ค.
- ํ์ง๋ง ๋ง์นจ ๊ด์ฌ๋ถ์ผ์ ๊ฐ์๋ฅผ ์ ๊ณตํด์ฃผ์ จ๊ณ Pandas์ matplotlib ์ ๋ฌธ ๊ณผ์ ์ ๋ํด์ ํ์ตํด๋ณด์๋ค.
- ์๋ ํด๋น ๊ฐ์๊ฐ 1์ฃผ, 2์ฃผ ๊ณผ์ ์ด๊ธฐ์ ๊ด๋ จ Library๋ฅผ ์ฒ์ ์ ํ ํ์ต์ ๊ธฐ์ค์ผ๋ก
- ๋จ ํ๋ฃป๋ฐค ๋ง์ ๋ฃ๊ธฐ๋ ๋ถ๊ฐ๋ฅ ํ๋ค๊ณ ์๊ฐํ๋ค. (๋ฌผ๋ก ๋์ผ์ ์๋์ผ๋ก 18์ผ ์์ ๊น์ง๋ก ์ฐ์ฅํด์ฃผ์ฌ ใ )
- ํ์ง๋ง ์ด๋์ ๋ ์ต์ํ Library ๋ค์ด๋ผ๋ฉด ์ ๊ฐ์๋ฅผ ํตํด ๊ฐ๋จํ ๋ฐ์ดํฐ ๋ถ์์ ๋๋ ์ถฉ๋ถํ ์ํํ ์ ์๋
- ์ ๋์ ๊ฐ์๋ฅผ ์ ๊ณตํด์ฃผ์ จ๋ค. ์์ฃผ ๋ง์กฑ์ค๋ฌ์ด ์๊ฐ์ด์๊ณ ๊ณ ์์ ํ ๋ณด๋์ด ์๋ ์๊ฐ๋ค์ด์๋ค.
- ๋ค์์๋ ์คํ๋ฅดํค์ด ์ด๋ฆฐ๋ค๋ฉด ์ฐธ๊ฐ๋ฅผ ๊น๊ฒ ๊ณ ๋ฏผํด๋ณผ ๊ฒ์ด๋ค. ( ์คํ๋ฅดํค ๋ !!!)
- ์๋ ์ฌ์ง์ ์ค๋์ ๋ ธ๋ ฅ์ด ๋ฌป์ ๋์ ๊ฐ์ง ๋ฉ๋ฌ์ด๋ค (Get ๐ฅ)