series = 컬럼이 한 개만 있는 형태, 인덱스 수정 가능, series끼리 연산가능
: 조회시 배열 처럼 or 인덱스로 / 여러개
ex) member[0], member['1번'] / member[ ['1번', '3번']]
data frame = 컬럼이 두 개 이상인 형태
: 정형데이터 처리 할 때 사용, 여러 개의 column 있는 형태
ex) member3 = { '번호' : ['1번', '2번', '3번'], '이름' : ['홍길동', '전우치', '강감찬'] }
member4 = pd.DataFrame(member3)
- 원하는 행만 조회하는 경우
1) 행벙호를 지정하여 모든 데이터 조회: member4.loc[0] -> 0번행 조회
2) 조건을 부여하여 해당하는 데이터만 조회: member4.loc[ member4['번호'] >= '2번' ]
- 행/열을 추가하는 방법
: member4[추가할 열 이름] = [1행, 2행, 3행]
- 삭제
: drop
xls 파일 -> read_excel()
지정컬럼 = parse_cols
엑셀파일 불러올때 - xlrd설치 요구
데이터 정렬 = sort_values
dataframe합치기 = concat, merge
ex) df1 = pd.concat( [df2, df3], axis = 1)
+) 공통적으로 존재하는 데이터만 표기 = join
ex) df1 = pd.concat( [df2, df3], axis = 1, join= 'inner')
+) 특정 컬럼을 기준으로 취합 = on
ex) df1 = pd.concat( [df2, df3], axis = 1, on= '이름')
+ matplotlib
figure - 그림을 그릴 수 있는 영역 자체, figure()
subplot - 실제 그림이 그려지는 영역, add_subplot()
순서: figure 설정 -> subplot 작업
BAR 차트, LINE차트, PIE 차트
plt.style.use('ggplot'), add_subplot(조건)
scatter - 데이터 흩뿌림, 산포도
bar - 막대 그래프
barh - 가로로 누운 그래프
bar, legend - 히스토그램
.pie - pie차트
한글지원설정
matplotplib.font_manager
+ 차트 중복으로 그리기
난수를 만드는 규칙: np.random.seed()
twinx - 하나의 x 축에 2개의 y 축 설정
+ bokeh 패키지
matplotlib: 그래프에 interactive 기능 부재
bokeh: interactive기능이 강점
-> pip install bokeh
output_notebook() - 그래프를 현재 보이는 화면에 출력
- 라인차트 그리기
1. import 입력
2. size 지정
3. 그림그릴 함수 입력
34. show()
(주식 line차트 그리기)
- bar차트 그리기
vbar: 세로 막대 차트
hbar: 가로 막대 차트
- 벌집모양차트 그리기
- 히스토그램 그래프 그리기
.histogram
- 네트워크 차트 그리기
spectral
graphRenderer()
: a데이터와 b데이터 사이 관련을 표현
- 구글 지도 출력하기
gmap
+ 한글 텍스트 분석