본문 바로가기
Life/review

[Start with Udemy Challengers] 12일차 학습 후기-자문자답

by Finn# 2022. 5. 23.
728x90

 

오늘의 컨디션은 어때?

 월요일 시작이라.. 그런지.. 아직.. 피곤이 덜 풀린 것 같아.. 몸은 좀 찌뿌둥하지만.. 그래도 오늘의 Udemy를 한번 들어볼 예정이야. 오늘은 저번에 Netflix에 이어 instagram을 공부하는데 Netflix에서 사용했던 기능에 추가로 공부하는 부분들이 있었는데 복습도 하면서 그 부분을 더 집중적으로 봐야겠다. 이번 주 주말에도 컴퓨터 활용능력 1급 실기 시험이 있어서 또 시험기간이야 ㅎㅎ 그다음 주도 또 과제와 시험들이 기다리고 있어! 아주 힘든 일정이겠지만 그렇다고 해서 앞으로의 일에 지금부터 긍긍대기 시작하면 아무것도 할 수가 없지! 천천히 해야 할 일들을 했을 때 다 지나가고 없다고 하니까 오늘의 컨디션은 차분하게 그리고 반듯한 기분으로 공부하기 ~


오늘 정리한 내용은 뭐니?

오늘 공부한 파트는 섹션 5 Instagram 크롤링과 관련된 내용이었어. 
이번 강의에서는 저번에도 언급했지만! css elements를 활용하여 Web을 제어하는 과정도 강의에 포함되어 있었어. 그리고 강의를 듣다 보니 추출할 태그가 좀 바뀌었었는데 오늘은 그 부분을 정리해볼게!

예를 들어서  인스타에 검색어를 적고 나면 여러 게시글들이 로드가 되는데 그때 첫 번째 게시글을 클릭해줘야해 클릭자체는 selenium에서 지원하는 기능을 활용하면되지만 그 전에 어떤 것을 클릭해줘야할 지 정해줘야하는데 그 때 필요한게 첫번째 게시글에 대한 태그를 찾아야 해. 

각 태그 참고용

 

구조 : 게시글 접속 → 게시글 정보 가져오기(본문, 작성일자, 좋아요 수)
                                  → 다음 게시물 이동
                                  → 검색 종료

태그 : div._9AhH0 → 게시글 정보 가져오기(span._7UhW9.xLCgt.MMzan.KV-D4.se6yk.T0kll,
                                                                                  time._1o9PC[datetime],
                                                                                  div._7UhW9.xLCgt.qyrsm.KV-D4.fDxYl.T0kll>span)
                                   → div.l8mY4.feth3>button
                                   → div.NOTWr>button>div

 

 그리고 추가적으로 5일 차 수강후기를 인스타에 올렸었는데, 내 계정에 팔로우해주셨던 한 분께서 감사하게도 인스타그램 크롤링할 때 주의해야 될 점을 몇 가지 일러주셨어ㅠㅠ  혹시나 이 글을 읽는 이 중 인스타 크롤링을 계획 중에 있다면 꼭 이점 참고했으면 좋을 것 같아. 자세한 내용은 밑에 사진으로 첨부할게! 

그 분의 계정은.. 개인정보이므로 공개하지 않겠습니당 ㅎㅎ

전체 학습 커리큘럼

오늘 공부했던 내용은 굵은 글씨로 표기해둘게!

1주차(20강) 준비하기 강의 및 강사 소개
파이썬 설치하기
크롤링 방법 장단점 비교 설명
크롤링은 합법?불법?판례로 살펴본 크롤링
쥬피터 노트북 살펴보기
파이썬 익히기
컴퓨터와 소통하기
숫자 데이터 다루기
문자 데이터 다루기
여러 개의 데이터 다루기(리스트)
데이터 병합하기(리스트 합치기)
반복 작업하기(for 반복문)
조건에 따라 작업 진행하기(if 조건문)
문자 데이터 자유자재로 사용하기(f-string, 문자열 포매팅)
문자 데이터 내 맘대로 정리하기
크롤링 기초
Selenium & chromedriver 설치하기
브라우저 열기
웹 페이지 접속하기 &URL 살펴보기
얼렁뚱땅 HTML 살펴보기
HTML 에서 원하는 정보 가져오기( BeautifulSoup.select() )
태그에서 필요한 값 추출하기
2주차(27강) Netflix 크롤링
넷플릭스 오리지널 페이지 살펴보기
크롤링 계획 설계하기
섹션 파트 나누기
프로그램 파트 찾기1_섹션 제목 찾기
프로그램 파트 찾기2_프로그램
프로그램 정보 수집하기
모든 프로그램 정보 수집하기(with 반복문)
엑셀 파일에 저장하기
Instagram 크롤링
인스타그램 페이지 살펴보기
인스타그램 크롤링 계획 설계하기
로그인 하기
태그 검색하기
게시글 클릭하기
다음 게시글 클릭하기
[게시글 정보 수집] - 본문내용
[게시글 정보 수집] - 좋아요 수
[게시글 정보 수집] - 작성 일시
여러 게시글 반복 수집하기 feat.오류점검하기
수집 데이터 엑셀 파일에 저장하기
Youtube 크롤링
유튜브 크롤링 소개
인기영상 리스트 수집하기1
인기영상 리스트 수집하기2
영상정보 수집하기1(제목, 조회수, 업로드 일자)
영상정보 수집하기2(좋아요, 싫어요, 채널명)
댓글수집하기1-총댓글수확인하기
댓글수집하기2-댓글가져오기
(코드정리)원하는 만큼 댓글 가져오기
 

오늘 하루 학습에 대한 평가와 느낀 점!

 어느덧 2 회독 공부도 막바지에 와 있네.. ㅎ 이제 내일까지 강의를 듣고나면 2회독까지 끝이 나네.. 지금까지 열심히 했고 앞으로 남은 기간에도 성실하게 해서 보다 완벽한 공부시간이 되도록 노력해야겠다. 오늘 공부를 통해서 좋았던 점은 한번 보고나서 여러 사람들과 소통을 하면서 새롭게 알게된 내용이나 강의를 듣고 정리해보면서 좀 더 확실하게 개념 구분이 되는 점들이 2회독 공부를 하지 않았다면 절대 몰랐을 내용들이라고 생각해. 만족스러웠던 하루고 UdemyKorea가 제공해 준 이 기회로 인해 소통이 얼마나 행복한 일인지 새삼 느끼게 된 것 같아.  자 다시 한번 가보자고 ~

5. Instagram Crawling 공부했습니다 ~


Outro

좋은 기회를 제공해주셔서 감사합니다.
본 게시글은 UdemyKorea에서 제공한 프로모션에 참여하기 위해 작성한 게시글입니다.


인스타 주소 ⭐

https://www.instagram.com/f.inn_sharp/

 

#유데미#유데미코리아#스타트위드유데미#스터디윗미

반응형