on
개발일지 #4
개발일지 #4
3주차 개발일지
사실 3주차라고 해도 2주차밖에 안되었다.
퇴사후 여유로운 시간이 있어 조금이라도 빨리빨리 진도를 나가자는 생각이 가득해 나름대로 빡세게 듣고있다.
이번주는 드디어 말로만 듣던 파이썬(!)과 크롤링에 대해서 공부를했다.
확실히 자바스크립트 보다는 파이썬이 더욱 더 직관적이고 써먹기 편했다.
다들 파이썬 파이썬 하는 이유가 있었네.. 뭔가 간편한데 멋진 느낌?
파이썬을 이용해서 MongoDB에 데이터 저장, 지니뮤직 차트 크롤링까지 응용해보았다.
import requests from bs4 import BeautifulSoup headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'} data = requests.get('https://www.genie.co.kr/chart/top200?ditc=M&rtm;=N&ymd;=20210701',headers=headers) soup = BeautifulSoup(data.text, 'html.parser') genies = soup.select('#body-content > div.newest-list > div > table > tbody > tr') for genie in genies: title = genie.select_one('td.info > a.title.ellipsis').text.strip() artist = genie.select_one('td.info > a.artist.ellipsis').text.strip() rank = genie.select_one('td.number').text[0:2].strip() print(rank,title,artist)
자바스크립트보다 훨씬 간단하고 깔끔해보이지 않는가?
며칠만에 파이썬을 사랑하게 되었다는..
개발자들이 계속해서 공부를 한다는 이유가 이렇게 시대가 지나면서 편리하고 획기적인 언어가 나오기 때문인것같다.
더욱 더 열심히 해서 파이썬 마스터해야지.
from http://charmcharm2.tistory.com/4 by ccl(A) rewrite - 2021-12-15 01:01:52