본문 바로가기
Development/Python

크롤링을 위한 준비 및 연습

by qWooWp 2021. 3. 17.
반응형

pip install requests

pip install bs4

pip install selenium

 

install webdriver

sites.google.com/a/chromium.org/chromedriver/downloads

 

Downloads - ChromeDriver - WebDriver for Chrome

WebDriver for Chrome

sites.google.com

selenium 을 이용한 샘플 코드

    from selenium import webdriver
    
    ## Chrome의 경우 | 아까 받은 chromedriver의 위치를 지정해준다.
    driver = webdriver.Chrome('C:\_src\sj_python\chromedriver_win32\chromedriver.exe')
    ## 암묵적으로 웹 자원 로드를 위해 3초까지 기다려 준다.
    driver.implicitly_wait(3)
    ## url에 접근한다.
    driver.get('https://nid.naver.com/nidlogin.login')

 

크롤링 관련 참고 글

 - beomi.github.io/gb-crawling/posts/2017-02-27-HowToMakeWebCrawler-With-Selenium.html

 

Selenium으로 무적 크롤러 만들기 · GitBook

Selenium은 주로 웹앱을 테스트하는데 이용하는 프레임워크다. webdriver라는 API를 통해 운영체제에 설치된 Chrome등의 브라우저를 제어하게 된다. 브라우저를 직접 동작시킨다는 것은 JavaScript를 이용

beomi.github.io

 

반응형

댓글