본문 바로가기
반응형
python 오브젝트 문자열 변환 (object to string) 크롤링으로 가져온 DataFrame 값에서 태그 제거 같은 것을 하기 위해서는 문자열 변환이 필요할 때가 있다. str( val ) 위와 같이 간단하게 사용가능하다. 2021. 6. 3.
주식 배당금 데이터 크롤링(crawling) 하기 (2) 전 글에서 pyCharm 에서 기본 코드를 이용해서 배당금 홈페이지를 띄우는 것 까지 완성 하였다. https://qwoowp.tistory.com/75?category=817494 주식 배당금 데이터 크롤링(crawling) 하기 (1) 문득 자동으로 배당금 데이터를 가져와서 내 입맛에 맞게 조정을 해서 원하는 종목을 뽑을 수 있을까? 에서 시작해서 공부해 봅니다. 예전에 했던 것들 다 까먹어서 다시 pyCharm 부터 Create Project qwoowp.tistory.com 이제 검색 옵션을 자동으로 변경하고 원하는 데이터가 출력이 되면 각 페이지를 이동하면서 배당금 데이터를 데이터화 시키면 된다 . 홈페이지를 방문하면 아래와 같이 몇가지 옵션이 있지만 실제 사용할 것은 년도 옵션만 변경을 하면서.. 2021. 6. 1.
주식 배당금 데이터 크롤링(crawling) 하기 (1) 문득 자동으로 배당금 데이터를 가져와서 내 입맛에 맞게 조정을 해서 원하는 종목을 뽑을 수 있을까? 에서 시작해서 공부해 봅니다. 예전에 했던 것들 다 까먹어서 다시 pyCharm 부터 Create Project 를 실행해서 내가 원하는 프로젝트 이름을 디렉토리로 생성합니다. 생성 후 기본적인 패키지 설치를 해야 합니다. pyCharm 왼쪽 아래 탭 중에 Terminal 탭을 선택합니다. * pip 이 설치 되어 있지 않으면 이 글을 참조하세요. https://qwoowp.tistory.com/33?category=817494 PIP 설치 PIP 을 설치 Windows 키 + R 로 cmd 창 실행 (관리자 권한) curl https://bootstrap.pypa.io/get-pip.py -o get-p.. 2021. 6. 1.
selenium 리스트박스 선택하기 #### + 검섹 옵션 선택하기 g_frame = driver.find_element_by_xpath("/html/frameset/frameset/frame") driver.switch_to.frame(g_frame) # 리스트 박스의 id 를 검색한다. select_fr = Select(driver.find_element_by_id("idJiwonNm")) # 리스트 박스에서 아이템 인덱스를 선택한다. select_fr.select_by_index(1) 2021. 3. 21.
크롬 headless 로 크롤링 하는 시작 코드 크롬창을 띄우지 않은 상태에서 크롤링을 하기 위한 시작 코드 # head_less 실행 유무 결정 run_headless = 0 if run_headless == 1: # headless options = webdriver.ChromeOptions() options.add_argument('headless') options.add_argument('window-size=1920x1080') options.add_argument("disable-gpu") # See PyCharm help at https://www.jetbrains.com/help/pycharm/ ## Chrome의 경우 chromedriver의 위치를 지정해준다. driver = webdriver.Chrome('D:\Python_Prjs.. 2021. 3. 21.
반응형