とおき
토오끼
とおき
전체 방문자
오늘
어제
  • 분류 전체보기 (40)
    • 과제 (16)
    • 백준 (14)
    • C 언어 (5)
    • 잡동사니 (5)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 8958
  • 반복문
  • 중복값
  • 별표 출력
  • 숫자의 합
  • 최댓값
  • set함수
  • FOR문
  • BOJ
  • 알고리즘
  • 입출력
  • 문자열
  • 파이썬
  • 목록
  • 알파벳 찾기
  • 11720
  • 2523
  • 주피터 오류
  • 유클리드 호재법
  • 백준
  • 파이썬 오류

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
とおき

토오끼

잡동사니

개구리

2022. 5. 9. 20:41

requests

import requests                # requests 패키지 가져오기

url = 'https://www.naver.com'  # 가져올 url 문자열로 입력

response = requests.get(url)   # requests의 get함수를 이용해 해당 url로 부터 html이 담긴 자료를 받아옴

print(response.status_code)    # 정상적으로 받아졌다면 200이라는 상태코드를 반환

html_text = response.text      # 우리가 얻고자 하는 html 문서가 여기에 담기게 됨

selenium

# selenium의 webdriver를 사용하기 위한 import
from selenium import webdriver

# selenium으로 무엇인가 입력하기 위한 import
from selenium.webdriver.common.keys import Keys

# 페이지 로딩을 기다리는데에 사용할 time 모듈 import
import time

# 크롬드라이버 실행  (경로 예: '/Users/Roy/Downloads/chromedriver')
driver = webdriver.Chrome('chromedriver의 경로를 입력할 것') 

#크롬 드라이버에 url 주소 넣고 실행
driver.get('https://www.google.co.kr/')

# 페이지가 완전히 로딩되도록 3초동안 기다림
time.sleep(3)

#검색어 창을 찾아 search 변수에 저장
search = driver.find_element_by_xpath('//*[@id="google_search"]')

#search 변수에 저장된 곳에 값을 전송
search.send_keys('')
time.sleep(1)

#search 변수에 저장된 곳에 엔터를 입력
search.send_keys(Keys.ENTER)

soup

import requests

# 주로 bs로 이름을 간단히 만들어서 사용함
from bs4 import BeautifulSoup as bs

response = requests.get('https://www.google.co.kr')

# html을 잘 정리된 형태로 변환
html = bs(response.text, 'html.parser')

# find 함수로 특정 이미지를 선택하는 코드
google_logo = html.find('img', {'id':'hplogo'})

'잡동사니' 카테고리의 다른 글

gather id  (0) 2023.02.21
automatically post at dcinside  (0) 2023.02.10
img crwaler  (0) 2022.08.13
auto guestbook 23.02.11 fixed  (0) 2022.05.10
    '잡동사니' 카테고리의 다른 글
    • gather id
    • automatically post at dcinside
    • img crwaler
    • auto guestbook 23.02.11 fixed
    とおき
    とおき

    티스토리툴바