개구리 — 토오끼

requests

import requests                # requests 패키지 가져오기

url = 'https://www.naver.com'  # 가져올 url 문자열로 입력

response = requests.get(url)   # requests의 get함수를 이용해 해당 url로 부터 html이 담긴 자료를 받아옴

print(response.status_code)    # 정상적으로 받아졌다면 200이라는 상태코드를 반환

html_text = response.text      # 우리가 얻고자 하는 html 문서가 여기에 담기게 됨

selenium

# selenium의 webdriver를 사용하기 위한 import
from selenium import webdriver

# selenium으로 무엇인가 입력하기 위한 import
from selenium.webdriver.common.keys import Keys

# 페이지 로딩을 기다리는데에 사용할 time 모듈 import
import time

# 크롬드라이버 실행  (경로 예: '/Users/Roy/Downloads/chromedriver')
driver = webdriver.Chrome('chromedriver의 경로를 입력할 것') 

#크롬 드라이버에 url 주소 넣고 실행
driver.get('https://www.google.co.kr/')

# 페이지가 완전히 로딩되도록 3초동안 기다림
time.sleep(3)

#검색어 창을 찾아 search 변수에 저장
search = driver.find_element_by_xpath('//*[@id="google_search"]')

#search 변수에 저장된 곳에 값을 전송
search.send_keys('')
time.sleep(1)

#search 변수에 저장된 곳에 엔터를 입력
search.send_keys(Keys.ENTER)

soup

import requests

# 주로 bs로 이름을 간단히 만들어서 사용함
from bs4 import BeautifulSoup as bs

response = requests.get('https://www.google.co.kr')

# html을 잘 정리된 형태로 변환
html = bs(response.text, 'html.parser')

# find 함수로 특정 이미지를 선택하는 코드
google_logo = html.find('img', {'id':'hplogo'})

'잡동사니' 카테고리의 다른 글

gather id (0)	2023.02.21
automatically post at dcinside (0)	2023.02.10
img crwaler (0)	2022.08.13
auto guestbook 23.02.11 fixed (0)	2022.05.10

'잡동사니' 카테고리의 다른 글

티스토리툴바