Chapter 3-6 Tip 오류 해결
·
웹스크래핑과 데이터 수집
🛠️ ChromeDriver 버전 호환성 오류 해결에러 원인:이 오류는 ChromeDriver와 Google Chrome 브라우저의 버전이 호환되지 않아서 발생합니다. 두 버전이 맞지 않으면 Selenium을 사용하여 웹 자동화를 실행할 때 문제가 발생할 수 있습니다. 이 문제를 해결하려면 ChromeDriver의 버전을 Chrome 브라우저의 버전과 일치시켜야 합니다.📌 해결 방법현재 설치된 ChromeDriver 삭제이 명령어는 현재 설치된 ChromeDriver 파일을 시스템에서 삭제합니다.rm /opt/homebrew/bin/chromedriver먼저, 시스템에 설치된 기존의 ChromeDriver를 삭제합니다. 아래 명령어를 터미널에서 실행하여 제거합니다:Chrome 버전에 맞는 Chrome..
Chapter 3-5 무료호스팅
·
웹스크래핑과 데이터 수집
📌 무료 호스팅호스팅이란?호스팅은 서버의 일부 혹은 전체 자원을 임대하여 사용할 수 있도록 해주는 서비스를 의미합니다. 웹사이트나 애플리케이션을 운영하기 위해 필요한 서버를 직접 관리할 필요 없이, 서버 관리와 관련된 복잡한 부분을 호스팅 서비스 업체가 대신 처리해줍니다. 이 서비스에는 서버 관리, 전기, 인터넷 회선, 보안 등의 항목이 포함되며, 24시간 안정적으로 서비스를 제공하기 위해 필요한 모든 요소를 지원합니다.무료 호스팅 이용하기무료 호스팅 서비스는 별도의 비용 없이 웹사이트를 운영할 수 있는 방법을 제공합니다. 이러한 서비스는 웹사이트 운영에 대한 이해도를 높이고, 실습 환경을 제공하며, 개인 프로젝트나 작은 비즈니스를 위한 훌륭한 출발점이 될 수 있습니다.서비스 링크도토홈 무료 호스팅사이..
Chapter 3-4 Web Scraping 과제 (멜론차트 Top100 1위부터 100위까지)
·
웹스크래핑과 데이터 수집
최종 코드from selenium import webdriverfrom bs4 import BeautifulSoupfrom selenium.webdriver.chrome.options import Optionsfrom selenium.webdriver.chrome.service import Servicefrom webdriver_manager.chrome import ChromeDriverManagerfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.common.keys import Keysimport time# 모바일 사용자 에이전트 설정user = "Mozilla/5.0 (IPhone; CPU iPhone OS 13_3 like M..
Chapter 3-3 Web Scraping 과제 (CGV 사이트에 있는 무비차트)
·
웹스크래핑과 데이터 수집
최종 코드import requestsfrom bs4 import BeautifulSoupheader_user = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36"}url = "http://www.cgv.co.kr/movies/?lt=1&ft=0"req = requests.get(url, headers=header_user)html = req.textsoup = BeautifulSoup(html, "html.parser")# 영화 목록 추출movies = soup.select(".sect-movie-chart > ol..
Chapter 3-2 Web Scraping 과제 (find_all)
·
웹스크래핑과 데이터 수집
최종 코드import requestsfrom bs4 import BeautifulSoupheader_user = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36"}base_url = "https://www.melon.com/chart/index.htm"req = requests.get(base_url, headers=header_user)html = req.textsoup = BeautifulSoup(html, "html.parser")# find_all을 이용하여 lst50, lst100을 한 줄로 결합lst_al..
Chapter 3-1 Web Scraping 과제 (광고 x)
·
웹스크래핑과 데이터 수집
최종 코드import requestsfrom bs4 import BeautifulSoup# 사용자 에이전트 설정header_user = { "User-Agent" : "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36"}# 네이버 검색 URLbase_url = "https://search.naver.com/search.naver?ssc=tab.blog.all&sm=tab_jum&query="# 사용자로부터 검색어 입력 받기keyword = input("검색어를 입력하세요 : ")# 검색 URL 생성url = base_url + keywor..
Chapter 2-1 사람이 접속한것 처럼 보이는 방법
·
웹스크래핑과 데이터 수집
📌 셀레니움(Selenium)이란?Selenium은 웹 애플리케이션의 자동화 테스트와 웹 브라우저 제어를 위해 개발된 오픈 소스 프레임워크입니다. 2004년에 Jason Huggins가 개발을 시작했으며, 이후 JavaScriptTestRunner라는 프로그램을 기반으로 Selenium이라는 이름으로 발전했습니다. Selenium은 테스트 자동화를 쉽게 할 수 있도록 다양한 웹 브라우저와 플랫폼에서 웹 애플리케이션을 테스트하고 브라우저 동작을 제어하는 데 사용됩니다.🚦 셀레니움의 특징웹 브라우저 자동화: Selenium은 웹 브라우저의 동작을 자동화할 수 있어, 반복적인 작업을 자동으로 실행할 수 있습니다.다양한 언어 지원: Selenium은 Java, JavaScript, Python, C#, PH..
Chapter 1-6 사람이 접속한것 처럼 보이는 방법
·
웹스크래핑과 데이터 수집
📌 사람이 접속한 것처럼 보이는 방법웹 크롤링을 할 때 사람처럼 접속된 것처럼 보이게 하여 웹사이트 차단을 피할 수 있습니다. 웹사이트는 종종 봇을 차단하려고 하므로, 브라우저에서 접속한 것처럼 보이게 하는 방법을 사용하면 더 효과적입니다. 이를 위해 User-Agent 헤더를 설정하는 방법을 사용할 수 있습니다.🚦 1. 브라우저에서 개발자 도구 열기웹 브라우저를 열고, 개발자 도구를 엽니다.Chrome: F12 또는 Ctrl + Shift + I (Windows) / Cmd + Option + I (Mac)Firefox: F12 또는 Ctrl + Shift + I (Windows) / Cmd + Option + I (Mac)네트워크(Network) 탭을 선택합니다.새로고침(F5) 버튼을 눌러 페이지..