Program/JAVA
Java에서 Selenium을 사용하여 웹 페이지의 소스 코드를 출력
키클쥔장
2024. 1. 18. 10:43
Java에서 Selenium을 사용하여 웹 페이지의 소스 코드를 출력하는 것은 비교적 간단합니다.
아래는 Java를 사용하여 Selenium WebDriver를 통해 웹 페이지의 HTML 소스 코드를 가져오고 출력하는 기본적인 예제 코드입니다.
먼저, Selenium 라이브러리와 WebDriver(예를 들어, ChromeDriver)가 필요합니다.
이를 위해 Maven이나 Gradle을 사용하여 프로젝트에 Selenium 의존성을 추가할 수 있습니다.
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.chrome.ChromeDriver;
public class SeleniumExample {
public static void main(String[] args) {
// WebDriver 경로 설정
System.setProperty("webdriver.chrome.driver", "/path/to/chromedriver");
// WebDriver 인스턴스 생성
WebDriver driver = new ChromeDriver();
try {
// 웹 페이지 열기
driver.get("http://example.com");
// 페이지 소스 가져오기
String pageSource = driver.getPageSource();
// 페이지 소스 출력
System.out.println(pageSource);
} finally {
// WebDriver 종료
driver.quit();
}
}
}
이 코드는 다음 단계를 따릅니다:
- 필요한 Selenium 클래스를 임포트합니다.
- ChromeDriver의 경로를 설정합니다. (ChromeDriver를 사용하는 경우)
- ChromeDriver의 인스턴스를 생성하여 웹 브라우저를 엽니다.
- driver.get(url)을 사용하여 원하는 웹 페이지를 로드합니다.
- driver.getPageSource()를 호출하여 현재 페이지의 HTML 소스를 얻습니다.
- 소스 코드를 콘솔에 출력합니다.
- 마지막으로 driver.quit()를 호출하여 WebDriver 세션을 종료합니다.
참고로, 위 코드에서 "/path/to/chromedriver"는 실제 ChromeDriver 파일의 경로로 대체해야 합니다. 또한, 다른 브라우저를 사용하려면 해당 브라우저의 WebDriver를 사용하면 됩니다 (예: FirefoxDriver, EdgeDriver 등).