Program/JAVA

Java에서 Selenium을 사용하여 웹 페이지의 소스 코드를 출력

키클쥔장 2024. 1. 18. 10:43

 

Java에서 Selenium을 사용하여 웹 페이지의 소스 코드를 출력하는 것은 비교적 간단합니다.

아래는 Java를 사용하여 Selenium WebDriver를 통해 웹 페이지의 HTML 소스 코드를 가져오고 출력하는 기본적인 예제 코드입니다.

 

먼저, Selenium 라이브러리와 WebDriver(예를 들어, ChromeDriver)가 필요합니다.

이를 위해 Maven이나 Gradle을 사용하여 프로젝트에 Selenium 의존성을 추가할 수 있습니다.

 

import org.openqa.selenium.WebDriver;
import org.openqa.selenium.chrome.ChromeDriver;

public class SeleniumExample {
    public static void main(String[] args) {
        // WebDriver 경로 설정
        System.setProperty("webdriver.chrome.driver", "/path/to/chromedriver");

        // WebDriver 인스턴스 생성
        WebDriver driver = new ChromeDriver();

        try {
            // 웹 페이지 열기
            driver.get("http://example.com");

            // 페이지 소스 가져오기
            String pageSource = driver.getPageSource();

            // 페이지 소스 출력
            System.out.println(pageSource);
        } finally {
            // WebDriver 종료
            driver.quit();
        }
    }
}

 

이 코드는 다음 단계를 따릅니다:

  1. 필요한 Selenium 클래스를 임포트합니다.
  2. ChromeDriver의 경로를 설정합니다. (ChromeDriver를 사용하는 경우)
  3. ChromeDriver의 인스턴스를 생성하여 웹 브라우저를 엽니다.
  4. driver.get(url)을 사용하여 원하는 웹 페이지를 로드합니다.
  5. driver.getPageSource()를 호출하여 현재 페이지의 HTML 소스를 얻습니다.
  6. 소스 코드를 콘솔에 출력합니다.
  7. 마지막으로 driver.quit()를 호출하여 WebDriver 세션을 종료합니다.

참고로, 위 코드에서 "/path/to/chromedriver"는 실제 ChromeDriver 파일의 경로로 대체해야 합니다. 또한, 다른 브라우저를 사용하려면 해당 브라우저의 WebDriver를 사용하면 됩니다 (예: FirefoxDriver, EdgeDriver 등).