html에서 xpath를 사용하는 방법

August 20, 2023

Person:

웹 크롤링을 위한 XPath는 XML 문서의 요소를 선택하기 위한 언어로, 주로 웹 페이지에서 데이터를 추출하는 데 사용됩니다. XPath는 웹 페이지의 구조를 분석하여 원하는 정보를 추출하는 데 도움이 됩니다. 아래는 XPath의 설명과 예제 10개입니다:

XPath 구조:

XPath 예제 10개:

1
2

//a

1 2	//*[contains(@class, 'classname')]

1 2	//*[@id='elementid']

1
2


//div[1]

1 2	//*[@attribute='value']

1 2	//div[@class='parent']/span[@class='child']

1 2	//a[@class='link']/text()

1 2	//parent/child/*

1 2	//element/following-sibling::sibling

1 2	(//element)[last()]

웹 페이지의 구조와 요구 사항에 따라 XPath를 조합하여 원하는 데이터를 추출할 수 있습니다. 하지만 웹 사이트의 구조가 변경될 수 있으므로 XPath도 조정이 필요할 수 있습니다.