본문 바로가기
공부하기/PL

웹 크롤링 PHP html dom parser

by hyunjicraft 2019. 9. 6.

웹 상에서 다른 사이트의 정보를 그대로 복사하여 쓰고 싶을 때, XML/HTML의 형식을 파싱하여 원하는 정보를 가져올 수 있다.

아래 라이브러리를 사용하면 간단하게 원하는 정보를 크롤링할 수 있다.

영어 문서지만 사용 방법이 간단하고 익숙해지면 유용하게 사용할 수 있다.

 

 

다운로드 및 링크 : https://simplehtmldom.sourceforge.io

 

 

PHP Simple HTML DOM Parser

$html = str_get_html(' Hello World '); $html->find('div', 1)->class = 'bar'; $html->find('div[id=hello]', 0)->innertext = 'foo'; echo $html; $html = file_get_html('http://slashdot.org/'); foreach($html->find('div.article') as $article) {     $item['title']

simplehtmldom.sourceforge.io

 

댓글