이런 것이 있다.
https://www.crummy.com/software/BeautifulSoup/
파이선에서 사용하는 라이브러리인데,
jquery 쓰듯 html 문서를 탐색하고 엘리먼트를 조회하고 속성값을 얻을 수 있다.
조금 써봤는데 짱인 듯.
설치 방법부터 사용 방법까지 정리해둔 블로그 워낙 많으니 다 할 필요는 없고..
초간략..
from bs4 import BeautifulSoup
html = "<html>....<div class='ccc'>...</div>...<p id='hoho'>...</p>...</html>"
soup = BeautifulSoup(responses, "html.parser")
content = soup.find("div") # div 요소를 찾는다.
content = soup.find(id="hoho") # id가 hoho 인 요소를 찾는다.
content = soup.find("div", class_="ccc") # div 요소 중 ccc 클래스를 달고 있는 걸 찾는다.
arraylist = soup.find_all("div") # div 요소를 모두 찾아 배열로 반환한다.
써보면 안다.
이게 얼마나 짱인지. ㅎ
'dev' 카테고리의 다른 글
CKEDITOR link 내에서 & (ampersand) 치환 이슈 (0) | 2017.03.17 |
---|---|
HATEOAS 이해 (0) | 2017.02.28 |
graph db 탐험기 (0) | 2017.02.21 |
eclipse zookeeper plugin (0) | 2017.02.13 |
sourcetree 비밀번호 저장 안되는 이슈 mac (1) | 2017.01.31 |