2017/06 썸네일형 리스트형 [node.js] 웹 데이터 수집 ② - HTML 해석(링크와 이미지 추출) ※ 스크래핑이란? 웹의 세계에서 흔히 말하는 '스크래핑'은 웹사이트에서 HTML 데이터를 수집하고, 특정 데이터를 추출, 가공하여 저장하는 것을 말한다. 단순히 웹사이트에서 HTML 파일을 다운로드만 하는 것이 아니라 그 HTML 파일의 각 요소들을 분석하는 과정을 포함한다. ■ cheerio-httpcli 모듈 설치 01. 우선 명령 커멘드 창을 열고 다음 명령을 실행하여 cheerio-httpcli을 설치한다. > npm install -g cheerio-httpcli 02. 정상적으로 설치가 되었다면 아래와 같은 결과가 나오는 것을 확인할 수 있다. ■ HTML 파일 다운로드 01. 이제 'cheerio-httpcli' 모듈을 사용해서, 웹 페이지를 내려받아 HTML 문서를 화면에 출력해보자 코드는.. 더보기 이전 1 다음