어제 'AnLab'의 보고서들을 읽어보기 위해 다운로드 받으려 하는데,
65개나 되는 파일을 다운로드 받으려고 하니
너무 번거로울 거 같아
Python으로 파일을 다운로드 받을 수 있지 않을까
하는 마음에 찾아보게 되었어요.
기본적 예제는 이렇게 나와요.
각각 urllib, urllib2를 이용하여 파일을 다운로드해요.
url : URL을 저장하는 String 변수의 역할을 해요.
urlretrieve(URL주소, 저장할 이름) : 다운로드할 파일이 있는 곳에서 URL주소에서 지정한
f = urllib2.urlopen(URL주소) : 지정한 URL을 열고, 그 지정한 곳을 f에 저장하는 것 같아요.
data = f.read() : data에 지정한 주소의 파일 데이터를 읽어드려 data에 binary로 저장하지요.
그 이하는 추후 추가 할래요... 지금은 바빠서.
제가 작성한 소스에요.
URL은 Ahnlab에서의 ASEC_Report목록입니다.
for문으로 0부터 53까지 하려 했는데 54까지 해븟네요.
필요한 건 Vol.13부터 Vol.65까지 다운받고 Vol.66은 URL이 없어서인지 다운로드는 되지 않았어요.
파이썬 참 대단한 것 같다고 새삼 다시 느끼네요.
PS URL이 없는 곳에서 파일을 다운로드 해보려고 하면 이런 결과가 나오네요.
No.65는 잘 다운로드된 파일.
No.66는 다운로드되지 않은 파일.
2KB밖에 되지 않네요.
출처: http://kkamikoon.tistory.com/7 [컴퓨터를 다루다]
'[ 기타 활동 ] > 파이썬' 카테고리의 다른 글
특정폴더의 PDF 화일 받기 (0) | 2018.05.16 |
---|---|
파이썬 urllib를 사용하여 URL에서 이미지를 다운로드하지만 HTTP 오류 403 수신 : 금지됨 (0) | 2018.05.16 |
Google Search 사용법 (0) | 2018.05.15 |
스크롤러 (0) | 2018.05.15 |
뷰티플수프 문서 (0) | 2018.05.15 |