Mega Code Archive

 
Categories / Python Tutorial / Network
 

Retrieving Images from HTML Documents

import HTMLParser import urllib import sys urlString = "http://www.python.org" def getImage(addr):     u = urllib.urlopen(addr)     data = u.read()     splitPath = addr.split('/')     fName = splitPath.pop()     print fName     f = open(fName, 'wb')     f.write(data)     f.close() class parseImages(HTMLParser.HTMLParser):     def handle_starttag(self, tag, attrs):         if tag == 'img':             for name,value in attrs:                 if name == 'src':                     getImage(urlString + "/" + value) lParser = parseImages() u = urllib.urlopen(urlString) print u.info() lParser.feed(u.read()) lParser.close()