Mega Code Archive

Retrieving Images from HTML Documents

import HTMLParser import urllib import sys urlString = "http://www.python.org" def getImage(addr): u = urllib.urlopen(addr) data = u.read() splitPath = addr.split('/') fName = splitPath.pop() print fName f = open(fName, 'wb') f.write(data) f.close() class parseImages(HTMLParser.HTMLParser): def handle_starttag(self, tag, attrs): if tag == 'img': for name,value in attrs: if name == 'src': getImage(urlString + "/" + value) lParser = parseImages() u = urllib.urlopen(urlString) print u.info() lParser.feed(u.read()) lParser.close()