Mega Code Archive

 
Categories / Java / XML
 

The program prints all hyperlinks links of an XHTML web page

/*    This program is a part of the companion code for Core Java 8th ed.    (http://horstmann.com/corejava)    This program is free software: you can redistribute it and/or modify    it under the terms of the GNU General Public License as published by    the Free Software Foundation, either version 3 of the License, or    (at your option) any later version.    This program is distributed in the hope that it will be useful,    but WITHOUT ANY WARRANTY; without even the implied warranty of    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the    GNU General Public License for more details.    You should have received a copy of the GNU General Public License    along with this program.  If not, see <http://www.gnu.org/licenses/>. */ import java.io.InputStream; import java.net.URL; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; import org.xml.sax.Attributes; import org.xml.sax.helpers.DefaultHandler; /**  * This program demonstrates how to use a SAX parser. The program prints all hyperlinks links of an  * XHTML web page. <br>  * Usage: java SAXTest url  * @version 1.00 2001-09-29  * @author Cay Horstmann  */ public class SAXTest {    public static void main(String[] args) throws Exception    {       String url;       if (args.length == 0)       {          url = "http://www.w3c.org";          System.out.println("Using " + url);       }       else url = args[0];       DefaultHandler handler = new DefaultHandler()          {             public void startElement(String namespaceURI, String lname, String qname,                   Attributes attrs)             {                if (lname.equals("a") && attrs != null)                {                   for (int i = 0; i < attrs.getLength(); i++)                   {                      String aname = attrs.getLocalName(i);                      if (aname.equals("href")) System.out.println(attrs.getValue(i));                   }                }             }          };       SAXParserFactory factory = SAXParserFactory.newInstance();       factory.setNamespaceAware(true);       SAXParser saxParser = factory.newSAXParser();       InputStream in = new URL(url).openStream();       saxParser.parse(in, handler);    } }