Mega Code Archive

 
Categories / Java / Regular Expressions
 

Show use of Pattern CANON_EQ

/*  * Copyright (c) Ian F. Darwin, http://www.darwinsys.com/, 1996-2002.  * All rights reserved. Software written by Ian F. Darwin and others.  * $Id: LICENSE,v 1.8 2004/02/09 03:33:38 ian Exp $  *  * Redistribution and use in source and binary forms, with or without  * modification, are permitted provided that the following conditions  * are met:  * 1. Redistributions of source code must retain the above copyright  *    notice, this list of conditions and the following disclaimer.  * 2. Redistributions in binary form must reproduce the above copyright  *    notice, this list of conditions and the following disclaimer in the  *    documentation and/or other materials provided with the distribution.  *  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS''  * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED  * TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR  * PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS  * BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR  * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF  * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS  * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN  * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)  * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE  * POSSIBILITY OF SUCH DAMAGE.  *   * Java, the Duke mascot, and all variants of Sun's Java "steaming coffee  * cup" logo are trademarks of Sun Microsystems. Sun's, and James Gosling's,  * pioneering role in inventing and promulgating (and standardizing) the Java   * language and environment is gratefully acknowledged.  *   * The pioneering role of Dennis Ritchie and Bjarne Stroustrup, of AT&T, for  * inventing predecessor languages C and C++ is also gratefully acknowledged.  */ import java.util.regex.Pattern; /**  * CanonEqDemo - show use of Pattern.CANON_EQ, by comparing varous ways of  * entering the Spanish word for "equal" and see if they are considered equal by  * the RE-matching engine.  *   * @version $Id: CanonEqDemo.java,v 1.3 2004/03/21 20:06:20 ian Exp $  */ public class CanonEqDemo {   public static void main(String[] args) {     String pattStr = "\u00e9gal"; // Zgal     String[] input = { "\u00e9gal", // Zgal - this one had better match :-)         "e\u0301gal", // e + "Combining acute accent"         "e\u02cagal", // e + "modifier letter acute accent"         "e'gal", // e + single quote         "e\u00b4gal", // e + Latin-1 "acute"     };     Pattern pattern = Pattern.compile(pattStr, Pattern.CANON_EQ);     for (int i = 0; i < input.length; i++) {       if (pattern.matcher(input[i]).matches()) {         System.out.println(pattStr + " matches input " + input[i]);       } else {         System.out.println(pattStr + " does not match input "             + input[i]);       }     }   } }