Javaregex-unicode-class-substraction

提供:Dev Guides
移動先:案内検索

Unicode文字クラス[\ p \ {L} && [^ \ p \ {Lu}]]

説明

文字クラス [\ p \ {L} && [^ \ p \ {Lu}]] は、大文字を除くすべての文字に一致します。

次の例は、Unicode文字クラス一致の使用法を示しています。

package com.finddevguides;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class UnicodeCharacterClassDemo {
   private static final String REGEX = "[\\p{L}&&[^\\p{Lu}]]";
   private static final String INPUT = "!BSab\u03B1";

   public static void main(String[] args) {
     //create a pattern
      Pattern  pattern = Pattern.compile(REGEX);

     //get a matcher object
      Matcher matcher = pattern.matcher(INPUT);

      while(matcher.find()) {
        //Prints the start index of the match.
         System.out.println("Match String start(): "+matcher.start());
      }
   }
}

上記のプログラムをコンパイルして実行すると、次の結果が生成されます-

Match String start(): 3
Match String start(): 4
Match String start(): 5