자바 정규 표현식 예제

이것은 모든 예제에서 볼 수 있는 기본 동작입니다. 그러나 이 플래그를 사용하면 일치하는 검색기가 해석하는 대신 (.*) 검색할 수 없으므로 일치하지 않습니다: PatternSyntaxException – PatternSyntaxException 개체는 정규식 패턴에서 구문 오류를 나타내는 확인되지 않은 예외입니다. . String.replaceAll()과 같은 메서드에 대한 대체 문자열을 Java 코드에서 리터럴 Java 문자열로 제공할 때도 동일한 백슬래시-혼란이 발생합니다. 대체 텍스트에서 정규식 일치를 실제 달러 기호 또는 백슬래시로 바꾸려면 달러 기호를 $ 및 백슬래시로 로 인코딩해야 합니다. 그러나 백슬래시는 문자 그대로 Java 문자열에서도 이스케이프되어야 합니다. 따라서 대체 텍스트의 단일 달러 기호는 리터럴 Java 문자열로 작성될 때 „$”가 됩니다. 단일 백슬래시는 „\”가 됩니다. 오른쪽 다시: 4 개의 백슬래시를 삽입합니다. 정규표현식은 텍스트를 검색, 조작 및 편집하는 데 사용할 수 있는 문자열 패턴을 정의하는 데 사용됩니다. 이러한 식을 정규식(정규식의 짧은 형식)이라고도 합니다.

문자열분할(이전 단락 참조)을 제외하고 Pattern 개체에서 Matcher 개체를 만들어야 합니다. 매치러는 실제 작업을 수행합니다. 두 개의 개별 클래스가 있다는 장점은 단일 Pattern 개체에서 많은 Matcher 개체를 만들 수 있으므로 정규식을 여러 제목 문자열에 동시에 적용할 수 있다는 것입니다. Java 소스 코드에서 메서드가 수퍼 메서드를 재정의한다는 것을 나타내는 경우가 있습니다(Javadoc이 아닌 경우). Java 1.6에서이 작업을 수행할 수 @Override 이 작업은 코드에서 이러한 문을 제거할 수 있습니다. 다음 정규식을 사용하여 이러한 문을 식별할 수 있습니다. Java 캡처 그룹에서 정규 표현식 사용에 대한 Regular-Expressions.info 왼쪽에서 오른쪽으로 열리는 괄호를 계산하여 번호가 매겨져 있습니다. 예를 들어, 표현식 (A)(B(B(C)))에서, 네 개의 그룹이 있다 – 자바 5는 몇 가지 버그를 수정하고 유니 코드 블록에 대한 지원을 추가합니다. Java 6은 몇 가지 버그를 더 수정하지만 기능을 추가하지는 않습니다. Java 7은 명명된 캡처 및 유니코드 스크립트를 추가합니다.

Java는 정규식과 패턴 일치를 위한 java.util.regex 패키지를 제공합니다. Java 정규 표현식은 Perl 프로그래밍 언어와 매우 유사하며 배우기가 매우 쉽습니다. 아래 예제에서 정규식 .*book.*는 텍스트에서 문자열 „book”의 발생을 검색하는 데 사용됩니다. 정규식은 문자열에 대한 검색 패턴을 정의합니다. 정규식의 약어는 정규식입니다. 검색 패턴은 간단한 문자, 고정 된 문자열 또는 패턴을 설명하는 특수 문자를 포함하는 복잡한 표현식에서 무엇이든 할 수 있습니다. 정규식에 의해 정의된 패턴은 지정된 문자열에 대해 하나 또는 여러 번 일치하거나 전혀 일치하지 않을 수 있습니다. Matcher 개체는 마지막 일치 의 결과를 보유합니다.

메서드 start(), end() 및 group()을 호출하여 전체 정규식 일치 및 캡처괄호 간의 일치에 대한 세부 정보를 가져옵니다. 이러한 각 메서드는 역참조 수를 나타내는 단일 int 매개 변수를 허용합니다. 매개 변수를 생략하여 전체 정규식 일치에 대한 정보를 가져옵니다. start()는 일치하는 첫 번째 문자의 인덱스입니다. end()는 일치 후 첫 번째 문자의 인덱스입니다. 둘 다 제목 문자열의 시작 부분을 기준으로 합니다. 따라서 경기의 길이는 끝() – start()입니다. group() 정규식 또는 캡처 괄호 쌍과 일치하는 문자열을 반환합니다. 구문 오류 및 해당 인덱스, 잘못된 정규식 패턴 및 패턴 내의 오류 인덱스에 대한 시각적 표시가 포함된 다중 줄 문자열을 반환합니다.