R Regex에서 개행 문자 일치

Gustavo du Mortier 2023년12월11일
  1. 다른 환경에서 줄 바꿈 시퀀스
  2. 줄 바꿈 시퀀스로 정규식 테스트
R Regex에서 개행 문자 일치

정규식 (줄여서 regex)은 문자열 패턴을 정의하는 매우 보편적 인 방법이지만, 이러한 패턴은 특히 정규식이 줄 바꿈과 같은 특수 문자와 일치하려는 경우 다른 플랫폼에서 다르게 작동 할 수 있습니다. 이 기사에서는 R의 정규식에 줄 바꿈을 포함하는 다양한 방법을 분석합니다.

다른 환경에서 줄 바꿈 시퀀스

Linux 환경에서\n 패턴은 줄 바꿈 시퀀스와 일치합니다. 그러나 Windows에서는 줄 바꿈이\r\n과 일치하고 이전 Mac에서는\r과 일치합니다.

이러한 플랫폼에서 개행 시퀀스와 일치하는 정규 표현식이 필요한 경우\r?\n 패턴을 사용하여\n\r\n 줄 종료 문자 시퀀스를 모두 일치시킬 수 있습니다.

패턴이 이전 Mac의 줄 바꿈과 제대로 일치하지 않더라도 해당 옵션이 적용되는 Linux 및 Windows 환경이 있습니다. 이전 Mac도 포함하려면\r 과도 일치하는\r?\n|\r 패턴을 사용할 수 있습니다. 이 패턴의 더 정확한 버전은 다음과 같습니다.(\r\n|\r|\n)

줄 바꿈 시퀀스로 정규식 테스트

많은 웹 사이트에서 정규 표현식을 테스트 할 수 있습니다. 대부분은 Linux 환경처럼 작동하여\n 패턴을 테스트 할 때 줄 바꿈이있는 문자열에서 일치하는 항목을 찾습니다. 그러나\r\n 패턴을 테스트 할 때 일치하는 항목을 찾지 못합니다. 이러한 사이트의 예로는 Regex101Regexr이 있습니다.

다른 테스트 웹 사이트는 다른 운영 환경에서 발생하는 것처럼 다른 동작을 보여줄 수 있습니다. 예를 들어 Regex Storm은 Windows 플랫폼과 비슷하게 작동하여 줄 바꿈이있는 문자열과\r\n 패턴 사이의 일치 항목을 찾습니다.

관련 문장 - R Regex