'Regular Expression' 태그의 글 목록

Regular Expression

문자열 가공... 정규식 쿼리 2011.12.05
정규식(혹은 정규표현식)에 대한 문서들 정리 2009.04.07

문자열 가공... 정규식 쿼리

ㅇㅔ ㄷㅡ 2011. 12. 5. 17:37

2011. 12. 5. 17:37

database.sarang.net의 "Oracle Q&A" 게시판에서 발견한 글에 아주 살짝 양념을 더했습니다.

원문 : database.sarang.net의 원문

"어떤 문자열에서 특정 문자를 구분 문자로 하여 나눴을때 마지막 문자열을 보여주고싶다."라고 할때... 음... 이걸 해결해 놓은게 아래의 쿼리입니다.
Oracle 10g R2와 Oracle Express Edition 11g에서 정상적으로 실행되는것을 확인하였습니다.

SELECT tablespace_name "테이블스페이스"
, file_name "파일 이름"
, SUBSTR(file_name, INSTR(file_name, '\', -1) + 1) as "1st"
, REGEXP_SUBSTR(file_name, '[^\]+$') as "2nd"
FROM dba_data_files;

물론 UNIX 장비라면 아래와 같이 역슬래쉬가 아니라 슬래쉬로 구분을 해야겠죠. ^^

SELECT tablespace_name "테이블스페이스"
, file_name "파일 이름"
, SUBSTR(file_name, INSTR(file_name, '/', -1) + 1) as "1st"
, REGEXP_SUBSTR(file_name, '[^/]+$') as "2nd"
FROM dba_data_files;

테이블스페이스 파일 이름 1st 2nd

-------------- ---------------------------------------- ------------- -------------

USERS /u01/app/oracle/oradata/XE/users.dbf users.dbf users.dbf

SYSAUX /u01/app/oracle/oradata/XE/sysaux.dbf sysaux.dbf sysaux.dbf

UNDOTBS1 /u01/app/oracle/oradata/XE/undotbs1.dbf undotbs1.dbf undotbs1.dbf

SYSTEM /u01/app/oracle/oradata/XE/system.dbf system.dbf system.dbf

저작자표시 동일조건 (새창열림)

'IT 기술 > Oracle' 카테고리의 다른 글

Oracle ORA-01591 오류 문제 처리 (0)	2012.03.13
Oracle SQL Deveroper로 Oracle과 기타 RDBMS 개발/관리하기 (0)	2011.12.27
Oracle 10g에서 사용자 계정이 자주 잠겨서 불편할때. (0)	2011.07.07
드디어 Oracle 11g R2 client가 MS Windows 7에서도 정상적으로 설치됩니다. (0)	2010.04.23
Oracle 9.2.0.7에서의 로그마이너 버그 (0)	2010.04.14

정규식(혹은 정규표현식)에 대한 문서들 정리

ㅇㅔ ㄷㅡ 2009. 4. 7. 13:38

2009. 4. 7. 13:38

정규식(혹은 정규표현식)에 대해서 자료를 찾다가 괜찮은 문서들이 있길래 정리해봅니다.

1. IBM DeveloperWorks의 Special Issue중에서 초보 개발자 코드 트레이닝,Part 5 : 정규 표현식

2. www.wonchu.net의 자바스크립트 정규식 문서(아래 두개중 어떤 링크를 이용해도 됨.)
http://www.wonchu.net/board.do?method=bview&boardId=003&boardSeq=36 (검색엔진에서 찾은 링크)
http://www.wonchu.net/issue/00336 (게시판에 표시된 링크)

3. [똥싼너구리의 정리노트]라는 스프링노트에 올라온 문서
정규표현식 카테고리

4. [카알의 적당한 인생 이야기]에 올라온 정규표현식 문서
정규 표현식(Regular Expressions)

아래는 [카알의 적당한 인생 이야기]의 내용을 정리한 것입니다.

(1) ^ (caret) : 라인의 처음이나 문자열의 처음을 표시
$ (dollar) : 라인의 끝이나 문자열의 끝을 표시
. (period) : 임의의 한 문자를 표시

예)
^aaa (문자열의 처음에 aaa를 포함하면 참, 그렇지 않으면 거짓)

aaa$ (문자열의 끝에 aaa를 포함하면 참, 그렇지 않으면 거짓)

^a.c (문자열의 처음에 abc, adc, aZc 등은 참, aa 는 거짓)

a..b$ (문자열의 끝에 aaab, abbb, azzb 등을 포함하면 참)

(2) [] (bracket) : 문자의 집합이나 범위를 나타냄, 두 문자 사이의 "-"는 범위를 나타낸다.

[]내에서 "^"이 선행되면 not을 나타낸다.

이외에도 "문자클래스"를 포함하는 [:문자클래스:]의 형태가 있다. "문자클래스"에는 alpha, blank, cntrl, digit, graph, lower, print, space, uppper, xdigit가 있다.

이외에 [:<:]와 [:>:]는 어떤 단어(숫자, 알파벳, '_'로 구성됨)의 시작과 끝을 나타낸다.

예)
[abc] (a, b, c 중 어떤 문자, "[a-c]."과 동일)

[Yy] (Y 또는 y)

[A-Za-z0-9] (모든 알파벳과 숫자)

[-A-Z]. ("-"(hyphen)과 모든 대문자)

[^a-z] (소문자 이외의 문자)

[^0-9] (숫자 이외의 문자)
[:alpha:] ([A-Za-z]와 동일)

[[:digit:]] ([0-9]와 동일)

(3) {} (brace) : {} 내의 숫자는 직전의 선행문자가 나타나는 횟수 또는 범위를 나타냄

예)
a{3} ('a'의 3번 반복인 aaa만 해당됨)

a{3,} ('a'가 3번 이상 반복인 aaa, aaaa, aaaa, ... 등을 나타냄)

a{3,5} (aaa, aaaa, aaaaa 만 해당됨)

ab{2,3} (abb와 abbb 만 해당됨)

[0-9]{2} (두 자리 숫자)

doc[7-9]{2} (doc77, doc87, doc97 등이 해당)

[^Zz]{5} (Z와 z를 포함하지 않는 5개의 문자열, abcde, ttttt 등이 해당)

.{3,4}er ('er'앞에 세 개 또는 네 개의 문자를 포함하는 문자열이므로 Peter, mother 등이 해당)

(4) * (asterisk) : "*" 직전의 선행문자가 0번 또는 여러번 나타나는 문자열

예)
ab*c ('b'를 0번 또는 여러번 포함하므로 ac, ackdddd, abc, abbc, abbbbbbbc 등)

* (선행문자가 없는 경우이므로 임의의 문자열 및 공백 문자열도 해당됨)

.* (선행문자가 "."이므로 하나 이상의 문자를 포함하는 문자열, 공백 문자열은 안됨)

ab* ('b'를 0번 또는 여러번 포함하므로 a, accc, abb, abbbbbbb 등)

a* ('a'를 0번 또는 여러번 포함하므로 k, kdd, sdfrrt, a, aaaa, abb, 공백문자열 등) doc[7-9]* (doc7, doc777, doc778989, doc 등이 해당)

[A-Z].* (대문자로만 이루어진 문자열)

like.* (직전의 선행문자가 '.'이므로 like에 0 또는 하나 이상의 문자가 추가된 문자열이됨, like, likely, liker, likelihood 등)

(5) + (asterisk) : "+" 직전의 선행문자가 1번 이상 나타나는 문자열

예)
ab+c ('b'를 1번 또는 여러번 포함하므로 abc, abckdddd, abbc, abbbbbbbc 등, ac는 안됨)

ab+ ('b'를 1번 또는 여러번 포함하므로 ab, abccc, abb, abbbbbbb 등)

like.+ (직전의 선행문자가 '.'이므로 like에 하나 이상의 문자가 추가된 문자열이 됨, likely, liker, likelihood 등, 그러나 like는 해당안됨)

[A-Z]+ (대문자로만 이루어진 문자열)

(6) ? (asterisk) : "?" 직전의 선행문자가 0번 또는 1번 나타나는 문자열

예)
ab?c ('b'를 0번 또는 1번 포함하므로 abc, abcd 만 해당됨)

(7) () (parenthesis) : ()는 정규식내에서 패턴을 그룹화 할 때 사용

(8) | (bar) : or를 나타냄

예)
a|b|c (a, b, c 중 하나, 즉 [a-c]와 동일함)

yes|Yes (yes나 Yes 중 하나, [yY]es와 동일함)

korea|japan|chinese (korea, japan, chinese 중 하나)

정규식에서는 위에서 언급한 특수 문자를 제외한 나머지 문자들은 일반 문자로 취급함

'IT 기술 > Developer article' 카테고리의 다른 글

[소개]IBM DW : 클라우드에 연결하기 (0)	2009.09.23
[책소개]Blog2Blog 자바 성능을 결정짓는 코딩 습관과 튜닝 이야기 (0)	2009.04.09
[소개]안전한 PHP 응용 프로그램을 작성하는 일곱 가지 습관 (0)	2009.03.26
[소개]Python 3 입문, Part 1: 새로운 기능 (0)	2009.03.24
[소개]IBM DW : 사람을 위한 자동화: 마법사 기반 설치 프로그램 사용하기 (0)	2009.01.29

PREV 이전 1 NEXT 다음

여기저기 기웃거리기