웹마스터 팁

문자열(STRING) 처리 및 관련함수

CGI와 같은 웹관련 프로그래밍에서는 문자열 관련 함수들이 가장 많이 쓰입니다. 특히 게시판처럼 사용자가 입력한 문자열을 체크하고 이 값을 파일이나 데이터베이스에 저장한 후 다시 검색된 데이터를 추출하여 출력하는 방식의 웹 프로그램에서는 사용자의 요청에 의해 전송되는 데이터가 대부분 문자열의 형태이기 때문에 이러한 문자열의 처리가 상당히 중요한 문제가 됩니다. 따라서, 다른 함수보다도 이 문자열 처리 함수를 많이 알고 있는 것이 게시판과 같은 프로그램을 개발시 큰 도움이 됩니다.

다음은 PHP에서 지원하는 문자열 처리 함수들입니다.
함수명 기능
addslashes 작은따옴표(')와 큰따옴표(") , 역슬래쉬()와 같은 특정 문자앞에 역슬래쉬()문자를 붙힌다.
stripslashes addslashes() 함수를 통해 역슬래쉬 처리가 된 문자를 원 상태로 되돌린다.
htmlspecialchars HTML 코드를 문자열 소스 그대로 출력한다.
nl2br 문자열의 개행문자(n)를
태그로 치환한다.
echo 문자열을 출력한다.
sprintf 자열열을 지정해준 포맷으로 바꾸어 반환한다.
printf 문자열을 지정해준 포맷으로 출력한다.
explode 문자열을 구분자로 나누어 배열에 저장한다.
implode 배열의 각 원소를 구분자로 연결한 전체 문자열을 반환한다.
join implode 와 같다.
split explode 와 같다.
strcmp 두개의 문자를 비교한다.
substr 문자열의 일부를 추출한다.
strchr 검색 대상 문자열에서 찾고자 하는 문자열이 처음으로 나타나는 위치 이후의 문자열을 반환한다.
strrchr 검색 대상 문자열에서 찾고자 하는 문자열이 마지막으로 나타나는 위치 이후의 문자열을 반환한다.
strpos 검색 대상 문자열에서 찾고자 하는 문자열이 처음으로 나타나는 위치를 숫자로 반환한다.
strrpos 검색 대상 문자열에서 찾고자 하는 문자가 마지막으로 나타나는 위치를 숫자로 반환한다.
strlen 문자열의 길이(byte)를 반환한다. 한글은 2byte로 계산,즉 한글1자는 영문2자와 같다.
strtolower 아파벳으로 된 문자열을 소문자로 변환한다.
strtoupper 알파벳으로 된 문자열을 대문자로 변환한다.
ucfirst 알파벳 문자열의 첫글자를 대문자로 변환한다.
ucwords 알파벳 문자열내 모든 단어의 첫글자를 대문자로 변환한다.
strrev 문자열의 순서를 정반대로 바꾼다.
strtr 대상 문자열의 각 문자를 검색하여 지정한 문자로 각각 치환한다.
str_replace 문자열을 검색하여 원하는 문자열을 다른 문자열로 바꾼다.
chop 문자열의 뒷 부분에 있는 개행문자(n) 및 공백문자를 제거한다.
trim 문자열의 앞 부분과 뒷 부분에 있는 공백문자를 제거한다.
quotemeta 메타 문자앞에 역슬래쉬 문자를 덧붙힌다.
ord 문자의 ASCII 코드값을 반환한다.
chr 특정 ASCII 코드값을 갖는 문자를 반환한다.
parse_str URL을 통해 전달되는 문자열을 파싱하여 변수를 설정한다.

addslashes 함수

addslashes() 함수는 다음과 같이 정의됩니다.

$문자열변수1 = addslashes($문자열변수2);
$문자열변수2 에 작은따옴표(') 나 큰따옴표("), 혹은 역슬래쉬()와 같은 문자가 포함되어 있을 경우 이러한 문자들앞에 역슬래쉬()를 붙혀서 $문자열변수1 에 반환한다.


위와 같은 addslashes() 함수는 대부분 mysql과 같은 데이터 베이스에 SQL의 INSERT나 UPDATE와 같은 질의어를 통해 전송되는 문자열변수에 많이 사용됩니다. 다음은 MYSQL 데이터베이스에 데이터를 전달하는 INSERT 문입니다.

$query = "INSERT INTO table (CONTENT) VALUES ('$content')";

$content 를 일반적인 게시판과 같은 곳의 내용을 담은 문자열 데이터라고 한다면 addslashes()를 통해 escape 시키지 않을 경우 문제가 발생할 수 있습니다.. 만약 $content = " 안녕하세요.. '한꼬마'입니다.": 라고 할때, 한꼬마를 둘러싼 작은따옴표와 $content앞의 작은따옴표가 충돌이 일어나게 됩니다. 풀어서 보면, $query = "INSERT INTO table (CONTENT) VALUES ('안녕하세요.. '한꼬마'입니다.')"; 와 같이 되고 작은따옴표가 출돌이 생기면서 오류가 나게 됩니다. 이와 같은 오료를 막기위해 addslashes() 함수를 사용하며, addslashes()함수를 사용해서 역슬래쉬()를 붙혀주는 것을 흔히 "escape시킨다." 라고 합니다.


$content = "동해물과 '백두산'이 마르고 닳도록...";
$content = addslashes($content);
echo "$content";

[실행결과] 동해물과 '백두산'이 마르고 닳도록...

stripslashes 함수

stripslahes() 함수는 다음과 같이 정의됩니다.

$문자열변수1 = stripslashes($문자열변수2);
$문자열변수2 에 역슬래쉬()와 같은 문자가 포함되어 있을 경우 이러한 문자들앞의 역슬래쉬()를 제거한후 $문자열변수1 에 반환한다.
즉, addslashes() 함수로 escape된 문자열을 원상태로 되돌려준다.


$content = "동해물과 '백두산'이 마르고 닳도록...";
$content = stripslashes($content);
echo "$content";

[실행결과] 동해물과 '백두산'이 마르고 닳도록...

htmlspecialchars 함수

htmlspecialchars() 함수는 다음과 같이 정의됩니다.

$문자열변수1 = htmlspecialchars($문자열변수2);
$문자열변수2 에 html관련문자열인 >,<,",&등의 특수문자가 포함되어 있을 경우 화면상에 보일 수 있도록 일반 문자로 바꾸어 $문자열변수1에 반환한다.


' &' => '&' 로 바꾼다.
' " ' => '"' 로 바꾼다.
'+ ' <' => '<' 로 바꾼다.
' >' => '>' 로 바꾼다.

nl2br 함수

$문자열변수1 = nl2br($문자열변수2);
$문자열변수2 에 개행문자(n)가 포함되어 있을 경우 개행문자를
로 치환하여 $문자열변수1에 반환한다.


$content = "동해물과 백두산이 마르고n닳도록...";
$content = nl2br($content);
echo "$content";

[실행결과] 동해물과 백두산이 마르고
닳도록...

sprintf 함수

sprintf() 함수의 정의는 다음과 같다.

$변수1 = sprintf("지정포맷" , $변수2);
$변수2를 지정포맷으로 바꾸어 $변수1에 반환한다.


$kkk = "hancoma";
$hancoma = sprintf("$kkk%s", _niceguy);
echo "$hancoma";

[실행결과] hancoma_niceguy

explode 함수 = split 함수

explode() 함수의 정의는 다음과 같습니다.

$배열 = explode("구분자" , $변수);
구분자를 통해 $변수를 분리하여 $배열에 그 원소들을 차례로 넣어준다.


$hancoma = "hancoma1|hancoma2|hancoma3|hancoma4|";
$array_hancoma = explode("|" , $hancoma);
echo "$array_hancoma[0]
$array_hancoma[1]
$array_hancoma[2]
$array_hancoma[3]";

[실행결과]
hancoma1
hancoma2
hancoma3
hancoma4

CF) $array_hancoma = split("|", $hancoma); 와 $array_hancoma = explode("|", $hancoma); 는 같다. (단, split함수는 정규표현식을 이용할 수 있다.)

 

implode 함수 = join 함수

implode() 함수의 정의는 다음과 같습니다.

$변수 = implode("구분자" , $배열);
구분자를 통해 $배열의 원소들을 붙혀서 $변수에 반환한다.


$array = array("hancoma1" , "hancoma2" , "hancoma3");
$hancoma = implode("|" , $array);
echo "$hancoma";

[실행결과] hancoma1|hancoma2|hancoma3

CF) implode()함수와 join() 함수는 같다.

strcmp 함수

strcmp() 함수의 정의는 다음과 같습니다.

strcmp($변수1 , $변수2);
$변수1과 $변수2의 문자열을 비교한다. 주로, if문에 많이 사용되며 두문자열이 일치할 경우 0을 반환한다.


$hancoma = "한꼬마";
if(!strcmp($hancoma , "한꼬마") { // $hancoma 와 "한꼬마"가 일치한다면
echo " 두문자열이 일치합니다. ";
}

[실행결과] 두문자열이 일치합니다.

substr 함수

substr() 함수의 정의는 다음과 같습니다.

$변수1 = substr($변수2 , 시작숫자, 끊어줄길이수);
$변수2 문자열을 시작숫자에서 부터 끊어줄길이수까지 추출한다음 그 값을 $변수1에 반환한다.


$time = "2000-11-05 [12:25]";
$short_time = substr($time,0,10);
echo "$short_time";

[실행결과] 2000-11-05

strlen 함수

strlen() 함수의 정의는 다음과 같습니다.

$변수1 = strlen($변수2);
$변수2의 문자열의 길이(byte수)를 $변수1에 반환한다.


$str = "hancoma";
$str_len = strlen($str);
echo "$str_len";

[실행결과] 4

str_replace 함수

str_replace() 함수의 정의는 다음과 같습니다.

$변수1 = str_replace("찾을문자" , "바꿀문자" , $변수2);
$변수2 문자열에서 찾을문자를 찾아 바꿀문자로 바꿔준다음 그 값을 $변수1로 반환한다.


$str = "hancoma는 한꼬마입니다.";
$str_re = str_replace("한꼬마" , "niceguy" , $str);
echo "$str_re";

[실행결과] hancoma는 niceguy입니다.

chop 함수

chop() 함수의 정의는 다음과 같습니다.

$변수1 = chop($변수2);
$변수2의 뒷 부분에 있는 공백문자를 제거한후 그 값을 $변수1에 반환한다.


$hancoma = "hancomaworld ";
$hancoma = chop($hancoma);
echo "[$hancoma]";

[실행결과] [hancomaworld]

CF) trim() 함수는 뒷부분에 있는 공백문자와 앞부분에 있는 공백문자 모두 제거할때 사용합니다.

이상으로 PHP에서 주로 쓰이는 문자열 관련 함수들을 정리해 보았습니다. 이외에도 몇가지가 더 있으나, 문자열관련 함수는 이정도면 충분할 거라 생각됩니다. PERL에 비하여 PHP의 문자열 관련 함수는 상당히 강력하다고 할 수 있습니다. 여러분들은 지금까지 설명드린 문자열 함수만 마스터 하시면 큰 무리없이 문자열을 다루실 수 있을 것입니다.