웹마스터 팁
page_full_width">
한글 필터링 정확히 하기
2002.02.09 07:02
http://board.mini-i.com이 문제는 제로보드도 역시 있는 문제 입니다.;;
eregi() 함수등으로 간단하게 처리할때
어이없는 한글을 같다고 인식할때가 있어요.
제로님도 보셔서;; 제로보드를 한층 더 빛내주시길 :)
HEX code 변환에 대한 속도걱정은 하지 않으셔도 되요;
함수 자체는 느리지만 편법;을 사용해서
1.6 메가 문장의 필터링에서 0.0005 초가 나왔답니다;;
이하 제가 PHPSCHOOL 에 남긴 글입니다;
---------------------------------------------------------------
안녕하세요 미뉘 입니다.
PHP 에서는 eregi,explode 등, 모든 검색 부분에서
한글을 검색할때 오류를 일으키는 것이 종종 있습니다.
이를테면 '려운' 과 '좆' 을 같게 인식한다거나 하는 것이죠.
어떤분의 말씀으로는 서버설정으로 이것을 해결할 수 있다고 하셨는데
필터링 사정-_-;상 서버설정 하나하나 다 바꿔달라고 할 수 없는거죠
무엇보다 프로그램 자체내에서 해결하는게 중요합니다.
이걸로 고심하고 있다가 저 아래에 어떤분이 HEX code 로 변환시켜서
판별하는 방법을 올려주셨습니다. 근데 그걸로 그냥 확인하면 문장이
조금만 길어지면 시간초과 됩니다; (한문자씩 바꿔주는 형식)
3시간-_-; 정도 막막해 있다가 드디어 해결했답니다 :)
strchr,substr 함수와 아랫분이 만드신 hex 변환 함수를 가지고 정확한 욕필터링
하는것을 보여드리겠습니다 -ㅁ-;
참고로 미니보드;; [02/09] 버젼부터 적용될 것이며
당장 확인 하실분은 http://board.mini-i.com 홈피내의
게시판에서 확인해보세요
기초적인것;; ( 지-_-랄 이라던지 ) 걸러내는 코드 다 빼고
핵심만 적었습니다.
------------------------------------------------------------
// $fil 에는 필터 내용들이 배열로 들어가 있습니다
// $fil = array('욕','욕-_-;;;'); 뭐 이렇게요;
// $confirm_filter 에는 필터링 대상 글이 들어가 있겠죠?
// 문자열을 hexcode로 바꿔주는 함수
function asc_hex($char) {
$j = 0; $word_length=strlen($char);
for($i = 0;$i<$word_length;$i++) {
if($j == 0) { if(ord(substr($char,$i,1)) > 0xa1 && ord(substr($char,$i,1)) <= 0xfe) {
$j = 1; $t_char = $t_char.bin2hex(substr($char,$i,1)); }
else { $t_char = $t_char."00".bin2hex(substr($char,$i,1))." "; }
} else { $t_char = $t_char.bin2hex(substr($char,$i,1))." "; $j = 0; } }
return $t_char; }
for($e=0;$e<count($fil);$e++)
{
if(strchr($confirm_filter,$fil[$e]))
{
// 필터링에 걸렸을때 잘못된 체크는 아닌지 체크함
$check_pos=strpos($confirm_filter,$fil[$e]);
if($check_pos<5) $check_pos=5;
$check_filter2=substr($confirm_filter,$check_pos-5,strlen($fil[$e])+5);
if(eregi(asc_hex($fil[$e]),asc_hex($check_filter2))) die(" $fil[$e] 단어는 등록할 수 없습니다. (필터링기능) ");
}
}
eregi() 함수등으로 간단하게 처리할때
어이없는 한글을 같다고 인식할때가 있어요.
제로님도 보셔서;; 제로보드를 한층 더 빛내주시길 :)
HEX code 변환에 대한 속도걱정은 하지 않으셔도 되요;
함수 자체는 느리지만 편법;을 사용해서
1.6 메가 문장의 필터링에서 0.0005 초가 나왔답니다;;
이하 제가 PHPSCHOOL 에 남긴 글입니다;
---------------------------------------------------------------
안녕하세요 미뉘 입니다.
PHP 에서는 eregi,explode 등, 모든 검색 부분에서
한글을 검색할때 오류를 일으키는 것이 종종 있습니다.
이를테면 '려운' 과 '좆' 을 같게 인식한다거나 하는 것이죠.
어떤분의 말씀으로는 서버설정으로 이것을 해결할 수 있다고 하셨는데
필터링 사정-_-;상 서버설정 하나하나 다 바꿔달라고 할 수 없는거죠
무엇보다 프로그램 자체내에서 해결하는게 중요합니다.
이걸로 고심하고 있다가 저 아래에 어떤분이 HEX code 로 변환시켜서
판별하는 방법을 올려주셨습니다. 근데 그걸로 그냥 확인하면 문장이
조금만 길어지면 시간초과 됩니다; (한문자씩 바꿔주는 형식)
3시간-_-; 정도 막막해 있다가 드디어 해결했답니다 :)
strchr,substr 함수와 아랫분이 만드신 hex 변환 함수를 가지고 정확한 욕필터링
하는것을 보여드리겠습니다 -ㅁ-;
참고로 미니보드;; [02/09] 버젼부터 적용될 것이며
당장 확인 하실분은 http://board.mini-i.com 홈피내의
게시판에서 확인해보세요
기초적인것;; ( 지-_-랄 이라던지 ) 걸러내는 코드 다 빼고
핵심만 적었습니다.
------------------------------------------------------------
// $fil 에는 필터 내용들이 배열로 들어가 있습니다
// $fil = array('욕','욕-_-;;;'); 뭐 이렇게요;
// $confirm_filter 에는 필터링 대상 글이 들어가 있겠죠?
// 문자열을 hexcode로 바꿔주는 함수
function asc_hex($char) {
$j = 0; $word_length=strlen($char);
for($i = 0;$i<$word_length;$i++) {
if($j == 0) { if(ord(substr($char,$i,1)) > 0xa1 && ord(substr($char,$i,1)) <= 0xfe) {
$j = 1; $t_char = $t_char.bin2hex(substr($char,$i,1)); }
else { $t_char = $t_char."00".bin2hex(substr($char,$i,1))." "; }
} else { $t_char = $t_char.bin2hex(substr($char,$i,1))." "; $j = 0; } }
return $t_char; }
for($e=0;$e<count($fil);$e++)
{
if(strchr($confirm_filter,$fil[$e]))
{
// 필터링에 걸렸을때 잘못된 체크는 아닌지 체크함
$check_pos=strpos($confirm_filter,$fil[$e]);
if($check_pos<5) $check_pos=5;
$check_filter2=substr($confirm_filter,$check_pos-5,strlen($fil[$e])+5);
if(eregi(asc_hex($fil[$e]),asc_hex($check_filter2))) die(" $fil[$e] 단어는 등록할 수 없습니다. (필터링기능) ");
}
}
제목 | 글쓴이 | 날짜 |
---|---|---|
제가 쓰는 alert 함수를 공개하지요.^^ [5] | Zeldign | 2002.02.25 |
^^ 좀더 다양한 Alert(); 함수화~ [3] | 도라에몽 | 2002.02.25 |
귀찮은 쿼리문을 함수화 해보자.. [1] | 도라에몽 | 2002.02.25 |
[씽크식 PHP] 노프레임에서 "역"으로 인클루드 쓰기. [14] | John Sync. | 2002.02.24 |
많고 많은 페이지들을 하나로 줄이자! [7] | 제키드+_+)/ | 2002.02.23 |
[re | 씽크식 PHP] 많고 많은 페이지들을 하나로 줄이자! [2] | John Sync. | 2002.02.24 |
http://홈주소/?mode=xxx 하는방법 :) [5] | 제니 | 2002.02.23 |
for 문에 대한 이해, 구구단 만들어 보기. [3] | Topy | 2002.02.22 |
[lib] fun. alert message (경고 메시지) [1] | Topy | 2002.02.22 |
[lib] fun 문자열속의 url에 링크를 거는 함수 [2] | Topy | 2002.02.22 |
복잡해? 줄여! [3] | 제키드+_+)/ | 2002.02.22 |
제로보드 분석 -2- [2] | 제키드+_+)/ | 2002.02.22 |
date 함수의 매개 변수 | Topy | 2002.02.22 |
in_array 함수이용한 업로드금지 [3] | 김승제 | 2002.02.21 |
PHP 소스 보이게 하기; [5] | Topy | 2002.02.21 |
제로보드 분석 -1- [4] | 제키드+_+)/ | 2002.02.21 |
좋은 난수값을 얻기위한 시드배정 방법 mt_srand(), srand() | 차카게살자 | 2002.02.21 |
필터링조금 다른거.. [7] | 두기두바 | 2002.02.10 |
한글 필터링 정확히 하기 [1] | mini | 2002.02.09 |
원고지 함수;; [3] | 디쓰 | 2002.02.07 |