웹마스터 팁
page_full_width" class="col-xs-12" |cond="$__Context->page_full_width">
한글 필터링 정확히 하기
2002.02.09 07:02
http://board.mini-i.com이 문제는 제로보드도 역시 있는 문제 입니다.;;
eregi() 함수등으로 간단하게 처리할때
어이없는 한글을 같다고 인식할때가 있어요.
제로님도 보셔서;; 제로보드를 한층 더 빛내주시길 :)
HEX code 변환에 대한 속도걱정은 하지 않으셔도 되요;
함수 자체는 느리지만 편법;을 사용해서
1.6 메가 문장의 필터링에서 0.0005 초가 나왔답니다;;
이하 제가 PHPSCHOOL 에 남긴 글입니다;
---------------------------------------------------------------
안녕하세요 미뉘 입니다.
PHP 에서는 eregi,explode 등, 모든 검색 부분에서
한글을 검색할때 오류를 일으키는 것이 종종 있습니다.
이를테면 '려운' 과 '좆' 을 같게 인식한다거나 하는 것이죠.
어떤분의 말씀으로는 서버설정으로 이것을 해결할 수 있다고 하셨는데
필터링 사정-_-;상 서버설정 하나하나 다 바꿔달라고 할 수 없는거죠
무엇보다 프로그램 자체내에서 해결하는게 중요합니다.
이걸로 고심하고 있다가 저 아래에 어떤분이 HEX code 로 변환시켜서
판별하는 방법을 올려주셨습니다. 근데 그걸로 그냥 확인하면 문장이
조금만 길어지면 시간초과 됩니다; (한문자씩 바꿔주는 형식)
3시간-_-; 정도 막막해 있다가 드디어 해결했답니다 :)
strchr,substr 함수와 아랫분이 만드신 hex 변환 함수를 가지고 정확한 욕필터링
하는것을 보여드리겠습니다 -ㅁ-;
참고로 미니보드;; [02/09] 버젼부터 적용될 것이며
당장 확인 하실분은 http://board.mini-i.com 홈피내의
게시판에서 확인해보세요
기초적인것;; ( 지-_-랄 이라던지 ) 걸러내는 코드 다 빼고
핵심만 적었습니다.
------------------------------------------------------------
// $fil 에는 필터 내용들이 배열로 들어가 있습니다
// $fil = array('욕','욕-_-;;;'); 뭐 이렇게요;
// $confirm_filter 에는 필터링 대상 글이 들어가 있겠죠?
// 문자열을 hexcode로 바꿔주는 함수
function asc_hex($char) {
$j = 0; $word_length=strlen($char);
for($i = 0;$i<$word_length;$i++) {
if($j == 0) { if(ord(substr($char,$i,1)) > 0xa1 && ord(substr($char,$i,1)) <= 0xfe) {
$j = 1; $t_char = $t_char.bin2hex(substr($char,$i,1)); }
else { $t_char = $t_char."00".bin2hex(substr($char,$i,1))." "; }
} else { $t_char = $t_char.bin2hex(substr($char,$i,1))." "; $j = 0; } }
return $t_char; }
for($e=0;$e<count($fil);$e++)
{
if(strchr($confirm_filter,$fil[$e]))
{
// 필터링에 걸렸을때 잘못된 체크는 아닌지 체크함
$check_pos=strpos($confirm_filter,$fil[$e]);
if($check_pos<5) $check_pos=5;
$check_filter2=substr($confirm_filter,$check_pos-5,strlen($fil[$e])+5);
if(eregi(asc_hex($fil[$e]),asc_hex($check_filter2))) die(" $fil[$e] 단어는 등록할 수 없습니다. (필터링기능) ");
}
}
eregi() 함수등으로 간단하게 처리할때
어이없는 한글을 같다고 인식할때가 있어요.
제로님도 보셔서;; 제로보드를 한층 더 빛내주시길 :)
HEX code 변환에 대한 속도걱정은 하지 않으셔도 되요;
함수 자체는 느리지만 편법;을 사용해서
1.6 메가 문장의 필터링에서 0.0005 초가 나왔답니다;;
이하 제가 PHPSCHOOL 에 남긴 글입니다;
---------------------------------------------------------------
안녕하세요 미뉘 입니다.
PHP 에서는 eregi,explode 등, 모든 검색 부분에서
한글을 검색할때 오류를 일으키는 것이 종종 있습니다.
이를테면 '려운' 과 '좆' 을 같게 인식한다거나 하는 것이죠.
어떤분의 말씀으로는 서버설정으로 이것을 해결할 수 있다고 하셨는데
필터링 사정-_-;상 서버설정 하나하나 다 바꿔달라고 할 수 없는거죠
무엇보다 프로그램 자체내에서 해결하는게 중요합니다.
이걸로 고심하고 있다가 저 아래에 어떤분이 HEX code 로 변환시켜서
판별하는 방법을 올려주셨습니다. 근데 그걸로 그냥 확인하면 문장이
조금만 길어지면 시간초과 됩니다; (한문자씩 바꿔주는 형식)
3시간-_-; 정도 막막해 있다가 드디어 해결했답니다 :)
strchr,substr 함수와 아랫분이 만드신 hex 변환 함수를 가지고 정확한 욕필터링
하는것을 보여드리겠습니다 -ㅁ-;
참고로 미니보드;; [02/09] 버젼부터 적용될 것이며
당장 확인 하실분은 http://board.mini-i.com 홈피내의
게시판에서 확인해보세요
기초적인것;; ( 지-_-랄 이라던지 ) 걸러내는 코드 다 빼고
핵심만 적었습니다.
------------------------------------------------------------
// $fil 에는 필터 내용들이 배열로 들어가 있습니다
// $fil = array('욕','욕-_-;;;'); 뭐 이렇게요;
// $confirm_filter 에는 필터링 대상 글이 들어가 있겠죠?
// 문자열을 hexcode로 바꿔주는 함수
function asc_hex($char) {
$j = 0; $word_length=strlen($char);
for($i = 0;$i<$word_length;$i++) {
if($j == 0) { if(ord(substr($char,$i,1)) > 0xa1 && ord(substr($char,$i,1)) <= 0xfe) {
$j = 1; $t_char = $t_char.bin2hex(substr($char,$i,1)); }
else { $t_char = $t_char."00".bin2hex(substr($char,$i,1))." "; }
} else { $t_char = $t_char.bin2hex(substr($char,$i,1))." "; $j = 0; } }
return $t_char; }
for($e=0;$e<count($fil);$e++)
{
if(strchr($confirm_filter,$fil[$e]))
{
// 필터링에 걸렸을때 잘못된 체크는 아닌지 체크함
$check_pos=strpos($confirm_filter,$fil[$e]);
if($check_pos<5) $check_pos=5;
$check_filter2=substr($confirm_filter,$check_pos-5,strlen($fil[$e])+5);
if(eregi(asc_hex($fil[$e]),asc_hex($check_filter2))) die(" $fil[$e] 단어는 등록할 수 없습니다. (필터링기능) ");
}
}
제목 | 글쓴이 | 날짜 |
---|---|---|
좋은 난수값을 얻기위한 시드배정 방법 mt_srand(), srand() | 차카게살자 | 2002.02.21 |
필터링조금 다른거.. [7] | 두기두바 | 2002.02.10 |
한글 필터링 정확히 하기 [1] | mini | 2002.02.09 |
원고지 함수;; [3] | 디쓰 | 2002.02.07 |
md5() 알고리듬 [8] | 양창민 | 2002.02.05 |
이제 홈페이지 업데이트 안하는 수모를 겪지 말자! [7] | 담배를끊으면복이옴과 | 2002.02.02 |
이제 PHP에 ?id=가나다라 같은것을 넣자! [12] | 담배를끊으면복이옴과 | 2002.01.30 |
초보분들을 위한 연산자 총정리 [6] | TheMics | 2002.01.29 |
[PHP]모르는 분이 있는듯 해서...변수관련 [2] | TheMics | 2002.01.24 |
cron을 이용해 윈앰프 방송정보를 빠르게 분석. [9] | Romeo | 2002.01.15 |
파일시스템에서 비밀번호 생성/수정/인증 [7] | 두기두바 | 2002.01.10 |
파일시스템(배열)에서의 검색기능 [5] | 두기두바 | 2002.01.09 |
[추천 팁] 디망쉬식 스킨 시스템 [4] | 디망쉬 | 2001.12.11 |
[추천 소스] phpMyAdmin 다중사용자용... [5] | WOWpc | 2001.11.29 |
MySQL에서 한글 정렬 문제 [2] | 손정호 | 2001.11.21 |
phpMyAdmin에서 dump 안 되시는 분들 보세요 [5] | 똥가리 | 2001.11.18 |
컴에 phpMyAdmin 깔고 원격 Mysql 관리.(이것도 팁이 되려나?) [1] | 최형삼 | 2001.11.17 |
[추천 소스] 특정일로부터 몇일 지났나 또는 몇일 남았나 알아보는 소스 ㅡ.ㅡ; [1] | 타스케 | 2001.11.15 |
게시판 만들 때 스팸메일을 막을 수 있는 방법중 한개. [11] | WOWpc | 2001.11.09 |
[GD] 이미지 회전 함수 공개합니다. [7] | 노경민 | 2001.11.05 |