붙었습니다.
(3차 남았습니다)


그리고 중간고사 보는 중.

다음에 봐요.
2007/10/22 22:16 2007/10/22 22:16
TAG

카와이북에서 스팸 막기

글/기타 2007/07/05 12:24 ScrapHeap
이 글은 방명록 스팸에 대한 글인 게임의 법칙의 후속편입니다.

시험 보고 난리도 아니고 등등을 겪는 동안 격조했습니다.
인사를 받아줄 사람이 있는 지는 모르지만 아무튼 인사는 해 둡니다. 어쩌겠어요.

방명록 등 인터넷 게시판 상의 스팸 문제는 이미 심각합니다. 최소한의 보안 기능을 갖추지 않은 프로그램을 사용하는 것은 이제 거의 불가능합니다. 스팸은 인터넷이라는 강의 바닥을 따라 흐르는 하나의 흐름이 된 것 같군요. 강에 발을 담그는 이상 스팸을 피하는 것은 이제 불가능합니다. 이겨내야죠.

전에 썼던 글에서 CGI 방명록인 카와이북 3의 방명록 스팸 때문에 고생한 이야기를 했습니다. 그리고 생각해둔 게 있긴 하다는 이야기도 했지요. 그 날인가 그 다음 날에 조치를 취하고 대충 100일 가까이(98일째인가 그렇습니다) 지났는데 스팸은 하나도 없군요. 안심해도 될 것 같습니다. 그럼 그 조치에 대해 얘기해 보도록 하지요.

  1. 방명록 스팸은 구글 등의 검색엔진에서 순위를 높이기 위한 수단입니다.
    (참고 : 게시판 spamming의 목적)

  2. 따라서 검색이 되는 페이지를 찾아가서 스팸을 뿌리게 되어 있습니다.

  3. 그러므로 검색을 막으면 됩니다.

정보 게시판 등은 검색이 되는 편이 낫기 때문에 좀 곤란하지만 방명록이 검색엔진에 등록될 필요는 없겠지요. 따라서 카와이북 3의 경우 검색을 막는 것이 유용한 수단이 됩니다.

그렇다면 문제는 검색을 막는 방법.

이거야 간단하죠. robots.txt를 쓰면 됩니다.
robots.txt란 '사이트를 검색기에서 제외하는 표준' 입니다.
참고 문서로는 http://www.robotstxt.org/wc/norobots.html(영어입니다).
사실 이걸 굳이 읽어 볼 필요는 없고, 그냥 원숭이처럼(...)따라하면 됩니다.

1. 메모장 등으로 robots.txt를 만듭니다. 내용은 다음과 같습니다.

#
# robots.txt for http://홈페이지
# by 주인장, 20070705
#

User-agent: *

Disallow: /카와이북 깔린 경로/


(맨 앞에 #가 있는 줄은 주석이으로 쓰지 않아도 상관 없습니다.)

2. 이 파일을 홈페이지 계정의 루트 디렉토리에 업로드합니다.

* robots.txt를 만드는 동시에 방명록 경로를 한 번 바꿔주는 것이 좋습니다.
2007/07/05 12:24 2007/07/05 12:24

게임의 법칙

사는 얘기/홈페이지 2007/03/30 22:32 ScrapHeap
알 사람은 아는 일이고 모르는 사람은 관심도 없을 일이지만 저는 홈페이지를 돌리고 있습니다. 물론 굳이 진실을 말하라고 하면 방치중이라는 말이 더 맞겠지요. 아무튼 요즘 좀 심하게 바쁘거든요.

그건 그렇고, 이 홈페이지에는 방명록이 하나 있습니다. 카와이북 3라고 하는 물건인데, 이제 와서는 나름대로 유물입니다. 알 분들은 다 아시겠지요. PHP같은 거 안 쓰는 CGI 프로그램으로서는 거의 최종형태였다고 생각합니다.
아무튼 이 카와이북을 열어놓고는 있는데, 이제 상당히 스팸 대응이 되고 있는 태터툴즈와는 달리 이 프로그램은 스팸 같은 것에는 완전 무방비상태입니다. 애초에 카와이북 나올 때는 그런 걱정은 할 일도 없었습니다. 요즘 세상엔 스팸의 편재遍在상태가 이루어졌으니 참 나름대로 격세지감이지요.

그래서 인기 좋을(스팸에게) 때는 하루에 200통(비공식 통계)씩은 스팸 글이 달리곤 했습니다. 하나 하나 지우는 것도 한계가 있지요(카와이북에는 일괄삭제기능 같은 것도 없습니다. 카와이툴이라는 플러그인이 나온 적 있다지만 저한테는 없군요:(). 로그파일을 열어서 주욱 지워버렸더니 어느 순간엔가 데이터가 꼬여버렸습니다. 방명록 번호가 이상해지더라고요. 지운 시점에서 새로 쓴 글은 1번부터 시작.

고민하다가 방명록 주소를 바꿔보았습니다. 놀랍게도 한 방에 먹히더군요. 한동안 스팸 없이 지낼 수 있었습니다. 결국 스팸은 검색엔진에 잡히는 페이지에 달라붙게 마련이고, 주소를 바꾸면 검색엔진 로그도 깨진 링크가 되고.. 그런 거죠.
물론 이게 영구적인 대책이 될 리도 없고, 한 몇 달 지나자 한 두개씩 스팸이 다시 달렸습니다. 그래도 그게 어디예요. 그냥 이름 다시 바꾸면 되지요. 이런 식으로 초단기적 대응(=닭대가리 모드)을 일삼던 세월이었습니다.

주소를 세 번째 바꿀 때가 왔는데, 이게 어떤 주소가 썼던 주소인지 기억이 안 나지 뭡니까. 대충 바꿔봤습니다. 이제 또 몇 주는 견디겠죠.

오산이었습니다.

주소를 바꾼 것이 어제 아니면 그저께, 오늘 들어와보니 반갑게도 120개정도의 스팸이 저를 맞이해 주고 있었습니다.
단순반복으로 스팸을 지우고 경로 재변경. 수업료치고는 조금 귀찮군요.

그리하여 도출된 게임의 법칙.

1. 스팸이 달리면 경로(주소)를 바꿔야 한다
2. 한 번 사용한 주소는 다시 사용할 수 없다
3. 이 게임에 끝은 없다

시간이 갈수록 안전지대는 줄어드는군요. 배틀로얄 같습니다(레슬러 아자씨들 나오는 거 말고, 48시간동안 애들이 서로 죽이는 쪽 말이지요). 괴롭네요.

조금은 더 머리를 써 봐야 겠습니다. 어떻게든.
당장 생각해 둔 게 있긴 합니다.
2007/03/30 22:32 2007/03/30 22:32