2005-05-18 カウンターログのCSV リンク元の文字列は、基本は元の文字はEUC-JPで、それをURLエンコードしてある。違う場合があるので単機能のURLデコーダかますわけにはいかないみたいだ。 サーチエンジンから来た場合、文字コードの指定+該当形式の文字をURLエンコードした文字列が来ている模様。 google,ie=UTF-8, oe=UTF-8 と…(SJIS、Shift_JISの場合あり)。iがIN、oがOUTと考えるとieが該当物かな。どっちも同じのしかみかけない……一個見つけたie=UTF-8&oe=SJIS、中身はUTF-8だった。ieが正解。[追記]ie=が無い場合UTF-8。 MSNはcp=932とか言うパラメータで来ている。[追記]cp=932で無い場合もあり、その場合UTF-8 他にも意表を突いた攻撃(攻撃?)が有るかも。 URLデコードできない壊れたデータもある模様。カウンター画面でも化けていたのでしょうがないが。