カウンターログのCSV

  • リンク元の文字列は、基本は元の文字はEUC-JPで、それをURLエンコードしてある。違う場合があるので単機能のURLデコーダかますわけにはいかないみたいだ。
  • サーチエンジンから来た場合、文字コードの指定+該当形式の文字をURLエンコードした文字列が来ている模様。
    • google,ie=UTF-8, oe=UTF-8 と…(SJISShift_JISの場合あり)。iがIN、oがOUTと考えるとieが該当物かな。どっちも同じのしかみかけない……一個見つけたie=UTF-8&oe=SJIS、中身はUTF-8だった。ieが正解。[追記]ie=が無い場合UTF-8
    • MSNはcp=932とか言うパラメータで来ている。[追記]cp=932で無い場合もあり、その場合UTF-8
    • 他にも意表を突いた攻撃(攻撃?)が有るかも。
  • URLデコードできない壊れたデータもある模様。カウンター画面でも化けていたのでしょうがないが。