2004.01.20

迷4.5

(`・ω・´) : 6日目にしていよいよ本領発揮か?より。

定例の交換日記ですが、こっちは2日くらい空けちゃたような気が。

迷惑メールフォルダ4.5日経過後の様子ですが、通算成績は135/178=認識率75.8%でした。ただし、前回からの差分は56/67=83.6%でなかなか良い感じです。しかも今日に至っては31通連続認識成功、という好成績をあげており、ついに開眼した様子。これならかなり使えるなぁという印象です。しかも、今までspamでないものをspamとした誤認識は一通もありませんでした。もしかして、この誤認識がないように@niftyのデフォルトはゆるめに調整されていたのかも。

| | コメント (0) | トラックバック (2)

2004.01.18

ちょっと育った。

(`・ω・´) : 迷惑4日目(一気に省略)によると、認識率下がっちゃったようだが、こっちは通算成績79/111 (認識率71%)、おとといからの差分で考えると51/70(認識率72%)で、前回の68%からはちょっとずつ成績が良くなったようだ。

やっぱり、"qjkjzkj" みたいな言語として成り立っていない単語が入っているメールには弱いが、それでもたまに認識されていたりする。(http://という言葉も学習しているのだろうか)。でも、こんなランダムに作られた単語をどんどん学習していくと単語DBがあふれそうな気がするが大丈夫かなぁ。

あと、私は送信元の学習は一切していない。理由としては「送信者名はほとんどテキトー」につけられていて、同じfromで送ってくるやつはほとんどいないからだ。なので、これは自分にしつこくメールを送ってくる人がいたときなんかに使うのかな、と思ったり。ただ、毎回チェックを外す作業はちょっと面倒かも。

それにしても、3日で114通メールが届いたが、そのうち111通がspamメールという現状はどう見ても問題だろう。証明書なんかを使ってfromを細工できないような仕組みを備えた次世代のSMTPとかIETFあたりで策定していたりしないのかなー。

| | コメント (0) | トラックバック (2)

2004.01.17

glucose使用中

というわけでglucoseによる投稿

そんなわけで私もglucoseを使ってみました。
最初何度やっても自分のWeblogの設定をしようとすると固まっちゃうのでおかしいなー、と思っていたらパスワードが間違っていました。(だめじゃん)

各Weblogが階層化されて表示されるし、いわゆる他のblogにリンクを張ったエントリーを作成することが簡単にできますが、TrackBackができません。
あと、Categoryが"*****"になるのがちょっと残念です。(それともソフトはOKでniftyの方がおかしかったりするのかしらん。調べてみよう)

というわけで、自分でもXML-RPC経由で投稿できるソフトを作ってみたくなりました。
このソフトレベルまでになるのは時間がかかりそうですが。

| | コメント (3) | トラックバック (0)

spamその後

迷惑フォルダを設定してから、spamメールが到着するのが待ち遠しくてたまらなくなってしまった。
いやー、人間変わるもんだなー。

で、設定24時間で41通のspamメール中、迷惑として認識されたのが28通。認識率68%だ。

気になったのが、22時間くらい経過したところでは(`・ω・´)さんの迷惑メールフォルダー3日目と全く同じ39通中26通認識、という状態であったことだ。もしかするとspam業者は同じようなメールIDリストを持っていて、そのリストに対して同じメールを送っているのかも知れない。

私としてはspamメールを認識できるだけでもびっくりなので、68%という数字は満足だ。
それに、これくらいから始まる方が段々高くなっていく楽しみもあるし。

| | コメント (0) | トラックバック (1)

2004.01.16

わくわく

メールをすべてpopで読みきったので、アットニフティ会員に種別を変更してみた。
どれだけの認識率か楽しみだ。でも (`・ω・´) さんの「迷惑メールフォルダー2日目」によると5割くらいみたい。(´・ω・`)ショボーン

それにしても、WebMailってインターウェイよりも随分レスポンスがよくて、使ってて気持ちがいい。(あ、リンクはniftyの人にしか意味がないです)
でも、もっと前からこっちにしとけばよかったとも思ったり。

と思ったら、早速spamが受信箱の方に入ってきた。(´・ω・`)
でも、なんとなく育てる楽しみができたような。

| | コメント (0) | トラックバック (1)

2004.01.15

ベイズってみたい年頃

(`・ω・´) : 早速「迷惑メールフォルダー」ってやつ使ってみるから

ついに@niftyもspamメール振り分けサービス「迷惑メールフォルダー」を開始したらしい。私の@niftyのメールボックスはspamだらけで、今は受信拒否するドメインが58個も登録してある。しかもほとんど.fiとか.dkのようなトップレベルドメインだ。なので、今見知らぬ外国人からメールが届かない状態になってしまっている。それはちょっとつまんないかもしれない。いや、バイアグラなんて通信販売で買ったりしないからそんなメールは送ってこなくていいんですが。

で、(`・ω・´)さんの情報によるとメールボックスの設定が旧ニフティサーブなので、@niftyに移行する必要があるようだ。しかし、このタイプのメールボックスって@niftyserve.or.jp宛のメールも届くんだろうか。なんか微妙だ。
というわけで、@niftyserve.or.jp時代に購読していたニュースレターなんかを購読解除を行ってみた。

そしたら、今日はもう力尽きてしまった。眠い。

明日には設定完了できるだろうか。

P.S.
ベイズ推定についてはここら辺が詳しいが、どうやってこの理論を実装するとspamが見分けられるのかは全然わからない。

| | コメント (0) | トラックバック (0)

2003.12.19

「JavaScriptの技」

とりあえず、+3RM+さんのBlogの記事「真面目な文をおもしろく!?」をみてください。お奨めサイトの選択も最高で、可笑しくて腹抱えて笑ってしまった。
また、社内のイントラネットの各種ページでも試してみたが、画面をみるたびに吹き出してしまいしばらく仕事にならなかった。(い、いやほんの2,3分だってば)

はじめこのタイトルだけを見たときは電波ニュースのようにサーバーで行うものなのかと思ったが、クライアント側だけでこんなことができるものなのかと思って感心してしまった。

(ちなみに、この画面で試すにはここをクリック)

しかしこんなことができるのならば、例えばいわゆる「隠しリンク」があるページもなんかもそのページを表示した後に、

javascript:c="";for(i=0;i<document.links.length;i++)c+="link"+i+":<a href='"+document.links[i]+"'>"+document.links[i]+"</a><br>";document.body.innerHTML+=c;focus(0);

をアドレスバーに入力するとすべてのリンクが文書の一番下に出てきて一目瞭然だ。他にも文字を大きくしたり、背景色を変えたり、バントのサインを見逃してみたりと色々な応用ができそうな技だ。

| | コメント (0) | トラックバック (1)

2003.12.17

国際化ドメイン

./をみていたら、.comと.netでも国際化ドメインが使えるようになった、という記事があった。
国際化ドメインが使用可能、というのは簡単にいうと http://ココログ.net/ のように、アルファベット・数字以外の文字がドメイン名に使用できるようになったというコト。
実際にはアルファベット・数字以外の文字は裏でPunycodeというコード体系でアルファベットに直されるので、サーバー側のソフトウェアは特に国際化ドメイン対応のものにする必要はない。(WebブラウザはPunycode対応のものが必要)

さて、このPunycodeの仕様はRFC 3492というインターネットの国際標準文書で規定されているのだが、この文書の途中で国際化ドメインの例として引用されている例がなぜか日本語に偏っていて面白い。

[以下、RFC 3492 Page 15より引用]


  • 3年B組金八先生
    ・・・のっけからこれである。

  • 安室奈美恵-with-SUPER-MONKEYS
    MAXって知ってるのかなー。

  • Hello-Another-Way-それぞれの場所
    ブリグリまで知ってるの?

  • 一つ屋根の下2
    ・・・なぜ2?

    以下、

  • MajiでKoiする5秒前

  • パフィーdeルンバ

  • そのスピードで


[引用終了]

といった具合である。
この文書をまとめたのはカリフォルニア大学バークレー校の大学院生のCostelloさんという人のようだが、この人のホームページを色々と見ていると日本びいきということがわかる。

この文書はインターネットの標準として後生まで継承されていくものだが、2,30年後の人がこの文書を見たときに、"MajiでKoiする5秒前"がどんなものか知ったらびっくりするだろーなー。

| | コメント (4) | トラックバック (0)