2017.05 «  - - - - 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 - » 2017.07
TOP > 【Rubyでアクセス解析 その4】apacheログファイルを読み込む

 ← 【Rubyでアクセス解析 その5】キーワードを抽出する | TOP | 【Rubyでアクセス解析 その3】機能を絞る

スポンサーサイト 

--年--月--日 (--)
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。


【広告】

[--.--.--(--) --:--] スポンサー広告 | Trackback(-) | Comment(-)
↑TOPへ

【Rubyでアクセス解析 その4】apacheログファイルを読み込む 

2010年11月04日 ()
やるっきゃないと土井先生のように宣言したからには、何かしら成果を残そうと思いました。

apacheログファイルを読み込むところまでは、なんとか形にしてみました。

色んな課題が途中で入ってきて大変でしたけどね。

例えば
・apacheログの標準の日時フィールドは[と]で囲まれているから、パースするのが大変
→[と]をダブルクォーテーションに置換して対処
・apacheログの標準の日時フィールドの文字がParseDate::parsedateでは解釈できない
→解釈できるように日時フィールドの値を置換して対処
・apacheログの標準フォーマットではユーザをユニークに判別するフィールドはユーザーエージェントぐらいしかない
→これはしょうがない

そして以下のような課題がまだまだ残ってます!

・keyword取得
・UserIDがuser-agentになっているが、apache提供のユニークIDフィールドや、ユーザのIPアドレスも加味した形でUserIDを振りたい
・apacheログの要素の場所が固定
・アウトプットがまだ



今の段階のソースコードを参照したい方は以下のコマンドでどうぞ

git clone http://github.com/rorkaido/farfalle.git
cd farfalle/
git checkout v0.2



もー、簡単な指標しか出さないのに意外と壁は厚い・・・次回もがんばろう!(たぶん3ヶ月後・・・ってか?)

【広告】

[2010.11.04(Thu) 00:20] Rubyでアクセス解析Trackback(0) | Comments(0)
↑TOPへ

 ← 【Rubyでアクセス解析 その5】キーワードを抽出する | TOP | 【Rubyでアクセス解析 その3】機能を絞る

COMMENT

COMMENT POST















管理者にだけ表示

 ← 【Rubyでアクセス解析 その5】キーワードを抽出する | TOP | 【Rubyでアクセス解析 その3】機能を絞る
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。