Apache のアクセスログを combined 形式で取った場合には、 どのような検索語句によってページに辿り着いたかという情報が ログファイルに残ります。 しかし、日本語のコードの問題で、通常ではうまく読めません。 そこで、日本語コード変換 Ruby プログラム goo.rb を使います。 goo.rb は九大の西さんが作られたそうです。
どこからか、goo-0.2.rb もしくは goo.rb (もしくは Perl 版の goo.pl)を拾って来ます。 配布サイトは、だそうなのですが、今接続できません(泣)。 とりあえず、 http://www.namaraii.com/diary.old/200209.html に発見です。
- Ruby 版 : http://ruby.freak.ne.jp/goo/goo1.rb
- Perl 版 : http://ruby.freak.ne.jp/goo/goo1.pl
拾って来たら、1行目の ruby のパスを確かめて、 実行権を与えておきます。
% chmod +x goo.rb
goo.rb は uconv というものを使います。 FreeBSD では、ports の japanese/ruby-ucov でインストールできます。
ログファイルを goo.rb に食わせるだけです。 ログファイルを access_log とすると、これで、検索語句の日本語が読めるようになります。
% ./goo.rb < access_log