ハイパー日記システム Version 2.00
ログ解析結果の見方
hns には標準でログ解析プログラム(log.cgi)
が付属しています.
log.cgi の設定
log.cgi v1.0.0(およびそれ以降)
では,デフォルトでは解析結果を表示しません.
これはプライバシ保護の観点からの変更です. log.cgi
にアクセスすると自分の
RURIコード が表示されますので,
これを認証ファイル(~/diary/conf/auth_ruri.txt)に記載してください.
auth_ruri.txt には RURIコード
のみを1行に1つずつ記載します.
その他の設定は
log.cgi本体の最初の部分で可能です.コメントを参考にしてください.
ウェブ・サーバがアクセスしてきたクライアントの
IPアドレスを逆引きしない場合, $DNSlookup =
0;
を $DNSlookup = 1;
に
変更すると log.cgi
が逆引きしてドメイン・ネームに変換してくれますが,
非常に時間がかかるかも知れません.
表示結果の意味
- Scope:
-
解析したログの範囲(日時)です.タイム・ゾーンは省略しています.
複数のタイム・ゾーンがある場合は考慮されません.現在
log.cgi は 最近の 5000行
のログを解析対象とします.この行数はカスタマイズ可能です.
- Net Visitor:
- クッキー(=
RURIコード)による訪問者数.同じクッキーの人が
2度来てもカウントされません.
- Recent Log:
-
最近のログを表示します.基本的にログそのままですが,RURIコードの
名前変換は行われます.さらに
BATTA のアクセスは表示されません.
表示行数はカスタマイズ可能です.ただし最終日の
訪問者数が増えた場合は,自動的に増加されます.
- Recent New Visitor:
- 最近の新しい訪問者のログを表示します.
「新しい」の定義は,クッキーによる訪問回数が 1
である場合です. クッキーを off
にしている場合は,表示されません.
表示行数はカスタマイズ可能です.ただし最終日の
訪問者数が増えた場合は,自動的に増加されます.
- Daily Access:
- 日別の訪問者数とヒット数(=
ページ・ビュー)です.訪問者数は
クッキーにより計算されています.BATTA
はすべてまとめて 1 と カウントされます.
右のグラフはヒット数のグラフです.
- Recent Referer:
- 最近のリンク元を表示.上が最近です.
表示行数はカスタマイズ可能です.ただし最終日の
訪問者数が増えた場合は,自動的に増加されます.なお
この情報は一部のブラウザ(古い Netscape や
IE など)が
正しいリンク元を送らない場合がありますので,誤った情報が
含まれる場合があります.
- Link to:
-
どのセクションを指定してアクセスがあったかがわかる場合の
リンク元をリンクされている日付順にソートして表示します.
相手の日記のどのセクションから
リンクが張られているかまではまだわかりません.
- Referer:
-
リンク元をアクセス(ヒット数)が多いものから順に表示します.
表示行数はカスタマイズ可能です.
- Browser Summary:
-
訪問者のブラウザの要約です.基本的にメジャー・バージョンごとに
集計しています.まれに
ブラウザ名/バージョン というエージェント名
を渡さないブラウザがあり,ただしく集計できないことがあります.
Microsoft Internet Explorer は MSIE と,Netscape
Communicator は Mozilla と表示されます.
左の数字は,ヒット数です.
- Browser:
-
訪問者のブラウザの集計です.ヒット数の多いものから表示します.
表示行数はカスタマイズ可能です.
左の数字は,ヒット数です.
- Visitor:
- 訪問者情報です.ヒット数が多い順に表示します.
訪問者はクッキーにより識別された情報です.
ヒット数 その% RURIコード -
最終訪問日時 - ホスト名 - ブラウザ名
が表示されます.RURIコードは,変換ファイルに記述されていれば,
名前に変換されます. 当然ながらクッキーを off
にしてる場合は,この情報は得られません.
- OS Share:
- ブラウザ情報から得られた訪問者の利用OS
を集計しています. 不明なものは,Unknown
と表示されます. 右側の%表示は,Unknown
を除外した割合です.
- File:
-
要求されたファイルの集計です.ヒット数の多いものから表示します.
表示行数はカスタマイズ可能です.
左の数字は,ヒット数です.
用語解説
- RURIコード
と BATTA
- RURIコードとは,訪問者を識別するクッキーによる ID
です. 必ず RURI
で始まるため,こう呼ばれています.
ただしクッキーを理解しないWWWロボットなどは,RURIコードは
発行されず BATTA
と記録されます.hns-2.00以降は,agent名を
送ってこないブラウザなどは BATTA
と見なされるようになりました.
RURIコードを発行しないエージェント名は,robotlist.txt
ファイルで カスタマイズ可能です.
クッキーを off に設定した場合は,絶えず NONE
と記録されます.
- RURIコード名前変換ファイル
-
RURIコードは,ハイパー日記システムが機械的に発行する
コードであり人間にはわかりにくいものとなっています.
このRURIコードを人間がわかるように変換するための変換情報を
記載したファイルが「RURIコード名前変換ファイル」ruri_map.txt
です. ファイル・フォーマットは,
RURIコード[スペース]名前
となります.名前に 2バイト文字を使う場合は,EUC
で記述してください.
- DNSキャッシュ・ファイル
-
ウェブ・サーバがクライアントの逆引きをしていない場合,ログには,
IPアドレスが記録されます.IPアドレスのままだと,クライアントの
組織名がわからず不便ですので,ログ解析プログラムには,これを
逆引きしてドメイン・ネームに変換して表示する機能が実装されています.
ただし,DNS逆引きは非常に時間がかかるため,一度逆引きした情報を
キャッシュしておくファイルが「DNSキャッシュ・ファイル」dns_cache
です. ファイル・フォーマットは
IPアドレス[スペース]ドメイン・ネーム[スペース]消去時刻
となります.消去時刻は Epoch
からの秒数で表現されます.
-
ハイパー日記システムのログ・フォーマット
- [年/月/日:時:分:秒
タイム・ゾーン] ホスト名 RURIコード
訪問回数 "アクセス・ファイル名"
"リンク元URL" "ブラウザ情報"
注) クッキーを off
にしている場合は,絶えず RURIコードは NONE,
訪問回数は 0 が記録されます.
ハイパー日記システム Version 2.00
Index