[hnsドキュメント]

ハイパー日記システム Version 2.10

ログ解析結果の見方


hns には標準で強力なログ解析プログラム(log.cgi) が付属しています.


log.cgi の設定

log.cgi v1.0.0(およびそれ以降) では,デフォルトでは解析結果を表示しません. これはプライバシ保護の観点からの変更です. log.cgi にアクセスすると自分の RURIコード が表示されますので, これを認証ファイル(~/diary/conf/auth_ruri.txt)に記載してください. auth_ruri.txt には RURIコード のみを1行に1つずつ記載します.

log.cgi はデフォルトではクッキーによる認証を行いますが、 ドメイン名/IPアドレスによる認証も可能です。log.cgi 自体の認証を off にして、http によるアクセス制御をすることも可能です。log.cgi への アクセス制限を全く行わないことは、読者のプライバシ保護の観点から 避けるべきです。

その他の設定は log.cgi本体の最初の部分で可能です.コメントを参考にしてください. ウェブ・サーバがアクセスしてきたクライアントの IPアドレスを逆引きしない場合, $DNSlookup = 0;$DNSlookup = 1; に 変更すると log.cgi が逆引きしてドメイン・ネームに変換してくれますが, 非常に時間がかかるかも知れません.


表示結果の意味

Scope:
解析したログの範囲(日時)です.タイム・ゾーンは省略しています. 複数のタイム・ゾーンがある場合は考慮されません.現在 log.cgi は 最近の 5000行 のログを解析対象とします.この行数はカスタマイズ可能です.
Net Visitor:
クッキー(= RURIコード)による訪問者数.同じクッキーの人が 2度来てもカウントされません.
Recent Log:
最近のログを表示します.基本的にログそのままですが,RURIコードの 名前変換は行われます.さらに BATTA のアクセスは表示されません.BATTA のアクセス情報を 知りたい場合は、log.cgi?BATTA と log.cgi に引数を渡して下さい。 表示行数はカスタマイズ可能です.ただし最終日の 訪問者数が増えた場合は,自動的に増加されます.
Recent New Visitor:
最近の新しい訪問者のログを表示します. 「新しい」の定義は,クッキーによる訪問回数が 1 である場合です. クッキーを off にしている場合は,表示されません. 表示行数はカスタマイズ可能です.ただし最終日の 訪問者数が増えた場合は,自動的に増加されます.
Daily Access:
日別の訪問者数とヒット数(= ページ・ビュー)です.訪問者数は クッキーにより計算されています.BATTA はカウントされません。 右のグラフはヒット数のグラフです.
Recent Referer:
最近のリンク元を表示.上が最近です. 表示行数はカスタマイズ可能です.ただし最終日の 訪問者数が増えた場合は,自動的に増加されます.なお この情報は一部のブラウザ(古い Netscape や IE など)が 正しいリンク元を送らない場合がありますので,誤った情報が 含まれる場合があります.
Link to:
どのセクションを指定してアクセスがあったかがわかる場合の リンク元をリンクされている日付順にソートして表示します. 相手の日記のどのセクションから リンクが張られているかまではまだわかりません.
Recent Search Engine:
最近のアクセスのリンク元情報から、サーチ・エンジンのキーワードを 解析して表示します。サーチ・エンジンで検索して日記に訪問した 読者の検索キーワードがわかります。
Referer:
リンク元をアクセス(ヒット数)が多いものから順に表示します. 表示行数はカスタマイズ可能です.
Browser Summary:
訪問者のブラウザの要約です.基本的にメジャー・バージョンごとに 集計しています.まれに ブラウザ名/バージョン というエージェント名 を渡さないブラウザがあり,ただしく集計できないことがあります. Microsoft Internet Explorer は MSIE と,Netscape Communicator は Mozilla と表示されます. 左の数字は,ヒット数です.
Browser:
訪問者のブラウザの集計です.ヒット数の多いものから表示します. 表示行数はカスタマイズ可能です. 左の数字は,ヒット数です.
Visitor:
訪問者情報です.ヒット数が多い順に表示します. 訪問者はクッキーにより識別された情報です.
ヒット数 その% RURIコード - 最終訪問日時 - ホスト名 - ブラウザ名
が表示されます.RURIコードは,変換ファイルに記述されていれば, 名前に変換されます. 当然ながらクッキーを off にしてる場合は,この情報は得られません.
OS Share:
ブラウザ情報から得られた訪問者の利用OS を集計しています. 不明なものは,Unknown と表示されます. 右側の%表示は,Unknown を除外した割合です.
File:
要求されたファイルの集計です.ヒット数の多いものから表示します. 表示行数はカスタマイズ可能です. 左の数字は,ヒット数です.

用語解説

RURIコード と BATTA
RURIコードとは,訪問者を識別するクッキーによる ID です. 必ず RURI で始まるため,こう呼ばれています. ただしクッキーを理解しないWWWロボットなどは,RURIコードは 発行されず BATTA と記録されます. クッキーを off に設定した場合は,絶えず NONE と記録されます.
BATTA の判定は以下のようになっています(hns-2.10-beta8 以降)。送られて来るエージェント名を記録し、 conf/robotlist.txt を調べマッチ(部分一致)すれば BATTA と 判定されます。 conf/browser_list.txt を調べマッチ(前方一致)すれば BATTA でないと判定されます(RURIコードが発行されます)。それ以外は、BATTA と判定されます。
RURIコード名前変換ファイル
RURIコードは,ハイパー日記システムが機械的に発行する コードであり人間にはわかりにくいものとなっています. このRURIコードを人間がわかるように変換するための変換情報を 記載したファイルが「RURIコード名前変換ファイル」ruri_map.txt です. ファイル・フォーマットは,
RURIコード[スペース]名前
となります.名前に 2バイト文字を使う場合は,EUC で記述してください.
DNSキャッシュ・ファイル
ウェブ・サーバがクライアントの IPアドレスを逆引きしていない場合, ログには, IPアドレスが記録されます.IPアドレスのままだと,クライアントの 組織名がわからず不便ですので,ログ解析プログラムには,これを 逆引きしてドメイン名に変換して表示する機能が実装されています. ただし,DNS逆引きは非常に時間がかかるため,一度逆引きした情報を キャッシュしておくファイルが「DNSキャッシュ・ファイル」dns_cache です. ファイル・フォーマットは
IPアドレス[スペース]ドメイン・ネーム[スペース]消去時刻
となります.消去時刻は Epoch からの秒数で表現されます.

ハイパー日記システムのログ・フォーマット
[年/月/日:時:分:秒 TZ] host RURIコード 訪問回数 "file" "referer" "agent"
TZ ... タイム・ゾーン
host ... ホスト名
file ... アクセス・ファイル名
referer ... リンク元URL
agent ... ブラウザ情報

注) クッキーを off にしている場合は,絶えず RURIコードは NONE,  訪問回数は 0 が記録されます.

ハイパー日記システム Version 2.10


Index