These pages are written by only Japanese.

Welcom to My Diary.com
最新の日記タイトル一覧カテゴリ別タイトル一覧トップへ戻る〜

こんにちは♪ 現在は3月29日(金)14時4分。 お昼を食べると眠くなる時間です。


hns - 日記自動生成システム - Version 2.19.5 (色々 Fixed)

先月 2010年06月 来月
1 2 3 4 5
06 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
Namazu for hns による簡易全文検索です。
詳細は 詳細指定/ヘルプをご参照下さい。
検索式:

2010年06月14日(月)

線形予測ツール

ログを処理してて、あとどの位で終わるのか推測するのに、 場当たりで作ったツールが結構便利なので晒してみます。

使い方:

例えば、
ls -l
-rw-r--r-- 1 yoya develop  415302180 Jun 14 22:58 result.list
ls -l
-rw-r--r-- 1 yoya develop  450796757 Jun 14 23:07 result.list
みたいに膨らむログデータがあって、
最終的に 1036113524 bytes になる予定だと、 みたいに入力フォームを埋めれば、
2010-06-15 01:35:24
といった終了予定時刻が表示されます。

計算式:

$t3 = $t1 + ($n3 - $n1) / ($n2 - $n1) * ($t2 - $t1);
ただの線形補完です。

問題点:

線形予測なので、増える量が一定だと仮定出来ないと使えません。
元々、某サイトで、ユーザ数があと何時間で1000万人超えるのかを 推測するのにでっち上げたツールですが、大外れしました。
ユーザの登録数は時間帯で全く異なる上に、波も激しいので、 せめて二次か三次で補完しないとダメっぽいです。 それでさえも怪しいですけど。

XSS ?:

というツッコミが来そうなので、対応版。 自分で入力して自分で見る分には、 あまり神経質に考える必要もないと思いますが。一応。
awm.jp のドメインに攻撃スクリプトを載せられるのが嫌。 という気分になった時に備えて…

2010年06月16日(水)

順不同のデータから差分を抽出

必要に駆られて、 順不同で並んでいるデータの差分を抽出するツールを作ってみた。
初めは、diff を使おうとしたけど、 順不同で並んでいる1千万規模のデータのうち数百の違いを見つけるのに、 適切なオプションが分からなかったので。

使い方:

こんなデータがあるとして、
% cat 1.list
2
1
3
% cat 2.list
4
2
3
% cat 3.list
3
4
5
こんな結果が出ます。
% php diff_list.php 1.list 2.list 3.list
2 1.list 2.list
4 2.list 3.list
1 1.list
5 3.list

これで、2 日分だよ〜。

タイトル一覧
カテゴリ分類
Database
JXTA
Java
XML
awm
bookmark
keyword
memo
news
research
Powered by hns-2.19.5, HyperNikkiSystem Project