Hatebu Favorite Rank

良質なアウトバウンドリンクを持つユーザトップ20

減衰係数d * ランクがリンクを経由して流出するランクの合計になるので、これをお気に入り数で割れば、1お気に入り当たりが担うランク流量となる。リンクの品質*1を定量的に表す一つの方法となるだろう。 ということで早速ランキング。ちなみにSQLはこんな感…

お気に入り数とお気に入られ数の分布

横軸は順位。べき乗分布と言えばそうなのかもしれないがよくわからない。両対数とったら直線っぽくなるもんかも? お気に入られ数は1の位まで割とばらけているけど、お気に入り数は20件ぐらいから減りだしている。使う人は使うということかな。 考えたら ブ…

d=0.90での結果

人数:8709 リンク数:25074 d=0.90で実施 no | hatena_id | favorite_rank - 1 | xxxxx | 40.3725 2 | xxxxxxxxxxx | 26.7432 3 | xxxxxx | 20.1405 4 | xxxxxxxx | 19.134 5 | xxxxxx | 13.8747 6 | xxxx-xx | 11.7519 7 | xxxxxxxxx | 11.6585 8 | xxxxxx |…

減衰係数のさじ加減について

減衰係数(ランダムジャンプしない確率)を少し高めてやれば、お気に入られ数順とは少し違った結果になってくるようだ。減衰係数を減らせば減らすほどランクの残留量が減ってリンクの価値が平均化するのだから当然と言えば当然かも。あんまり増やすと「上位者…

はてブのお気に入り情報に基づくRank計算

まだ8317ユーザ分のデータしか無いのですが、とりあえず計算してみた。 べき乗の繰り返し回数が200回、減衰係数が0.85で計算したよ。 この辺を参照:http://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html http://www.sem-r.com/sem/google/2003090900…

統計データ用テーブル作成

create table hatebu_statistics ( user_id integer primary key, favoring_count integer, favored_count integer, favorite_rank real ); -- お気に入られIDの方にもインデックス create index hatebu_favorite_dest_id_idx on hatebu_favorite (dest_id);…