「あわせて読みたい」の仕組みがわからないわけだが

サイトフィード社提供の「あわせて読みたい | 読者が読んでいる話題の記事をオススメ」をサイドバーにつけているけれど、その仕組みって、一体どうなっているんだろうか。

あわせて読みたい」の公式説明

あわせて読みたい」とは、あなたのブログ読者が「よく読んでいる」ブログを知ることができる無料サービスです。

あわせて読みたい」では、AMN(あわせて読みたいネットワーク = 「あわせて読みたい」)参加ブロガーの中から、直近約24時間で共通の読者率が高いサイトを、独自の計算により算出した順位で表示しています。

なお、順位付けのアルゴリズムは秘密ですが、基本的には共通の読者率が高い(相関性の高い)サイトが紹介されます。(※ Cookie は使っていません)

http://awasete.com/indexabout.phtml

現在約4万ブログを解析しているブログ人気度測定サービス「フィードメーター」と連携することで、どのようなブログでも「あわせて読まれている」ブログが表示される仕組みになっています。

あわせて読みたい」で表示される他のブログは「フィードメーター」または「あわせて読みたい」のいずれかのブログパーツを貼っているブログとなります。

あわせて読みたい」では、ブログの読者情報を短時間で連続的に解析することで、リアルタイムで正確な情報の表示を可能にしています。

読者がどんなブログを読んでいるのか知ることができるサービス「あわせて読みたい」を開始 | サイドフィード株式会社


どうやって「共通の読者」を知っているのか、上記の説明からは判然としない。というか、非公開ということなのか。「順位付けのアルゴリズムは秘密」と一応言っているが、私が知りたいのは「順位付けされる要素であるところの、共通の読者が多いブログ」であるから、これは関係ないと思う。


『「フィードメーター」と連携することで、どのようなブログでも「あわせて読まれている」ブログが表示される』とのことなので、次は「フィードメーター -ブログの人気度と更新頻度を測定する無料サービス」について見てみる。

「フィードメーター」の公式説明

RSSフィードの「人気度」と「更新頻度」をシンプルに段階表示できたら便利、と思って作ったのが、この feed meter です。

☆[引用者注:人気度のこと]のランキングは、RSS フィードの購読者数と、他の RSS フィードからそのサイトに張られているリンクの数とで計算されています。
計算方法は秘密ですが、「たくさんの人に読まれている」「あちこちの ニュースで話題になっている」と、人気度が上がります(RSS フィードの人気度情報を提供してくださるブラウザ型リーダーや無料ブログスペース企業の皆様を歓迎します)。

RSS フィードメーター - feed meter について


だからどうやって「たくさんの人に読まれている」のか(=人気度)を知っているのかと。謎が増えてしまった。「RSS フィードの人気度情報を提供してくださるブラウザ型リーダーや無料ブログスペース企業の皆様を歓迎します」という部分に謎を解く鍵があるのか? つまり、ブログサービスプロバイダやオンラインRSSリーダプロバイダが、IPアドレスに紐付けされた行動履歴(ブログ閲覧履歴や同時に購読しているRSS)を、サイトフィード社に提供しているとか?

ソーシャルレコメンデーションサービスの明日はどっちだ?

上の節題は煽りなので気にしないように。


ウェブでのユーザの活動履歴をもとにサービスを提供する、いわゆる「レコメンデーション」系のサービスが最近増加している。自分がウェブで何をしているのかを知られるというのは、絶対嫌だというわけではないが、それを「どうやって知って」、「どのように使って」いるのかというのは、どうしても気になってしまう。この記事を書いたのもそういう理由から。そういったサービスの是非はともかく、とりあえずその在り方を「知りたい」という人は、私に限らずいるのではないかと思う。


ここまで書いておいてあれだが、どこかで「あわせて読みたい」の仕組みについて既に書かれていたら、この記事はあの世行きだな。それはともかく、もし既に書かれていることをお知りの方は、ぜひ御教えください。

追記(2008-05-14): 仕組みがわかったような気がする

固定化するIPアドレス、そしてブログパーツとプライバシー : Kazuho Oku's Weblog (跡地)」を発見。

同社の説明によると、「あわせて読みたい」は、様々なブログへのアクセスをブログパーツを用いてサイト横断的に集計することで、オススメのブログを抽出しているらしい。技術的にはどうやってるのかな、と思って HTTP ヘッダを見てみたんだけど、クッキーを使ってるのではないっぽい。ということは、IP アドレスベースのトラッキングなんだろう。

固定化するIPアドレス、そしてブログパーツとプライバシー : Kazuho Oku's Weblog (跡地)


上記記事を読んで、なんでこんな簡単なことに気づかなかったんだ、と頭をかかえた。私が解釈したところの上の記事の想像では、「あわせて読みたい」の仕組みは以下のようになる。

  1. IPアドレスxのユーザが「あわせて読みたい」のブログパーツをつけたブログ1にアクセス → awasete.comにも当然アクセス → awasete.comはリファラから「IPアドレスxがブログ1にアクセス」というデータを入手
  2. IPアドレスxのユーザが「あわせて読みたい」のブログパーツをつけたブログ2にアクセス → awasete.comにも当然アクセス → awasete.comはリファラから「IPアドレスxがブログ2にアクセス」というデータを入手
  3. awasete.comは「ブログ1とブログ2には共通の読者xがいる」というデータを入手
  4. 適当な順位付けアルゴリズムによって、1-3によって得られた「共通の読者」データを順位付け、各ブログのブログパーツに表示


本当にこのようにやっているのかどうかは、当然わからない。しかし、「共通の読者」データをIPトラッキングによって得ることは技術的に可能である、ということは分かったので、すっきりした気分になった。一方、「ウェブでのユーザの活動履歴」は思ったより容易に得られるんだな、ということに気づいたため、すっきりしない気分にもなってしまった。