JavaBlack で紹介されている書籍の統計

昨日は 変なネタ記事 を投稿してしまいましたが、本当にやりたかった事はこちら。

カレーなる辛口Javaな加齢日記 のブログは何度か話題(炎上?)になった時に見ていたので知っていたのですが、このブログを見たときに「紹介されているもの自体は良書が多い、と言う事は確かなので、いつかこのブログの全記事で紹介されている書籍の統計を取ってみたいな」と言う事をずっと思っていました。毎回、やろうと思いつつ忘れてしまっていたので、今度こそ実行してみました。

概要

  • カレーなる辛口Javaな加齢日記 の記事中に存在する a タグの href 属性からアマゾンの ASIN と思われるものを抽出し、リンク数の多い順でランキングします。サイドバー等のリンクによる重複を防ぐために、抽出する a タグの対象は div.section の中に限定しています。
  • 画像が貼られている場合、画像のリンクとタイトルのリンクで二重にカウントされているようです。ほとんどの紹介については画像付きのようなので、紹介数の目安としてはリンク数の半分と考えると良さそうです。
  • 対象期間は 2005/03/15 〜 2013/03/24 の全記事です。
  • 取得できた ASIN は全部で 1187 種類、最もリンク数の多い書籍は 内側から見た富士通「成果主義」の崩壊リンク数 60 でした。
  • その他、目安となる数字としては……リンク数 10 以上のものは 57 種類、同 5 以上のものは 136 種類、同 3 以上*1 のものは 294 種類、あたりでしょうか。
  • 解析結果の全データ(ASIN とリンク数のみ)は javablack.csv から、リンク数 10 以上のアマゾン商品に関する詳細は javablack.json から取得できます。

ランキング

リンク数 10 以上だった 57 冊について列挙しています(生データは、javablack.json)。

*1:少なくとも 2 回紹介されていると思われる商品