本しゃぶり

骨しゃぶりの本と何かを繋げるブログ

はてなブックマーク経由PV黄金時代とFACTFULNESS

質問 はてなブックマーク経由のPV/ブクマ数の比率は、3年前と比べてどうなっているでしょう?

A 減少している
B 変わらない
C 増加している

3年前はすごかった説

この記事に気になることが書いてあった。

それでも3年前なら150ブクマもついてたらさすがに5000pv~10000pvくらいは「はてブからだけで」流入があったりしたものです。
ところが、昨日書いた記事、内容の是非はともかくとして、はてなブックマークが150以上ついているのも関わらず、はてブ経由でのPVはわずか2000でした。

ブコメを見ても人が減っていることについて同意が多く、限界集落はてな村だから仕方ないといった雰囲気である。かつてあった、はてな黄金時代と比べて見る影もない、と。

黄金時代には、人間は神々と共に住み生きていた。「世の中」は調和と平和に満ち溢れて、争いも犯罪もなかった。あらゆるコンテンツが自動的に生成され、手斧の存在はなかった。記事は、互助ではない個人ブログが多く、確かに読まれていった。

f:id:honeshabri:20210509173907j:plain
János Vaszary, Public domain, via Wikimedia Commons, Link

本当に?

そんなヘシオドスが唄ったような時代が、はてなブックマークに存在しただろうか。俺の中のハンス・ロスリングが警報を鳴らしている。これは「ネガティブ本能」であり、思い込みの要素が大きいのではないのか、と。3年前なら150ブクマあれば、はてブ経由で5,000pv~10,000pvもあるのが当たり前だったというのは本当か。

そこでファクトフルネスを実践することにした。

確認方法

対象は当然このブログ「本しゃぶり」である。俺が使えるデータ元はこれしかないので。

はてなブックマーク経由のPVはGoogle アナリティクスで確認した。 「集客」→「ソーシャル」→「参照元ソーシャル ネットワーク」を選択すると、「Hatena Bookmark」が出てくる。

f:id:honeshabri:20210509174934p:plain
Googleアナリティクスのソーシャル

「Hatena Bookmark」を選択すると、はてブ経由のPVやセッションが記事単位で出てくる。これをcsvやGoogleスプレッドシートなどにエクスポートしてやれば分析できる。今回はPVのみを分析する。

f:id:honeshabri:20210509175604p:plain
共有されたURL

各記事のブクマ数はGoogleスプレッドシートのIMPORTDATA関数*1と、はてなブックマーク件数取得API*2を組み合わせて取得した。

=if(URLのセル <> "",importdata("https://bookmark.hatenaapis.com/count/entry?url=" & URLのセル),0)  

記事の投稿日はIMPORTFEED関数*3を使うのが簡単なのだが、俺のブログの場合、直近の127記事分しか取得できなかった。試行錯誤した結果、IMPORTXML関数*4を使って以下のように書いたら取得できた。なんで動いているか分かっていないため、他のはてなブログでも使えるかは知らない。

=ArrayFormula(LEFT(IMPORTXML(URLのセル,"//*[@id='main-inner']"),11))    

ともあれ、これによって本ブログ「本しゃぶり」に関して以下のデータを得ることができた。

  • 記事数:344
  • 記事投稿日:2013/05/12~2021/05/01
  • はてブ経由PV集計期間:2013/05/12~2021/05/07
  • 紐付けされたデータ:URL、投稿日、ブクマ数、はてブ経由PV、その他

はてなブックマークのサービス開始は2005年である*5。残念ながら古参の村人の考える「黄金時代」のデータは無い。しかし、3年前がどうだったかは分かるのに十分なデータはあると言えよう*6

はてブ経由PVは減少していない

まず時期を区別せずに、はてブ経由PVとブクマ数の関係を以下に示す。

f:id:honeshabri:20210509191048p:plain
はてブ経由PVとブクマ

はてブ経由PVとブクマには強い相関があることが分かる。記事にブクマがつくほど人気エントリーに残り続けるため、PVとブクマに線形を関係があるのだろう。1,500ブクマを超えるとPVの伸びが減るのは、時間の経過によってブクマがつく勢いに関係なく人気エントリーから外れるためではないだろうか。残念ながらデータ数が少ないため、たまたまかもしれないが。

次に、記事の投稿日によってPVとブクマの関係が変わるかを確認した。

f:id:honeshabri:20210509192050p:plain
期間別はてブ経由PVとブクマ

2年間隔で約13ヶ月分のデータを確認している*7。「本しゃぶり」の場合、傾きはどれもほとんど変わらない。あえて言えば年々傾きは大きくなる傾向があり、直近である投稿日が2020/05/05~2021/05/01 (緑) の傾きが最も大きい。ここ5,6年におけるはてブ経由PVは微増しつつあり、減少しているとは言えない。

今度は見方をちょっと変えて、はてブ経由PVをブクマで割った値の推移を示す。ブクマが少なすぎると値の変動が大きくなるため、カテゴリ別人気エントリーに入る目安である10ブクマ以上の記事のみを対象とした。

f:id:honeshabri:20210509193753p:plain
はてブ経由PV/ブクマと投稿日 (ブクマ:10以上)

やはり時期によるPV/ブクマの変化はそれほどない。少なくともこの期間で減少してはいない。念の為はてブ経由PV/ブクマについて、投稿日が2016年と2020年のデータでt検定を行ってみた。

投稿日 サンプルサイズ 平均値 標準誤差 標準偏差
2016年 34 14.0491 1.02407 5.88285
2020年 34 18.1541 1.32737 7.62519

p値は0.017となったので、増加の形で有意水準2%で平均値に差があると言える。従って「本しゃぶり」においては、1ブクマあたりのはてブ経由PVは増加していることが示された。

150ブクマで、はてブ経由PVはいくつになるか

発端の記事によれば、はてなブックマークが150以上ついたのに、はてブ経由PVは2,000しかないと書いてあった。この値が「本しゃぶり」の場合どうなのかを確認する。

これまでの調査で「本しゃぶり」の場合、はてブ経由PVとブクマ数の関係は時期によって差がほとんどないことが分かっている。そのため投稿時期を区別せずにデータを利用する。

はてブ経由PVとブクマ数に線形関係があることは分かっているが、上で提示した近似式は4桁ブクマも含むものであり、150ブクマから大きく離れている。そこでブクマ数が100〜300のデータのみを使い、近似式を算出した。

f:id:honeshabri:20210509200657p:plain
はてブ経由PVとブクマ (ブクマ:100~300)

ブクマ数の範囲が狭いとPVに関してブクマ以外の要素の割合が増えるため、バラツキが大きい。目的変数の予測値が実際とどれくらい一致しているかを示す決定係数R2は0.5しかない。そして標準誤差は1187.4となった。ただし全データを使った場合の標準誤差は1512.7だったので、バラツキの点ではブクマ数で対象を絞ることで良くなっている。

ともあれ近似式を算出できたので、150ブクマの時のはてブ経由PVの予測値を以下に示す。

近似式算出ブクマ条件 はてブ経由PV予測値 標準偏差
100~300 2397 1187.4
全て使用 2681 1512.7

「本しゃぶり」で150ブクマついたなら、はてブ経由PVは平均として2,400はあってもいい。しかし標準偏差が1,000以上あることを考えると、2,000PVしかないのは普通にありえる。実際、上記のグラフを見れば分かるように、150ブクマ以上ついているにも関わらず、1,000未満の記事もある。特に低い「100年分のアニメ作品リストをExcelデータで公開した」は173ブクマついているが、はてブ経由PVは801しかない。なお、この記事を投稿したのは2016年だ。

逆に150ブクマではてブ経由PVが5,000~10,000というのは「本しゃぶり」ではまずありえないと言える。150ブクマで5,000PVは2.2σ10,000PVに至っては6.4σである。

はてブ経由PV/ブクマはサイトによって異なると思うが、はてなブックマーク経由で最も多いのは全サイトが一律で扱われるトップであり、ついで総合の人気エントリーである。これに関しては「本しゃぶり」において2σを外れる出来事は、他のサイトでも頻繁に起きるとは思えない*8

従って俺がGoogleアナリティクスによる分析を正しく行えているのであれば、3年前なら150ブクマではてブ経由PVが5,000~10,000というのは誤りである可能性が高いと言える。

終わりに

あらゆるコミュニティで言えることだが、はてなブックマークも時が経つにつれて様相は変わっていく。現在の雰囲気は見ていて良いとは思えない。最近は連日のように弱者男性論で溢れかえったし、いつも暗いニュースや揉め事が多い。おもしろカテゴリは増田とデイリーポータルZに占拠されている*9。ブコメを見てもいつも同じようなアイコンだらけだ*10

しかし、全てが悪くなっていると認識するのは、あまりにも条件反射が過ぎるのではないか。

世界的ベストセラー『FACTFULNESS』には、人々は「ドラマチックすぎる世界の見方」をしてしまうため、世界の状況について実際よりネガティブに捕らえていると記されてあった。瞬時に何かをする本能と、ドラマチックな物語を求める本能が、世界に対する誤解を生むのだ、と。

本書を読んだブクマカは多いと思う*11。もし読んだのなら、ファクトを元に判断すべきと、強く思ったことだろう。果たして実行できているだろうか。

そしてまだ『FACTFULNESS』を読んでいない人は今すぐ買って読み、データや事実にもとづき世界を読み解く習慣を身につけるべきだ。

はてブ経由で読まれた記事

はてブ経由PVで降順にするとこうなった。

f:id:honeshabri:20210509211335p:plain
はてブ経由PV (降順)

はてブ経由PVの1位は恋柱である*12

Twitter経由で読まれた記事

Twitter経由PVで降順にするとこうなった。

f:id:honeshabri:20210509211640p:plain
Twitter経由PV (降順)

圧倒的1位。

*1:IMPORTDATA - ドキュメント エディタ ヘルプ

*2:はてなブックマーク件数取得API - Hatena Developer Center

*3:IMPORTFEED - ドキュメント エディタ ヘルプ

*4:IMPORTXML - ドキュメント エディタ ヘルプ

*5:祝15周年!あなただけの「はてなブックマーク タイムカプセル」

*6:もちろん「本しゃぶり」に関してのだが。

*7:分かりやすく1年分でもいいのだけど、それだとデータ数が少なくなってしまうので1月分増やした。

*8:正規分布の場合、2σ 区間におさまる確率は約 95.45%である。3σ 区間におさまる確率は約 99.73%だ。

*9:たぶんデイリーポータルZは悪くないけど。

*10:お前が同じような記事ばかりを見ているせいだというツッコミは受け入れよう。

*11:それ以上に『FACTFULNESS』を紹介した記事をブクマして満足した人の方が多いかもしれないが。

*12:セッションだと1位は最初の一歩を踏み出すという汎用的な技術