ちょろげ日記

日々のちょろっとしたことを

はてなブログは5年でどう変わったか?人気記事のタイトルから読み取る

はてなブログ5周年だそうです。

blog.hatena.ne.jp

はてなブログのスローガンは「書き残そう、あなたの人生の物語」なのですが、実際どんな記事が多いんでしょうね。

例えば、アメブロと言われるとなんとなくイメージがわきますが、はてなブログは外からどう見られているんでしょう。また、この5年で変化はあったんでしょうか。
 

ということで、こういうことをやってみました。

  1. 一年ごとのはてなブックマーク数上位1000記事を取得
    • はてなブックマーク検索を利用
    • 期間指定をして人気記事一覧取得し、はてなブログのみを抽出(わりと適当なので漏れがあるかも)、さらに上位1000記事を抽出
    • 期間は1年目が2011年11月7日〜2012年11月6日、というように11月7日を区切りとする
  2. 記事のタイトルを形態素解析
    • Mecabを利用
    • 名詞のみを抽出(数とかは除外)し、頻度をカウント
  3. ワードクラウドで可視化
    • Rのwordcloudパッケージを利用

 
x年11月7日から翌年11月6日にブックマークがつけられたはてなブログの記事のうちブックマーク数が多い上位1000記事のタイトルを形態素解析して頻出単語を可視化、ということなのですが、どういうことかわかりにくいかもしれないので、例をひとつ。

ある方の直近1000件のはてなブックマークコメントをワードクラウドにしてみました。

f:id:tyoro_ge:20161113020919p:plain

字が大きいほど出現頻度が高い単語です。同じ頻度の単語が同色になっています。

なんとなく雰囲気はつかめますね(利用した辞書では「恐ろしい恐ろしい」が固有名詞で登録されていました、おそろしい!それと、ネガティブなコメントが多い中で光り輝くポジティブコメント「良エントリ」は「良」と「エントリ」でわかれてしまっています)。  

これとおなじように記事のタイトルを用いて雰囲気をみていくというわけです。

上位1000記事なのですが、下位でもブックマーク数は200以上なので、おおよそホットエントリに入った記事群とみなせると思います。

つまり、人目に触れる機会が多い記事群であり、対外的なはてなブログのイメージを形成する一因になっているのでは、と思います。

それでは、一年ごとに雰囲気を見ていきましょう。

ちなみに私はITエンジニアではありません。日曜大工的なノリでやってみたという程度なので、ふわふわっとした気持ちでご覧いただけると幸いです。
 

1年目

f:id:tyoro_ge:20161113022051p:plain

1年目(2011年11月7日〜2012年11月6日)はIT技術に関する記事が多かったことがうかがえます。技術的な固有名詞が並ぶのが特徴的です。

中身がよくわかってない私の主観ですが、ぱっと見、イメージ的には技術評論社の雑誌のようです。

WEB+DB PRESS Vol.61
 

私はこの頃のはてなブログの印象が強く、世の中は頭のいい人がいるんだなぁ(書いてあることはしっかり理解できていませんでしたが)、と思うとともに、ブログはやはり専門的な知見・経験がある人が書くから注目を集める(はてなブックマークがつく)のだな、と思っていました。
 

2年目

f:id:tyoro_ge:20161113022109p:plain

2年目(2012年11月7日〜2013年11月6日)は他の年に比べるとあまり特徴がありません。1年目より技術的な固有名詞が少なくなり、より抽象的なタイトルが増えます。テクノロジそのものよりメソドロジ、仕事の仕方や開発の仕方など手法に焦点が当てられてきているように見受けられます。

イメージ的にはどうでしょうか、まだIT技術よりの雰囲気が漂っているので日経BP社のIT系雑誌あたりが近そうです。

SEのためのビジネススキル入門(日経BP Next ICT選書)

 
ちなみに、これは5年とも共通なのですが、読み手を意識して書かれた記事は「○○な人」、個人の体験談は「○○した話」というタイトルがつくため、「人」、「話」などは頻出単語になります。
 

3年目

f:id:tyoro_ge:20161113022123p:plain

3年目(2013年11月7日〜2014年11月6日)になると、技術色が薄れてきてました。「まとめ」の頻度が高くなり、あわせて「レシピ」「本」なども頻出するようになります。

イメージは…かなり適当ですが、なんとなくクックパッドなど、料理のレシピをまとめた雑誌でしょうか。

クックパッドの大好評レシピ Summer&Autumn (TJMOOK)

この結果は、おそらくまとめ・キュレーションサイトの影響なのだと思います。

自身の技術や経験にもとづく考えを伝えるというより、情報をまとめたり、既知の情報を伝えなおしたりするスタイルが増え、そういった記事にブックマークが多くつくようになってきたようです。
 

4年目

f:id:tyoro_ge:20161113022135p:plain

4年目(2014年11月7日〜2015年11月6日)は、大きく雰囲気がかわります。「おすすめ」「ランキング」「紹介」など、まるで日経トレンディやDIMEの表紙のような雰囲気に。

日経TRENDY2016年12月号

買って良かったものなどをまとめて紹介する手法が(SEO的にも?)人気を博した結果なんでしょうか。

しかも漫画であったりアプリであったり、検索におけるビッグワードが多く、 はてなブログでればこう書けば検索上位にくる、といったノウハウが共有されてきたのかもしれません。

 

5年目

f:id:tyoro_ge:20161113022155p:plain

そして5年目(2015年11月7日〜2016年11月6日)。4年目の流れは残しつつも、定番の「英語」だったり「人生」「仕事」などビジネス・生活に近い言葉の頻度が多くなってきました。

雰囲気は、例えば、日経ビジネスAssocieとかでしょうか。

日経ビジネスアソシエ 2015 年 02 月号 [雑誌]  
 

まとめ

最後に、可視化で利用したRのwordcloudパッケージにグループ間の差と共通をみる関数が用意されていたので使ってみました。

まずは5年ごとの差がこちら。

f:id:tyoro_ge:20161113022618p:plain

1年目と5年目の違いがはっきりとわかります。3年目から4年目が転換点だったんじゃないかなぁ。

次は5年間の共通ワードがこちら。

f:id:tyoro_ge:20161116010103p:plain

書いてある題材が変わったとしても、自身の経験を伝えたり、特定の誰かへ解決策を伝える記事が人気を集めるのは不変のようです。
 

さて、それでは、なぜ5年間ではてなブログの雰囲気が変わったんでしょうか。

今回の対象となった1000件x5年はブックマークの質の影響を受けます。書き手が読み手に合わせて変わったのか、書き手が入れ替わったのか、書き手と読み手が同じユーザーになってしまったからか、別サービスとの関係、などなど、この辺の話を掘り下げないと説明できないかもしれませんが……今回はここまで。
 

というわけで、はてなブログの雰囲気をなんとなく掴んでみたい、というふわふわとした記事でした。

5年後の自分へ、もう少し技術的にも内容的にもカッチリした記事がかけるようになっていてください。

はてなブログ5周年ありがとうキャンペーンお題第2弾「5年後の自分へ」
http://blog.hatena.ne.jp/-/campaign/hatenablog-5th-anniversary