ツイッター

主成分分析によるツイッターの発言解析(6)

前回と変更点は以下の通りです。 ・形態素解析エンジンに、「リア充」などの単語を追加 ・つぶやきログを自分のフォローしている人だけに変更 結果はといいますと以下のような感じです。 上、横軸は単語をソートして並べただけなのであまり意味は無いです、…

主成分分析によるツイッターの発言解析(6)

前回と変更点は以下の通りです。 ・形態素解析エンジンに、「リア充」などの単語を追加 ・つぶやきログを自分のフォローしている人だけに変更結果はといいますと以下のような感じです。 横軸はユーザごとの発言回数、縦軸はその成分でのスコア 横軸は単語を…

主成分分析によるツイッターの発言解析 (5)

解析をする際に時間の要素も入れたらどうなるんだろうと思ってやってみた結果がこれです。 それぞれ、第一主成分、第二主成分です。 このグラフには時間の要素は表示していませんが、 第一主成分の上は時間に関係ない単語の集合、下はある単語の集合です。 …

主成分分析によるツイッターの発言解析 (4)

解析プログラムもだいぶ出来上がってきましたし、 パラメータの調整もだいぶコツをつかめて来ました、 ので報告を。 まず、単語の偏り(ある主成分)とそれらの単語のユーザの使用度(ユーザごとの主成分のスコア)です。 1つ目のグラフ横軸は全ユーザの発…

ツイッターの発言解析(3)

単語の発言回数が多くなるほど、特徴量が大きくならないように修正。 まだまだ、グラフは改善の余地があります。