C++

主成分分析によるツイッターの発言解析(6)

前回と変更点は以下の通りです。 ・形態素解析エンジンに、「リア充」などの単語を追加 ・つぶやきログを自分のフォローしている人だけに変更 結果はといいますと以下のような感じです。 上、横軸は単語をソートして並べただけなのであまり意味は無いです、…

主成分分析によるツイッターの発言解析(6)

前回と変更点は以下の通りです。 ・形態素解析エンジンに、「リア充」などの単語を追加 ・つぶやきログを自分のフォローしている人だけに変更結果はといいますと以下のような感じです。 横軸はユーザごとの発言回数、縦軸はその成分でのスコア 横軸は単語を…

主成分分析によるツイッターの発言解析 (5)

解析をする際に時間の要素も入れたらどうなるんだろうと思ってやってみた結果がこれです。 それぞれ、第一主成分、第二主成分です。 このグラフには時間の要素は表示していませんが、 第一主成分の上は時間に関係ない単語の集合、下はある単語の集合です。 …

主成分分析によるツイッターの発言解析 (4)

解析プログラムもだいぶ出来上がってきましたし、 パラメータの調整もだいぶコツをつかめて来ました、 ので報告を。 まず、単語の偏り(ある主成分)とそれらの単語のユーザの使用度(ユーザごとの主成分のスコア)です。 1つ目のグラフ横軸は全ユーザの発…

ツイッターの発言解析(3)

単語の発言回数が多くなるほど、特徴量が大きくならないように修正。 まだまだ、グラフは改善の余地があります。

ツイッターの発言解析(2)

人の分類をするにも、身長や肌の色や体重といったようにいろいろな基準があるように、 確かにツイッターのユーザの分類はしてますが、いったいどういう基準で分類してるのですか? と疑問を持たれるかもしれませんが、その答えは以下です。 発言時において、…

ツイッターのログの解析

ログの解析結果を見るための手頃なビューアがなかったのでとりあえず作りました。縦軸は偏向具合、横軸は発言回数です。 右に行くほど発言が多くなります。 偏向具合が上あるいは下に寄っているほど特異なユーザということになります。 また、発言回数が多く…

CUDAによるIPCA (Incremental PCA, Incremental Principal Components Analysis)

C++

前にC++で動くIPCAのソースを載せましたが、今度はCUDAで動くIPCAのソースを載せます。 実行速度はというと、まあ早い。 CPUにやらせるより、10倍よりも早くはならないといった感じでしょうか。 /* * param[in] frame フレーム数 * param[in] arrIn 入力画像…

オペレータ=とコピーコンストラクタの間違った使い方

C++

下のコードは永遠に、 Copy constructor called を出力し続ける、なぜか?どう直せばよいか? class { public: int data; trouble() { data = 0; } trouble(const trouble &old); trouble operator = (const trouble old); } trouble::trouble(const trouble…