BeautifulSoupで自分のブログ記事をスクレイプして、Janomeで形態素解析した結果から、よく使いがちな単語トップ100を収集する。
“という” がダントツの538回登場。「という」「みたい」「そういう」「として」が多用されている事実が残念。口語や思考をそのまま書き起こしたような稚拙な文章になっている証拠だろう。
頻出単語リスト 上位50件
単語,出現回数
という,538
できる,355
でき,351
みたい,230
として,220
そういう,185
わから,179
ところ,155
しれ,147
くらい,146
考え,139
といった,133
られ,126
ほしい,118
らしい,115
に対して,105
もちろん,98
しまう,95
いけ,95
わかる,90
そんな,87
られる,86
こういう,86
あるいは,84
わかっ,83
ながら,77
くれ,76
なんて,75
しまっ,74
すぎ,74
みんな,72
たとえば,71
考える,71
において,70
もっと,69
すべて,69
それでも,66
100,65
だから,64
システム,64
すぎる,63
やっぱり,63
いつも,62
本当に,62
起き,59
覚え,58
にとって,58
だって,58
ファイル,57
決め,56
だけど,53
こんな,53
気持ち,52
ものの,51
なんか,51
ばかり,49
どんな,48
受け,46
データ,45
どうして,45
つけ,44
ちょっと,43
むしろ,43
こうした,42
けども,42
による,42
そして,41
ちゃんと,41
生き,41
当たり前,41
ビジネス,41
サービス,40
いろいろ,39
難しい,38
感じ,38
あまり,38
わかり,37
そもそも,37
食べ,36
始め,36
チーム,36
あたり,36
やめ,35
について,35
まずは,35
つまり,35
続ける,35
しかし,35
もらっ,35
つもり,34
タイプ,34
見え,34
ほとんど,34
新しい,34
やすい,34
シーン,33
レベル,33
増え,33
言える,33
終わり,32