記事一覧

Generation of Unique ID in R

ユニークかつセキュアなIDの生成タスク 調べものをしていて、R言語のコミュニティに次のような質問があるのを見かけました。 Generation of Unique ID in R 6桁のIDを発行して最大で40...

恋ということばを使っていないが恋に関心がありそうな歌詞を抽出したい

概要 Document-Term-Matrixをレーティングデータに見立てることで協調フィルタリングを適用し、「似たような文書では他にどのような単語が使われているか」にもとづいて、特定の単語が(実際には使われていないが)使われていて...

日本語の「嬉しい」と英語の「happy」の違いを考えるみたいな話

この記事でやること 基本感情は言語によらず任意の意味空間でガウス分布するものと仮定します。英語と日本語でそれぞれ学習したfasttextのモデル内で基本感情のベクトル表現を考え、6つの基本感情の分布間距離(バタチャリヤ距離)でつくる...