データマイニング本初級編
数式を使わないデータマイニング入門 隠れた法則を発見する光文社新書
最近読んだ本のご紹介ですが、データマイニングって何だろう?とこれから学ぶ人にはよいかもしれません。この中で説明されている回帰分析、クラスタ分析は弊社でもしばしば依頼がありますが、決定木(ディシジョンツリー)、連関規則(バスケット分析)、ニューラルネット等については依頼というか、問い合わせすらありません。サービスに掲げていないので当たり前と言えば当たり前ですが。後者の分析方法、特にバスケット分析などはアンケートによる回答データというよりは、商品の購買履歴などログデータの解析として使われることが多いのではないでしょうか。興味はあるのですが、通常の集計ソフトでは後者の分析方法は大抵組み込まれておらず、SPSSのClementineでも100万以上と高価なので中々手が出ないのです。。ちなみにRというフリーの集計ソフトはかなり自由度があるようですが、扱うのはちょっと難しそうです。