自由回答コーディング

自由回答のコーディングとは、回答文章を集計するために個々の文章で内容が同じものをまとめて記号化する作業のことを言います。

例えば「香りがよい」という好意的意見を「1」という数字に置き換えます。「匂いがよい」「よい香りがする」といった回答も「1」に置き換えます。このようにまとめていくと、香りの好意的意見については下記のような記号化の法則が出来上がります。これをコーディングガイド(コードフレーム)と言い、コーディング作業の指示書になります。
香り(ネット)
1:香りがよい
2:香りの強さがちょうどよい
3:甘い香り
4:高級な香り
5:さわやかな香り


9:香りのその他
このように1~9と質的データを量的データに置き換えることにより集計や分析が行えるようにします。通常、回収サンプル数の半数から2/3ぐらいの回答を実際に見てコーディングガイドを作成し、クライアントに承認を得て作業に入ります。

当然ガイドにない回答も出てきますので、ある程度の頻度になったところで新規にコードを追加します。この「ある程度の頻度」は任意に決め、それ以下の頻度の回答は「その他」に割振ります。ただし、「その他」が20%になってしまうようではあまりよいコーディングとは言えません。「その他」というコード自体は具体的な情報ではありません。どうしても具体的なコードがとれないものを落とし込む最後の手段と思ってください。内容をもう一度吟味して同じような内容の回答はまとめて新規にコードを立てるようにします。
コツさえ掴めばどなたでも出来ますが、最初のうちは時間がかなりかかりますし、迷う部分も多いと思います。特に短時間できちんとしたガイドを作成するためには経験がものを言います。ある程度この作業を繰り返しているとガイドのデータベースも増え、シャンプーや洗剤の製品テストといった調査テーマを聞けば、おおよそどのようなコードが出てくるか予想できます。どのような回答をどのようにまとめて行けばよいか事前に推測できるわけです。きちんとしたガイドを作成できればその後のコーディング作業がとても効率的になります。特にガイド作成者とコーディング作業者が異なる場合は、わかりやすい(コーディングしやすい)ガイドを作ることが非常に重要です。

また、調査の主旨・目的によってガイドの作り方も工夫が必要になります。香りにこだわったシャンプーの評価質問であれば香りについてはできるだけ細かくコードを立てるべきでしょう。またトラッキング調査のように同じ内容の質問紙を継続的に使用する場合は、自由回答のガイド(コードの取り方)も統一させる必要があります。

コーディング作業による記号化により、この量的データをクロス集計したり多変量解析に使用したりします。最近、このような人手によるコーディング作業の代りに、PCソフトを使ったテキストマイニングの手法が使われることがありますが、テキストマイニングによる自動処理で完全に代行できるとは考えていません。ソフトを使用しても、ガイドを作成するようにコードをルール化するのは人手ですし、「その他」に割振る作業はソフトではまだできません。全く同じアウトプットが出てくるわけではありあません。コーディング作業=テキストマイニングではなく、異なる分析、もしくは人手によるコーディング+テキストマイニングと捉えたほうがよいと思います。テキストマイニングソフトは多変量解析などコード化した後の分析までセットになっていて各ソフトで色々な分析手法を特徴としています。最近ではテキストマイニングソフトにかけるためのコーディング作業を受注することもありますし、ネット調査でも質問に自由回答を設ける割合が増えている傾向もあります。
参考)上記ガイド例の「香り(ネット)」のネットとは、1~9のいずれかを回答という意味で、集計の際、統計値として集計されます。コーディング作業には直接影響ありません。