STATAで特定の文字列が含まれているかを識別する。
変数の中に特定の文字列が含まれているかを識別する方法。例えば、ある変数の列の中に、県と市が混ざっているような場合に、どれが県のobservationと対応しているかを知りたい場合などが考えられる。 つまり、
(列: A) 千葉県 浦安市 市川市 千葉市 市原市 長野県 長野市 ...
のようなデータを持ってるときに、横に県ダミーを作成してみよう。コードは、
gen d_prefecture = (ustrpos(A, "県")>0)
等とすればよい。英語の場合はstrpos
を代替的に用いることも可能である。