Development Micro-econometrics Study Group: Code Notes

日本語で経済学分析に有用なコードの備忘録を作成しています。We provide explanations of useful codes in Japanese for data cleaning, analysis, visualization like memorandum. Our software focuses on STATA, R, Python.

STATAで特定の文字列が含まれているかを識別する。

変数の中に特定の文字列が含まれているかを識別する方法。例えば、ある変数の列の中に、県と市が混ざっているような場合に、どれが県のobservationと対応しているかを知りたい場合などが考えられる。 つまり、

(列: A)
千葉県
浦安市
市川市
千葉市
市原市

長野県
長野市
...

のようなデータを持ってるときに、横に県ダミーを作成してみよう。コードは、

gen d_prefecture = (ustrpos(A, "県")>0)

等とすればよい。英語の場合はstrposを代替的に用いることも可能である。