Development Micro-econometrics Study Group: Code Notes

日本語で経済学分析に有用なコードの備忘録を作成しています。We provide explanations of useful codes in Japanese for data cleaning, analysis, visualization like memorandum. Our software focuses on STATA, R, Python.

Stataで文字列の空白を削除する。

元のデータがエクセルなどで手入力されていたりすると、一つのセルの中で変な空白が入ってしまっていることがある。これが数字の情報だったりすると文字列として読み込まれてしまうので、整理する必要がある。そういったときに便利なのがsubinstrコマンドである。 たとえばIDデータがセルの中に"123 456"のように、3と4の間に空白が入ってしまっているとする。そのとき、

replace ID = subinstr(ID, " ", "", .)

とすれば、ID内の空白はすべて削除される。(別件ではあるがこれを数字列の情報に変えたい場合、上のコマンド実施後にdestring ID, replaceとすればよい)