Stataで文字列の空白を削除する。
元のデータがエクセルなどで手入力されていたりすると、一つのセルの中で変な空白が入ってしまっていることがある。これが数字の情報だったりすると文字列として読み込まれてしまうので、整理する必要がある。そういったときに便利なのがsubinstr
コマンドである。
たとえばIDデータがセルの中に"123 456"のように、3と4の間に空白が入ってしまっているとする。そのとき、
replace ID = subinstr(ID, " ", "", .)
とすれば、ID内の空白はすべて削除される。(別件ではあるがこれを数字列の情報に変えたい場合、上のコマンド実施後にdestring ID, replace
とすればよい)