Development Micro-econometrics Study Group: Code Notes

日本語で経済学分析に有用なコードの備忘録を作成しています。We provide explanations of useful codes in Japanese for data cleaning, analysis, visualization like memorandum. Our software focuses on STATA, R, Python.

Stataのegen sum()とgen sum()

変数を作成・加工する際に使用するsum()関数は、egengen(またはreplace)かによって、出力が異なる。

例えば、 以下のようなデータを考える。

id var1
a 1
b 2
c 3

この時、egengenそれぞれでvar1変数をsum()すると、

egen var1_sum_egen = sum(var1)
gen var1_sum_gen = sum(var1)
id var1 var1_sum_egen var1_sum_gen
a 1 6 1
b 2 6 3
c 3 6 6

となる。つまり、egen ... sum()では全ての合計値を返す一方で、gen ... sum()では上の行から順にvar1を足し上げた値(累積の合計値?)を返す。

ちなみに、replace ... sum()gen ... sum()と挙動は同じ。