Stataのegen sum()とgen sum()
変数を作成・加工する際に使用するsum()
関数は、egen
かgen
(またはreplace
)かによって、出力が異なる。
例えば、 以下のようなデータを考える。
id | var1 |
---|---|
a | 1 |
b | 2 |
c | 3 |
この時、egen
とgen
それぞれでvar1
変数をsum()
すると、
egen var1_sum_egen = sum(var1) gen var1_sum_gen = sum(var1)
id | var1 | var1_sum_egen | var1_sum_gen |
---|---|---|---|
a | 1 | 6 | 1 |
b | 2 | 6 | 3 |
c | 3 | 6 | 6 |
となる。つまり、egen ... sum()
では全ての合計値を返す一方で、gen ... sum()
では上の行から順にvar1
を足し上げた値(累積の合計値?)を返す。
ちなみに、replace ... sum()
はgen ... sum()
と挙動は同じ。