All Posts
Rules
Sharing
Questions
Information
Inspiration
Comments for Papers
Comments for Topics

[Questions] 1988年变量V207;如何鉴定不合理极端值;票证估值

Comment Time: 2019/1/22 22:52:59 |  Recent Response Time: 2019/3/2 21:13:51 |  Read Times: 1147 |  Following: 2
Author: syf08678 |  Tags/Keywords: 1988 极端值 票证

1.  请问1988年数据中的变量V207(从工作单位得到的其他现金收入,不包括生活困难补助)是像V201-V206一样的月平均值,还是年度总额?

我看一份文件里说,在将这部分收入考虑进总年收入时,应该使用V207乘以12,即将V207作为月平均值。文件来源如下:

November 28, 1991

Income Distribution in China

Definition of Composite Income Variables

---------------------------------------------------------------

To: Messrs. Zhao Renwei, Keith Griffin, Carl Riskin and John

Knight

From: A.R. Khan

但是另一份文件又说V207是 “as the unit error this var. can not be used”(文件来源:Codebook Documentation of URBAN RESIDENT INCOME SURVEY; FILE: URBANI.TX)。这是不是说我们应该抛弃这个变量,只使用它的分项目的值,V207A, V207B, V207C, V207D, 并且在加总时只对前三项乘以12?

 

2. CHIP数据清洗中,什么样的极端收入应该被考虑删去?有没有相关的文献可以参考的?或者老师能否大概说说现有文献中一般都是怎么处理的?在处理美国的收入数据时,有些人会把过低的收入删去,例如wage低于1美元,或者annual earnings低于100美元。但我大致翻阅了CHIP项目组针对每次调查出版的专书,没找到相关的处理建议。我在一篇使用CHIP的期刊文章中看到作者说她们删去了个别收入明显过高的观测值。但是该文作者并没有说清楚多高算是不合理的收入(文章题目:Women s Employment and Family Income Inequality during China s Economic Transition)。

 

3. 在计算1988年的家庭总收入时,我还想包括全家定量粮票和付食的市场估值。问卷中提供了两个估值,一个是国营单价,另一个是自由市场的单价(例如V314S 和 V314F)。请问我们应该选哪一个?

 

谢谢老师!

  Choose the Page Number:   The Number of Posts per Page:
[Post ID: 705] (Reply to the Post 701 ) 回复问题
Reply Time: 2019/2/6 10:37:22 |  Recent Update Time: 2019/3/2 21:13:51 | 
Author: struggle12 |  Tags/Keywords: 回复

1. 建议使用V207*12的方式。

2. 是否去掉极端值以及如何去掉极端值,总是会有争议。建议按照您自己的研究需要处理。在CHIP课题组的有关出版物中一般不会去掉极端值,它们有可能是真实情况。

3. 具体要根据研究需要确定。一般情况下,建议使用自由市场的价格。但不绝对。

[Post ID: 721] (Reply to the Post 705 ) 谢谢解答
Reply Time: 2019/3/2 21:13:51 |  Recent Update Time: 2019/3/2 21:13:51 | 
Author: syf08678 |  Tags/Keywords:

 感谢!

Projects of CCEHD