全部帖子
规章条例
资料共享
问题求助
信息公告
突发感慨
文章评论
专题评论

[问题求助] CHIP 2007个人id

评论时间: 2019/4/16 7:04:12 |  最近被回复时间: 2019/6/2 22:50:54 |  浏览次数: 2393 |  跟帖次数: 1
作者: lizhiqing_szu731 |  标签: CHIP 2007

老师们好!我正在用CHIP2007做研究。其中,不同数据中相同的列只有household id,而没有personal id,给我合并数据框的时候带来了一些困扰。假设我想看看家庭的收入水平对孩子教育水平的影响,因为household id在数据框c和d都出现了不止一次(因为孩子可能有多个),导致我合并数据框起来以后,一个household id对应着多个孩子,因而家庭收入也出现了多次。

假设,我的第一个数据框是:

家庭编码           收入                        

A                       100

B                       200

第二个数据框是:

家庭编码        孩子的编码        孩子的教育水平

A                           1                             初中

A                           2                             高中

B                           1                             本科

按照家庭编码合并起来以后,将会得到:

家庭编码        孩子的编码        孩子的教育水平        收入

A                           1                            初中                100

A                           2                            高中                100

B                           1                            本科                200

收入这个变量将会出现多次,让我的数据总结和回归方程都不对。我预期想得到的数据框是这样:

个人编码          孩子的教育水平        收入

A1                              初中                100

A2                              高中                100

B3                              本科                200

请问,是否可以将问卷abc的其他部分的personal id也给我呢?这样,我便可以根据个人的信息进行匹配。或者,有什么其他办法可以解决这个问题吗?

谢谢!

  选择页码:   每页显示个数:
[帖子ID: 753] (对帖子 742 的回复) 回复问题
回复时间: 2019/6/2 22:50:54 |  最近修改时间: 2019/6/2 22:50:54 | 
回复者: struggle12 |  标签: 回复

孩子信息是一个单独的调查,您需要按照家庭汇总计算。直接匹配肯定会让家庭重复。这不是数据的问题,逻辑上就是这样。

其他个人数据部分包含了个人ID。农村的id或a02,城镇的a02

人的发展经济学研究中心2018年度研究项目招标通知