全部帖子
规章条例
资料共享
问题求助
信息公告
突发感慨
文章评论
专题评论
|
[问题求助] CHIP 2007个人id
评论时间: 2019/4/16 7:04:12 |
最近被回复时间: 2019/6/2 22:50:54 |
浏览次数: 2393 |
跟帖次数: 1
作者: lizhiqing_szu731 | 标签: CHIP 2007 老师们好!我正在用CHIP2007做研究。其中,不同数据中相同的列只有household id,而没有personal id,给我合并数据框的时候带来了一些困扰。假设我想看看家庭的收入水平对孩子教育水平的影响,因为household id在数据框c和d都出现了不止一次(因为孩子可能有多个),导致我合并数据框起来以后,一个household id对应着多个孩子,因而家庭收入也出现了多次。 假设,我的第一个数据框是: 家庭编码 收入 A 100 B 200 第二个数据框是: 家庭编码 孩子的编码 孩子的教育水平 A 1 初中 A 2 高中 B 1 本科 按照家庭编码合并起来以后,将会得到: 家庭编码 孩子的编码 孩子的教育水平 收入 A 1 初中 100 A 2 高中 100 B 1 本科 200 收入这个变量将会出现多次,让我的数据总结和回归方程都不对。我预期想得到的数据框是这样: 个人编码 孩子的教育水平 收入 A1 初中 100 A2 高中 100 B3 本科 200 请问,是否可以将问卷abc的其他部分的personal id也给我呢?这样,我便可以根据个人的信息进行匹配。或者,有什么其他办法可以解决这个问题吗? 谢谢!
选择页码:
每页显示个数:
[帖子ID: 753] (对帖子 742 的回复) 回复问题
回复时间: 2019/6/2 22:50:54 | 最近修改时间: 2019/6/2 22:50:54 | 回复者: struggle12 | 标签: 回复 孩子信息是一个单独的调查,您需要按照家庭汇总计算。直接匹配肯定会让家庭重复。这不是数据的问题,逻辑上就是这样。 其他个人数据部分包含了个人ID。农村的id或a02,城镇的a02 |
© 版权所有:收入分配研究团队 2012-2024 京ICP备12037474号-1
地址:北京市海淀区新街口外大街19号 邮编:100875
Copyright © 2012-2024 Research Team of Income Distribution. All Rights Reserved
Address: 4th Floor of Jing-shi-xue-tang and Room 9504 of Jingshi Hotel, Beijing Normal University, No. 19 Xinjiekouwai Street, Haidian District, Beijing, 100875.