All Posts
Rules
Sharing
Questions
Information
Inspiration
Comments for Papers
Comments for Topics
|
[Questions] CHIP 2007个人id
Comment Time: 2019/4/16 7:04:12 |
Recent Response Time: 2019/6/2 22:50:54 |
Read Times: 2400 |
Following: 1
Author: lizhiqing_szu731 | Tags/Keywords: CHIP 2007 老师们好!我正在用CHIP2007做研究。其中,不同数据中相同的列只有household id,而没有personal id,给我合并数据框的时候带来了一些困扰。假设我想看看家庭的收入水平对孩子教育水平的影响,因为household id在数据框c和d都出现了不止一次(因为孩子可能有多个),导致我合并数据框起来以后,一个household id对应着多个孩子,因而家庭收入也出现了多次。 假设,我的第一个数据框是: 家庭编码 收入 A 100 B 200 第二个数据框是: 家庭编码 孩子的编码 孩子的教育水平 A 1 初中 A 2 高中 B 1 本科 按照家庭编码合并起来以后,将会得到: 家庭编码 孩子的编码 孩子的教育水平 收入 A 1 初中 100 A 2 高中 100 B 1 本科 200 收入这个变量将会出现多次,让我的数据总结和回归方程都不对。我预期想得到的数据框是这样: 个人编码 孩子的教育水平 收入 A1 初中 100 A2 高中 100 B3 本科 200 请问,是否可以将问卷abc的其他部分的personal id也给我呢?这样,我便可以根据个人的信息进行匹配。或者,有什么其他办法可以解决这个问题吗? 谢谢!
Choose the Page Number:
The Number of Posts per Page:
[Post ID: 753] (Reply to the Post 742 ) 回复问题
Reply Time: 2019/6/2 22:50:54 | Recent Update Time: 2019/6/2 22:50:54 | Author: struggle12 | Tags/Keywords: 回复 孩子信息是一个单独的调查,您需要按照家庭汇总计算。直接匹配肯定会让家庭重复。这不是数据的问题,逻辑上就是这样。 其他个人数据部分包含了个人ID。农村的id或a02,城镇的a02 |
© 版权所有:收入分配研究团队 2012-2024 京ICP备12037474号-1
地址:北京市海淀区新街口外大街19号 邮编:100875
Copyright © 2012-2024 Research Team of Income Distribution. All Rights Reserved
Address: 4th Floor of Jing-shi-xue-tang and Room 9504 of Jingshi Hotel, Beijing Normal University, No. 19 Xinjiekouwai Street, Haidian District, Beijing, 100875.