• 回答数

    3

  • 浏览数

    145

杜佳妮625
首页 > 毕业论文 > 毕业论文数据清洗和处理

3个回答 默认排序
  • 默认排序
  • 按时间排序

freekalong

已采纳

一般是毕业生是没有自己实验室的,所有很多实验数据是没有办法进行。不过有另外一个解决办法,就是找导师合作,论文里挂导师为通讯作者,这也是现在最常见的一种解决办法。

235 评论

淡淡蓝郁

数据清理是有一些步骤的,一般分为缺失值清洗,格式内容清洗,逻辑错误清洗,非需求数据清洗,关联性验证。缺失值是最常见的数据问题,处理缺失值也有很多方法,我建议按照以下四个步骤进行:1、确定缺失值范围:对每个字段都计算其缺失值比例,然后按照缺失比例和字段重要性,分别制定策略。2、去除不需要的字段:这一步很简单,直接删掉即可,但强烈建议清洗每做一步都备份一下,或者在小规模数据上试验成功再处理全量数据。3、填充缺失内容:某些缺失值可以进行填充。4、重新取数:如果某些指标非常重要又缺失率高,那就需要和取数人员或业务人员了解,是否有其他渠道可以取到相关数据。第二步:格式内容清洗如果数据是由系统日志而来,那么通常在格式和内容方面,会与元数据的描述一致。而如果数据是由人工收集或用户填写而来,则有很大可能性在格式和内容上存在一些问题。第三步:逻辑错误清洗这部分的工作是去掉一些使用简单逻辑推理就可以直接发现问题的数据,防止分析结果走偏。第四步:非需求数据清洗这一步说起来非常简单:把不要的字段删了。但实际操作起来,有很多问题。第五步:关联性验证如果你的数据有多个来源,那么有必要进行关联性验证。例如,你有汽车的线下购买信息,也有电话客服问卷信息,两者通过姓名和手机号关联,要看一下同一个人线下登记的车辆信息和线上问卷问出来的车辆信息是不是同一辆,如果不是,那么需要调整或去除数据。

186 评论

糊涂妞呀

这个要看你当时收集这个问卷的初衷是什么,一般是制成表格反映在论文中,也可以用条形图或雷达图,最好是可以把你设计问卷的原因交代一下,这样你处理数据也就有方向了,需要对比什么或统计什么情况。

221 评论

相关问答

  • 医学毕业论文数据处理

    给你分享几个查数据的平台方便在写论文的时候查找数据1国家统计局这个数据平台非常适合搜集宏观数据~而且可以直接对数据进行处理,绘制柱状图、条形图、饼图,非常方便~

    送我个时光机 5人参与回答 2023-12-08
  • 毕业论文数据图处理

    问题一:如何利用Excel画论文常用折线图 2003及其以下版本: 选定数据――菜单栏――插入――图表――图表类型:折线图――下一步或默认完成。 20

    钢结构彩钢板 4人参与回答 2023-12-10
  • stata毕业论文数据清洗

    stata分析问卷数据清洗内容很多,可以使用网页在线版本的spssau进行分析,智能化分析结果,人代智能时代的好东西,教授让用的好用

    阿尔卑斯1013 3人参与回答 2023-12-09
  • 毕业论文数据处理几天

    本科论文一般需要2-3周完成。专科论文需要1周左右。硕士论文相对来讲要求就比较高,需要花费大量的时间和精力,一般需要1-2个月左右。大概写一篇论文时间花费时间比

    若曦0518 6人参与回答 2023-12-12
  • excel毕业论文数据处理

    将问卷答案编码,注意录入excel表格,再进行统计。格式可参考:主表:卷号 题号 答案号 另外设3个参考表:1、卷号--答卷者2、题号--答案1号--答案

    吃货独依 4人参与回答 2023-12-12