数据科学的核心工作是进行什么

5个回答默认排序

默认排序

按时间排序

zhuyutong215

已采纳

数据科学家倾向于用探索数据的方式来看待周围的世界。把大量散乱的数据变成结构化的可供分析的数据，还要找出丰富的数据源，整合其他可能不完整的数据源，并清理成结果数据集。新的竞争环境中，挑战不断地变化，新数据不断地流入，数据科学家需要帮助决策者穿梭于各种分析，从临时数据分析到持续的数据交互分析。当他们有所发现，便交流他们的发现，建议新的业务方向。他们很有创造力的展示视觉化的信息，也让找到的模式清晰而有说服力。把蕴含在数据中的规律建议给Boss，从而影响产品，流程和决策。

93 评论 2小时前发布

张小电1301

86 评论 5小时前发布

食尚峰汇

数学功底：微积分是严格要掌握的。不一定要掌握多元微积分，但一元微积分是必须要熟练掌握并使用的。另外线性代数一定要精通，特别是矩阵的运算、向量空间、秩等概念。当前机器学习框架中很多计算都需要用到矩阵的乘法、转置或是求逆。虽然很多框架都直接提供了这样的工具，但我们至少要了解内部的原型原理，比如如何高效判断一个矩阵是否存在逆矩阵并如何计算等。数理统计：概率论和各种统计学方法要做到基本掌握，比如贝叶斯概率如何计算？概率分布是怎么回事？虽不要求精通，但对相关背景和术语一定要了解。交互式数据分析框架：这里并不是指SQL或数据库查询，而是像Apache Hive或Apache Kylin这样的分析交互框架。开源社区中有很多这样类似的框架，可以使用传统的数据分析方式对大数据进行数据分析或数据挖掘。笔者有过使用经验的是Hive和Kylin。不过Hive特别是Hive1是基于MapReduce的，性能并非特别出色，而Kylin采用数据立方体的概念结合星型模型，可以做到很低延时的分析速度，况且Kylin是第一个研发团队主力是中国人的Apache孵化项目，因此日益受到广泛的关注。机器学习框架：机器学习当前真是火爆宇宙了，人人都提机器学习和AI，但笔者一直认为机器学习恰似几年前的云计算一样，目前虽然火爆，但没有实际的落地项目，可能还需要几年的时间才能逐渐成熟。不过在现在就开始储备机器学习的知识总是没有坏处的。说到机器学习的框架，大家耳熟能详的有很多种, 信手拈来的就包括TensorFlow、Caffe8、Keras9、CNTK10、Torch711等，其中又以TensorFlow领衔。笔者当前建议大家选取其中的一个框架进行学习，但以我对这些框架的了解，这些框架大多很方便地封装了各种机器学习算法提供给用户使用，但对于底层算法的了解其实并没有太多可学习之处。因此笔者还是建议可以从机器学习算法的原理来进行学习。

161 评论 12小时前发布

zhaoyaxiao12

分析和机器学习是数据科学家工作的核心。从数据中收集有用信息是数据科学的主要功能。机器学习的全部内容是创建系统来预测性能，这个需求非常大。数据科学需要统计学和计算机科学技能。统计学、计算机科学和数学也都是大学的专业，可能有助于加大它们出现的频度。数据科学家需要能够交流见解并与他人密切合作。人工智能和深度学习不像其他术语那样频繁出现。然而，它们是机器学习的子集。深度学习正被越来越多的机器学习任务所使用，而这些任务以前是由其他算法完成的。

232 评论 12小时前发布

cestlavie88

数据科学与大数据技术，是2016年我国高校设置的本科专业，专业代码为080910T，学位授予门类为工学、理学，修业年限为四年，课程教学体系涵盖了大数据的发现、处理、运算、应用等核心理论与技术，旨在培养社会急需的具备大数据处理及分析能力的高级复合型人才。中文名数据科学与大数据技术专业代码080910T专业层次本科学科门类工学专业类别计算机类

255 评论 12小时前发布

数据科学的核心工作是进行什么

5个回答 默认排序 默认排序 按时间排序

相关问答

论文问答

向你推荐

热门问题

最新内容

5个回答默认排序

默认排序

按时间排序