• 回答数

    6

  • 浏览数

    102

淡定的机车
首页 > 论文问答 > 数据为核心,以科学为依据

6个回答 默认排序
  • 默认排序
  • 按时间排序

一个胖子0528

已采纳
简单说有三大核心技术:拿数据,算数据,卖数据。基础的技术包含数据的采集、数据预处理、分布式存储、NoSQL数据库、数据仓库、机器学习、并行计算、可视化等各种技术范畴和不同的技术层面。大数据预处理,指的是在进行数据分析之前,先对采集到的原始数据所进行的诸如“清洗、填补、平滑、合并、规格化、一致性检验”等一系列操作,旨在提高数据质量,为后期分析工作奠定基础。数据预处理主要包括四个部分:数据清理、数据集成、数据转换、数据规约。数据清理:指利用ETL等清洗工具,对有遗漏数据(缺少感兴趣的属性)、噪音数据(数据中存在着错误、或偏离期望值的数据)。数据集成:是指将不同数据源中的数据,合并存放到统一数据库的,存储方法,着重解决三个问题:模式匹配、数据冗余、数据值冲突处理。数据转换:是指对所抽取出来的数据中存在的不一致,进行处理的过程。它同时包含了数据清洗的工作,即根据业务规则对异常数据进行清洗,以保证后续分析结果准确性。数据规约:是指在最大限度保持数据原貌的基础上,最大限度精简数据量,以得到较小数据集的操作,包括:数据方聚集、维规约、数据压缩、数值规约、概念分层等。
322 评论

张小电1301

274 评论

S君临天下

数字化成熟的组织不会浪费时间抵制数字化转型,而是拥抱并适应商业环境中的关键转变。从接触与咨询的企业来看哪些能够驾驭复杂不确定环境下往往有以下6个特征:对客户保持亲密的连接,动态感知需求变化随着IOT、社交网络等众多可用数据,公司可以前所未有地更加了解自己的客户。最成功的公司不会期望客户购买公司销售的任何产品,而是主动预测和发现客户的问题和愿望,并据此进行创新。由于互联网提供的透明度,客户可以轻松浏览评论和价格,数字化成熟的公司旨在提供独特的、通常更加定制化的端到端客户体验。“了解你的客户”长期以来一直是商业口号,但即使是来自数字优先公司高管也承认,他们的组织往往只是销售已有的产品和服务,而不是根据不断变化的客户需求和愿望开发新产品。真有不少企业数字化转型忘记了以客户为中心是数字时代成功的最关键特征之一,这种情况在央企或者被简单线性业绩绑架的企业更常见。了解客户必须成为一个动态的、持续的过程,并且正迅速成为日常经营最为重要的主流程。公司都非常清晰之道需要在 COVID-19 大流行之后重新认识他们的客户,持续刷新客户的痛点和愿望。一位企业家给我讲,鉴于新冠的流行和经济形式的不可预测性,他们正在构建“为客户服务,而不是向他们销售”新增长心智模式,并建立迈向下一个常态所需的企业与客户的连接战略(connection)。在咨询项目中,我常常会极力推动企业数字化转型中加入连接战略。主要是构建4个数字化连接:与客户的连接;与员工的连接;与上下游生态的连接;与社会及监督机构的连接;全球化战略也变得更加“全球形式的本地化”,为满足特定国家市场的需求和期望开发产品和服务的压力越来越大。这几年国内出海企业已经初具规模,通过数字化手段有效洞察需求,连接客户是弯道超车的绝佳时机。以数据为依据而非简单数据驱动的文化,人是核心数字化成熟的组织拥抱数据,并使用它来做出更好、更快的决策。然而,数据有智能而不是决定企业的战略与日常经营决定。数据分析很重要,但需要你需要判断和批判性思考,最终确定路线图。所有员工,不仅仅是数据科学家,都应该使用数据来开启新的洞察和远见,而不是依赖过去的经验,简单的路径依赖。鉴于变化的速度,后见之明常常对手头的任务毫无用处。数字化成熟的公司拥有合适的技术专长(如经验丰富的数据科学家或分析师)、数据工具(仪表板和数据可视化应用程序)和平台(计算基础设施和操作系统),跨越组织部门与不同系统来打通数据。典型案例就是美的集团前后用3年连接财务、供应链、市场、研发等多个数据平台,为数字化转型的数据驱动构建基础,当然前后也花费超过10亿。简单地提供数据并不能保证团队会使用它。员工能否轻松访问数据?它是否集成到员工的工作流程和流程中?员工(无论资历、经验或年龄)是否知道如何解读数据?虽然不少企业家都将“基于数据的决策”列为数字时代最关键的成功因素之一,但普遍缺乏判断力。数字化成熟的公司从高层到底层员工都可以批判性地看待数据,知道某些分析不完整、不完善,甚至存有偏见。挑战者心态和极强的颠覆意愿数字化成熟的公司鼓励员工挑战现状,即使这意味着从根本上去重新思考核心业务及发展。组织中的每个人都有责任倾听来自客户、供应商和公司外部其他利益相关者的信号。他们有权质疑业务的各个方面,并提出为客户创造价值的新方法。在这样公司条件下茁壮成长的人对周围发生的一切都充满好奇。他们乐于承认自己不知道的东西,并且愿意忘记、重新学习并接受最新和最佳实践。好奇心和创造力是数字成熟公司的重要资源。即使许多功能实现自动化,与我接触企业家仍坚持认为人类的聪明才智仍然是至关重要。这些组织的领导者倾向于寻找能够将他们的创意火花应用到从数据、人工智能和同事反馈中获得洞察力的人。学习和组织绩效是孪生的,而不是像尚未采用敏捷思维的公司通常那样分开。在招聘和提拔员工时,数字化成熟的组织一般都是寻找具有“成长心态”的候选人,源于他们能够适应不断变化的条件。一位企业家曾经跟我说,他们的企业现在会评估每位员工的“AQ”适应性商以衡量他们在压力下保持敏捷和成长的能力。现在不仅有智商、情商、逆商,还可以来个适应性商,很明显这是有智慧的。这背后思想源泉可以挖到达尔文的进化论与个人与组织心理学等理论。我认为很有必要!变革期~分布式决策与共创之风随着端到端客户体验的需求不断增长,公司一直渴望打破孤岛使得跨职能工作势在必行。交流的企业家一致认为,成熟的数字化组织必须具有高度的协作性才行。数字化成熟组织的领导者超越了职能孤岛和组织结构约束,将具有不同技能的个人聚集在一起来构建和解决问题。这些领导者更多地将员工视为“合作者”而不是“追随者”,部分原因是数据和技术让更多员工能够方便参与决策。一些企业家表示,出于这个原因,在公司内部带来更多观点和经验的多元化、公平和包容性努力对于激发新思维至关重要。COVID-19 大流行迫使领导者和组织重新构想合作方式。领导者必须仔细平衡“权衡”和“退后”,目标是让员工拥有自己的决定权并采取行动。这些公司常常愿意走出他们的组织、部门和地区,愿意接纳对人才开展差异化体验设计。数字化远程办公时代企业新挑战是:如何吸引来自世界各地不同组织级别的人员,有效采用虚拟会议和协作工具。数字化转型相对而言成熟的华为在疫情期间将数字化集中聚焦于组织内部的协作与远程办公,极大化解疫情期间全球的沟通与正常商务与研发的开展。想赢在数字化新办公形式,你需要的不仅仅是技术:关于共同目标、价值观和规范的明确讨论,可以鼓励参与感和协作。定期会议有助于标准化流程。尽管身体距离和跨文化差异,仪式感可以建立社区感和归属感。然而,你也要接受数字化虚拟协作的局限性。例如在横向协作方面,目前还没有什么可以替代面对面的互动来建立信任和联系,即使在数字优先的公司和数字原住民之间也是如此。不断做实验和团队学习在一个速度很重要的世界里,数字化成熟的组织即使在一些模棱两可的情况下也会采取积极采取行动。他们不会在做出决定之前收集完美的信息;他们将自己的决定视为基于可获得的最佳信息的“工作假设”,拥抱不确定性,开放迭代。数字化成熟的组织利用设计思维、精益创业和敏捷方法来推动创新。多年来,你一直听说组织需要培养一支经过深思熟虑的冒险者队伍,能够以“快速失败”和“快速学习”的方式生活。领导者仍然想要这个,为了实现它,他们需要创造一个为不确定性、实验和善意失败留出空间的环境。一位企业家谈到,他带着团队必须愿意有勇气推出新产品或程序,对它们进行试验、改进,甚至放弃它们。数字化成熟的组织利用设计思维、精益创业和敏捷方法来推动创新。他们进行严格的相关实验,并根据新的发展进行测试、学习和适应(甚至在数据表明不再有效时放弃曾经认为有希望的项目)。以客户亲密度指导他们的运营模式和文化,这些实验将客户需求放在首位。事实上,我发现许多公司与客户已经开始共同创造新产品和服务,这样的例子有很多。例如,在服务三一重工时,他们的重卡团队与货车司机皆为好朋友,挖掘痛点,抓住领先用户开发产品,利用种子用户引爆市场,迅速获取市场。道德决策和数字化伦理,持续发展随着技术进步,带来了以前想象不到的案例与新情况,数字化成熟的组织认识到他们应对在组织内部甚至外部的行为的意外后果负责。不少企业家都反馈说会出现道德困局,但领导者必须积极建立公司新指南针与流程、配置相关人才以处理。年轻的雇员尤其希望在忠于信奉价值观的公司工作。工作不只是讨生活,更是一种生活态度!数字化成熟组织的领导者会想办法让员工围绕一个共同的目标,并将代表利益相关者的道德决策置于中心位置。数字化公司收集和使用员工和客户的数据,但会公开他们的意图和相关流程。当企业使用这些数据时,他们会积极确保他们遵守收集数据时设定的隐私保护与数据伦理。组织希望呵护客户想要共享其个人信息的动力源,因为他们相信企业会从使用这些信息中受益。企业建立这种信任需要多管齐下,在客户认可前提下还要得到公司所有人员的拥护,而不仅仅是合规人员的监督。大部分企业对这个点都还不重视,但是数字化成熟企业对这个问题已经上升到战略高度,可持续发展的高度,不必等到问题出现才行动。小结:真正的成功不是从不失败,而是经历失败都不失去热情!数字化转型是波澜壮阔的大历史,你与团队的挑战才刚刚开始

181 评论

shmilyflying

数据挖掘,无论是银行的大数据、证券的大数据、互联网的大数据、还是你在央视上看到的春运大数据,都是用过数据挖掘来产生价值的

178 评论

陈达文文

数据科学与大数据技术,是2016年我国高校设置的本科专业,专业代码为080910T,学位授予门类为工学、理学,修业年限为四年,课程教学体系涵盖了大数据的发现、处理、运算、应用等核心理论与技术,旨在培养社会急需的具备大数据处理及分析能力的高级复合型人才。中文名数据科学与大数据技术专业代码080910T专业层次本科学科门类工学专业类别计算机类

214 评论

晓晓彤儿

数据科学,英文为Data Science,简称DS,从广义上来说,数据科学顾名思义,和数据有关的科学研究都是数据科学。维基百科对 DS 的解释是这样的:“ In general terms , Data Science is the extraction of knowledge from data , which is a continuation of the field data mining and predictive analytics , also known as knowledge discovery and data mining ”具体来说,数据科学是指通过挖掘数据、处理数据、分析数据,从而获取数据中潜在的信息和技术。数据科学家的工作:借助统计编程,设计、开发和运用算法来支持商业决策制定工具,管理海量数据, 创建可视化以帮助理解。数据科学是关于数据的科学,为研究探索数据界奥秘的理论、方法和技术。数据科学在20世纪60年代已被提出,只是当时并未获得学术界的注意和认可,1974年彼得诺尔出版了《计算机方法的简明调查》中将数据科学定义为:“处理数据的科学,一旦数据与其代表事物的关系被建立起来,将为其他领域与科学提供借鉴”。1996年在日本召开的“数据科学、分类和相关方法”,已经将数据科学作为会议的主题词。2001年美国统计学教授威廉克利夫兰发表了《数据科学:拓展统计学的技术领域的行动计划》,因此有人认为是克利夫兰首次将数据科学作为一个单独的学科,并把数据科学定义为统计学领域扩展到以数据作为现金计算对象相结合的部分,奠定了数据科学的理论基础。

126 评论

相关问答

  • 为什么说数据库管理系统是数据库系统的核心

    数据库:是存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。数据库的最大功用就是将众多的数据集中在一个可以伸缩的容器里,通过一定算法进

    七月紫梦 5人参与回答 2023-12-09
  • 数据科学的核心问题

    2020高考志愿填报,大数据专业解读

    滋味游龙 3人参与回答 2023-12-06
  • 数据科学的核心任务是

    数据库系统的核心和基础,是数据模型,现有的数据库系统均是基于某种数据模型的。数据库系统的核心是数据库管理系统。数据库系统一般由数据库、数据库管理系统(DBMS)

    德古拉之吻~ 3人参与回答 2023-12-06
  • 专利生效时间以什么为依据

    发明专利权自公告之日起生效,是指它的对外公示效力;专利权的起算从申请之日起,是因为,当开始申请专利的时候起,其他人就无权在旧本专利进行申报了,实际上如果最终能够

    cathy101012 2人参与回答 2023-12-05
  • 数据科学的核心技术

    想学习大数据技术,是不是首先要知道大数据技术有哪些呢?也好知道自己未来应该往哪个方向发展,应该重点学习哪些知识? 抽象而言,各种大数据技术无外乎分布式存储 +

    ace922apple 5人参与回答 2023-12-11