知乎:数据专家:大数据是谁发明的

小编 46 0

1大数据是谁发明的

大数据是马晓东研发的,马晓东,苏州国云数据科技有限公司创始人兼CEO、波士顿咨询全球高级顾问、1986年出生于宁夏固原,中国科技大学计算机硕士。大数据领军人物,“大数据魔镜”发明人,拥有大数据发明专利二十余项,贵州、江苏、内蒙古多地政府大数据顾问专家。现担任北京信息化协会副理事长,国民经济大数据实验室副理事长,联合国教科文组织高等教育创新中心数字化人才研究院副院长,原阿里巴巴淘宝数据优化器负责人。

知乎:数据专家:大数据是谁发明的

大数据的形成

大数据,首先是数据。数据是指计算机可以处理的电子化和数字化记录与测量,将信息加工成电子化和数字化记录与测度这一过程离不开信息技术的发展与应用,正是因为信息技术的飞速发展与广泛应用,才让大数据应运而生。

在计算机和通信技术出现之前,信息主要以模拟数据的形式进行记录与交互。如报章、书籍、影像和照片、图书馆、档案室、书柜、磁带。信息的计量单位一般采用媒介的计量单位,如藏书多少册、档案多少袋、记录多少本、影像多少卷、照片多少张等等。信息获取不便利、信息交流不通畅、信息量相对较少是这一时期的典型特征。

2数据分析

是指对市场调研预测过程中收集到的各种数据资料进行适当的处理,使其显示一定的涵义,进而反映不同数据之间以及新数据与原数据之间的联系,并通过分析得出某些结论。

3大数据是一个什么行业

问题一:什么是大数据产业 大数据概念包含几个方面的内涵吧 1. 数据量大,TB,PB,乃至EB等数据量的数据需要分析处理。 2. 要求快速响应,市场变化快,要求能及时快速的响应变化,那对数据的分析也要快速,在性能上有更高要求,所以数据量显得对速度要求有些“大”。 3. 数据多样性:不同的数据源,非结构化数据越来越多,需要进行清洗,整理,筛选等操作,变为结构数据。 4. 价值密度低,由于数据采集的不及时,数据样本不全面,数据可能不连续等等,数据可能会失真,但当数据量达到一定规模,可以通过更多的数据达到更真实全面的反馈。 很多行业都会有大数据需求,譬如电信行业,互联网行业等等容易产生大量数据的行业,很多传统行业,譬如医药,教育,采矿,电力等等任何行业,都会有大数据需求。 随着业务的不断扩张和历史数据的不断增加,数据量的增长是持续的。 大数据产业包括新兴的数据分析行业,或者厂商。 如果需要分析大数据,则可以Hadoop等开源大数据项目,或国内Yonghong Z-Suite等商业大数据BI工具。 问题二:大数据 哪些行业 很多行业都会有大数据需求,譬如电信行业,互联网行业等等容易产生大量数据的行业,很多传统行业,譬如医药,教育,采矿,电力等等任何行业,都会有大数据需求。 随着业务的不断扩张和历史数据的不断增加,数据量的增长是持续的。 如果需要分析大数据,则可以Hadoop等开源大数据项目,或Yonghong Z-Suite等商业大数据BI工具。 不同行业的数据有不同的自身特点,还需要结合自身的行业知识才能把大数据转换为价值。 问题三:国内大数据公司有哪些? 大数据包涵很广泛,涉及到很多方方面面,技术难度也很大,国内能做的公司不太多,我知道的有百度、华为、联想、浪潮、电科华云、腾讯、阿里巴巴、中科曙光等。 问题四:大数据属于什么专业? 应该归于计算机(软件)方面的专业吧 问题五:目前大数据在哪些行业有案例或者说应用? 1、体育行业预测 世界杯期间,谷歌、百度、微软和高盛等公司都推出了比赛结果预测平台。其中,百度在小组赛阶段的表现最为亮眼,而进入淘汰赛阶段,百度与微软则以16场比赛15场准确预测的成 绩让人们见识到大数据在预测领域的魅力。从互联网公司的经验来看,只要有体育赛事相关的历史数据,并且与指数公司进行多方合作,就可以在赛事预测领域取得不错的成绩。 2、经济、金融行业预测 2013年,英国华威商学院和美国波士顿大学物理系的研究发现,用户通过谷歌搜索的金融关键词或许可以把脉金融市场的走向,相应的投资战略收益高达326%。而此前,也有专家尝试 通过Twitter博文情绪来预测股市波动。从预测的原理上来看,稳定发展的美国股市是比较适合大数据预测发挥其作用的。 对国内而言,百度推出的中小企业景气指数预测,应用百度海量的搜索数据来刻画我国中小企业运行发展的景气状态,以期能够及时、有效地反映中小企业运行状况,提高经济监测的 全面性和及时性。目前该功能已经上线投入应用。 3、市场物价预测 CPI表征已经发生的物价浮动情况,但统计局数据并不权威。但大数据则可能帮助人们了解未来物价走向,提前预知通货膨胀或经济危机。单个商品的价格预测更加容易,尤其是机票 这样的标准化产品,去哪儿提供的“机票日历”就是价格预测,可以告知你几个月后机票的大概价位。商品的生产、渠道成本和大概毛利在充分竞争的市场中是相对稳定的,与价格相 关的变量相对固定,商品的供需关系在电子商务平台可实时监控,因此价格可以预测,基于预测结果可提供购买时间建议,或者指导商家进行动态价格调整和营销活动以利益最大化。 后面还有用户行为预测、个人健康预测、交通行为预测等领域都有涉及,你可以自己好好看看,希望对你有帮助。ruanyun/news/ryyc/n152.aspx 问题六:大数据能做什么 如果说砍树是一个职业,那你手中的斧头就是大数据。大数据是一种覆盖政商等领域的超大型平台,你可以用大数据来瞄准你所关心领域的长短点并很快很准地得出预判,升华概念,你能通过数据预测未来,行业的未来你能掌握了,就能赚钱。 问题七:大数据是一个什么时代 10分 大数据时代,应指当前我们所处的以大数据等技术为潮流的技术时代。 大数据包含几个方面的内涵: 1. 数据量大,TB,PB,乃至EB等数据量的数据需要分析处理。 2. 要求快速响应,市场变化快,要求能及时快速的响应变化,那对数据的分析也要快速,在性能上有更高要求,所以数据量显得对速度要求有些“大”。 3. 数据多样性:不同的数据源,非结构化数据越来越多,需要进行清洗,整理,筛选等操作,变为结构数据。 4. 价值密度低,由于数据采集的不及时,数据样本不全面,数据可能不连续等等,数据可能会失真,但当数据量达到一定规模,可以通过更多的数据达到更真实全面的反馈。 很多行业都会有大数据需求,譬如电信行业,互联网行业等等容易产生大量数据的行业,很多传统行业,譬如医药,教育,采矿,电力等等任何行业,都会有大数据需求。 随着业务的不断扩张和历史数据的不断增加,数据量的增长是持续的。 如果需要分析大数据,则可以Hadoop等开源大数据项目,或Yonghong Z-Suite等商业大数据BI工具。 不同行业的数据有不同的自身特点,还需要结合自身的行业知识才能把大数据转换为价值。 问题八:国内比较好的大数据 公司有哪些 你好,说的是什么领域?数据挖掘、数据研发、数据应用方面都有佼佼者。像商业智能领域的话,国内我比较了解的帆软,一开始做报表软件,做得很好,有比较深的行业基础,后来出的FineBI商业智能软件也延续了FineReport的精华,在行业内比较有代表性,具体的,有官网,可以去了解一下。 问题九:什么是大数据时代 世界包含的多得难以想象的数字化信息变得更多更快……从商业到科学,从 *** 到艺术,这种影响无处不在。科学家和计算机工程师们给这种现象创造了一个新名词:“大数据”。大数据时代什么意思?大数据概念什么意思?大数据分析什么意思?所谓大数据,那到底什么是大数据,他的来源在哪里,定义究竟是什么呢? 一:大数据的定义。 1、大数据,又称巨量资料,指的是所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。 2、大数据技术,是指从各种各样类型的大数据中,快速获得有价值信息的技术的能力,包括数据采集、存储、管理、分析挖掘、可视化等技术及其集成。适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统。 互联网是个神奇的大网,大数据开发也是一种模式,你如果真想了解大数据,可以来这里,这个手机的开始数字是一八七中间的是三儿零最后的是一四二五零,按照顺序组合起来就可以找到,我想说的是,除非你想做或者了解这方面的内容,如果只是凑热闹的话,就不要来了。 3、大数据应用,是 指对特定的大数据 *** ,集成应用大数据技术,获得有价值信息的行为。对于不同领域、不同企业的不同业务,甚至同一领域不同企业的相同业务来说,由于其业务需求、数据 *** 和分析挖掘目标存在差异,所运用的大数据技术和大数据信息系统也可能有着相当大的不同。惟有坚持“对象、技术、应用”三位一体同步发展,才能充分实现大数据的价值。 当你的技术达到极限时,也就是数据的极限”。大数据不是关于如何定义,最重要的是如何使用。最大的挑战在于哪些技术能更好的使用数据以及大数据的应用情况如何。这与传统的数据库相比,开源的大数据分析工具的如Hadoop的崛起,这些非结构化的数据服务的价值在哪里。 二:大数据的类型和价值挖掘方法 1、大数据的类型大致可分为三类: 1)传统企业数据(Traditionalenterprisedata):包括 CRM systems的消费者数据,传统的ERP数据,库存数据以及账目数据等。 2)机器和传感器数据(Machine-generated/sensor data):包括呼叫记录(CallDetail Records),智能仪表,工业设备传感器,设备日志(通常是Digital exhaust),交易数据等。 3)社交数据(Socialdata):包括用户行为记录,反馈数据等。如Twitter,Facebook这样的社交媒体平台。 2、大数据挖掘商业价值的方法主要分为四种: 1)客户群体细分,然后为每个群体量定制特别的服务。 2)模拟现实环境,发掘新的需求同时提高投资的回报率。 3)加强部门联系,提高整条管理链条和产业链条的效率。 4)降低服务成本,发现隐藏线索进行产品和服务的创新。 三:大数据的特点 业界通常用4个V(即Volume、Variety、Value、Velocity)来概括大数据的特征。具体来说,大数据具有4个基本特征: 1、是数据体量巨大 数据体量(volumes)大,指代大型数据集,一般在10TB规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量;百度资料表明,其新......>> 问题十:大数据指的是什么?有哪些跟大数据相关的工作 大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。

4大数据时代,做顶级数据专家的学生是怎样一种体验

一问未来的学校什么样? 学校仍会存在,但功能会发生重大改变 Q1:您在书中谈到,今天的学校和几百年前的学校相比没什么变化,而校园外的世界早已变得几乎面目全非。在您看来,一所典型的大数据时代的学校,应该是什么样的? 舍恩伯格:首先我必须说,我的答案并不是完美的答案。因为我们人类很难预测未来,我们的视野会被我们已经见到的东西局限住。 我举个例子,欧洲一所大学里,一群学建筑的学生被要求设计出2050年的学校。这些25-30岁的年轻人设计的作品都包括教室、黑板、图书馆、实验室等现在的学校里有的东西,甚至还有一间专门的电脑室。这些设计中没有wifi,没有平板电脑——人们很难预见未来。 就我个人的观点,我认为未来的学校不会完全转移到线上,未来的学校仍旧会有物理性的存在,但是,学校的功能将发生重大改变。 现在的学校是一个学生接受信息的空间,但未来学生们将在家里通过观看网上等形式接受信息,然后到学校去和老师、同学就自己学习的内容进行讨论。学校将变成一个社会性的场所,是一个互相讨论,互相学习的所在。 二问未来的老师怎么当? 教师核心技能从宣讲知识变为组织讨论、个别引导 Q:大数据时代,翻转课堂会削弱老师在学习过程中的重要性吗? 舍恩伯格:不会! 大数据只会帮助老师的工作。以前老师不知道哪些部分的内容是学生面临困难的,哪些学习材料是学生感兴趣的,接下来的教授重点应该是什么。大数据可以帮助老师,提供这些信息。 我举个例子,我的《大数据时代》这本书出版之后,我并不知道读者的确切反馈,直到我们把电子书的版权卖给了。 读者们在kindle上阅读这本书,我就可以从获取很多信息:某个读者花费多少时间读完这一本书,甚至花费多少时间在某一页上;读者们在哪些部分画了下划线以突出这些字句。 我告诉你一个秘密,统计了全书中被读者们画出下划线次数最多的十个句子,我一个都没有猜中! 同样,大数据可以帮助老师们更深入了解学生的学习兴趣和学习风格。 当然,翻转课堂需要老师们的教学技能发生改变。以前照本宣科的传授、宣讲知识的技能,要让位于组织学生讨论的技能;要让位于从数据中获取学生学习信息的技能;要让位于根据数据对学生进行个别引导的技能。 这确实有些困难,但如果老师们掌握了这些技能,学校将比现在的更美好。 Q:随着数据处理技术的进一步发展,如果发展到一定程度可以自动处理数据并生成自适应的教育内容,技术是否会取代老师? 舍恩伯格:不会! 有两方面的原因。一是数据处理无法生成内容,它可以筛选、排序、组合内容,但无法生成内容。而且,即使是翻转课堂,中教授知识的也仍是老师。 第二个原因是学习是一个社会性的过程,我们面对人沟通时比面对书本学习得更快也更好。 三问未来的学习如何变? 大数据将重塑学习的三个主要特征 Q:您的新书《与大数据同行——学习与教育的未来》中文版即将问世,能否概括一下,大数据对教育和学习究竟将带来哪些方面的改变? 舍恩伯格:大数据将重塑学习的三个主要特征,我将之称为“反馈、个性化和概率预测”。 首先说反馈。在正规教育中,从幼儿园到大学,反馈随处可见,最常见的就是考试。然而,这种教育反馈系统的几乎所有方面都存在很大的缺陷:我们并不是总在收集正确的信息,即便是,我们所有收集的数量也远远不足。 大数据正在改变这一现状。我们能够收集到过去无法获取的学习数据,并用于学习过程的处理。我们还能用新的方式组合数据,并充分发挥起作用以提高学习理解和学业表现,同时分享给教师和管理者以改善教育系统。 我刚才举的通过获得的读者反馈就是一例。 然后是个性化。学习一直以来都是个人行为,但大多数正规学校的教育,在其设计时考虑的是处于平均水平的学生——比坐在前排的神童学得慢,但比教室后排的笨蛋学得快的一种虚构的生物。而现实中,并没有归属于这一类别的学生。 我们需要的是“一个尺寸适合一个人”的方式。既然我们可以截取、混合最爱的音乐并将之刻录到iPods播放器中,那为什么不能对我们的学习做出同样的操作呢? 在未来,学习决不会是按照一本给定的教科书、一门科目或课程,以同样的顺序和步调进行,而将会是有数千种不同的组合方式。 最后说说概率预测。通过大数据,我们能够对人们的整体学习状况和个体的知识掌握情况产生独到的见解。然而这些见解并不是完美的。我们“对学习的学习”可是说只是一种“可能性”。 我们可以基于高度的可能性,对个体为提高其学业成绩需要实施的行为作出预测。比如,选择最有效的教材、教学风格和反馈机制。但这仅仅是概率预测。 四问:大数据可能带来教育领域哪些危险? 用数据贴标签和限制学习自由 Q:除了这些正面的影响,大数据对于教育和学习有没有什么负面的影响? 舍恩伯格:是的。其危险有两个,一个是“永久的过去”,一个是“决定了的未来”。 所谓“永久的过去”是指,我们作为个人不断地成长、发展、变化,而那些多年来收集的全面的教育数据却始终保持不变。 想象一下,某个学生的活动记录被存储下来,并在25年后他找工作的时候被提供给未来的雇主,这将会是怎样的情形? 因此,全面教育数据带来的首个重大威胁,并不是信息的发布不当,而是束缚我们的过去、否定我们进步、成长和改变的能力,而且目前尚无抵御这一威胁的可靠措施。 所谓“决定了的未来”是指,以所有人为对象收集到的全面教育数据,将用于对未来进行预测;但是系统也可能带来一些恶性的后果。假如系统预测某个学生不太可能在一个学科领域(如生物信息学)取得良好成绩,于是引导他转入护理之类的其他专业,我们应该如何看待系统的决策? 诸如此类的概率预测将会限制我们的“学习自由”,并有可能最终威胁到我们对生活中的机遇的获取。比如大学可以很容易利用大数据选拔出学习能力最强的学生,毕竟教育最聪明的10个学生很容易,而提高普通学生的成绩却难得多,但也有意义的多。 在我看来,大数据蕴含的巨大潜力在于推进个性化学习、改善教材和教学、并最终提高学生的成绩。数据应该被视为促进产品改良的反馈,而不是对产品使用者进行简单评价的依据。 Q:我们该如何避免这些状况的发生? 舍恩伯格:依靠法律。我认为应该对大数据的使用立法,明确规定哪些数据可以收集和使用,哪些数据不能收集和使用;哪些数据可以在哪些领域中加以使用等等。

5数据挖掘

Calculate the distance between the query-instance and all the training samples,Sort the distance and determine nearest neighbors based on the K-th minimum distance,Gather the category of the nearest neighbors. There are three rows last column that the category of nearest neighbor (Y) is not included because the rank of this data is more than 3 (=K). X1 = Normalized Salary X2 = Normalized Age Distance to query instance (0.8, 0.3) Rank minimum distance Is it included in 3-Nearest neighbors? Approved? Yes/No 0.5 0.2 0.32 5 No - 0.7 0.5 0.22 3 Yes Yes 0.9 0.7 0.41 6 No - 1.0 0.5 0.28 4 No - 0.8 0.4 0.1 1 Yes No 0.7 0.4 0.14 2 Yes Yes There are 2 Yes and 1 No, since 2>1 then we conclude that the junior Loan Officer should approve the car loan application of someone whose normalized age is 0.3 and normalized salary is 0.8. w1= (0.5-4.6/6)(12-27)+(0.7-4.6/6)(15-27)+…+(0.7-4.6/6)(31-27) (0.5-4.6/6)²+(0.7-4.6/6)²+…+(0.7-4.6/6)² =55 w2=(0.2-2.7/6)(12-27)+(0.5-2.7/6)(15-27)+…+(0.4-2.7/6)(31-27) (0.2-2.7/6)²+(0.5-2.7/6)²+…+(0.4-2.7/6)² =17 w0= 27-55*4.6/6-17*2.7/6=-23 A= w0+ w1S+ w2A=-23+55*0.8+17*0.3=26 So he should approve 26.

6数据专员主要是做什么的,都需要一些哪些电脑操作?

一、数据专员主要工作内容如下: 1、负责公司库存数据的收集、编码、核对和上报; 2、负责公司所有数据的稽核工作; 3、根据数据分析方案进行数据分析,在既定时间内提交给市场研究人员; 4、能进行较高级的数据统计分析; 5、完成公司领导及部门领导安排的其他工作。 二、数据专员所需要的电脑操作知识或技能如下: 1、具有数理统计,经济学以及相关知识; 2、能熟练使用EXCLE、SPSS、QUANVERT、SAS等统计软件; 3、能进行较高级的数据统计分析。

7数据员是做什么的

知乎:数据专家:大数据是谁发明的

数据员的工作内容有:1、编制周、月、季度、年度业务销售数据;2、对数据进行不同类目的汇总、统计以及分析;3、配合相关部门进行数据表格整理;4、收集、整理竞争对手的相关数据及资料,并进行对比分析;5、整合并分析平台同类市场的数据;6、为公司的相关决策提供基础数据;7、完成上级交办的其他事务。数据员的招聘条件是:1、大专及以上学历;2、能熟练操作办公软件;3、有较强的条理性;4、有良好的沟通能力及团队协作能力;5、有责任心。