【摘要】
对于包括教育在内的许多领域的企业来说,“大数据”正迅速成为一个非常重要的领域。简单地说,它指的是各种来源的数据和数据中的理解模式的组合,这些数据可以用于各种目的,如改善市场情报和教育研究。大大小小的企业都在实施(或计划实施)大数据战略。除了市场情报,它还被应用于不同的领域,如医疗保健和其他科学研究,航空和重型机械等复杂制造业,改善公用事业和交通管理,石油和天然气勘探,电信,零售,银行和保险,国防和安全。在这篇文章中,我们将介绍大数据及其在包括教育在内的各个领域的一些应用。我们还描述了如何使用大数据来监控社交媒体(例如LinkedIn、Facebook和Twitter),以实现市场增长和品牌管理。文中提到了各高校开设的一些大数据培训班。本文提到的在教育行业的应用包括结合各种关于学生的信息来源,如一段时间内的考试记录、行为模式和教师观察,以提供更准确和及时的干预。此外,我们还讨论了新的评估形式,如电子评估和适应性测试,它们将提供新的数据流,可用于更详细地研究考生的表现,并用于监测和评估考试。
大数据
近年来的技术进步带来了大量的数据,这些数据现在已经在日常生活中产生,如购物、旅游、银行、制造和贸易、公用事业、国家和治理、体育、娱乐、科学、教育和卫生。商业组织、研究机构和政府已经开始意识到利用这些数据促进自身发展的重要性。因此,大数据研究在不同研究领域的学者中获得了突出地位(Einav&Levin,2013;Mayer-Schönberger&Cukier,2013),并引起了非学术界的兴趣(BBC,2013;Lohr,2012)。
大数据的概念包括数据的收集,从各种来源收集的数据的组合,处理和使用这样获得的结果。具体地说,大数据是指需要复杂处理和可视化的大型数据库,传统的数据处理软件无法有效地处理这些数据(维基百科,2014a)。根据麦肯锡全球研究所(McKinsey Global Institute)的说法,“大数据是指其大小超出了典型数据库软件工具捕获、存储、管理和分析能力的数据集”(Manyika等人,2011年)。被归因于Gartner Inc.的一种著名的大数据模型(称为3V模型)。将其定义为“大数据是大容量、高速度和/或高多样性的信息资产,需要新的处理形式以增强决策、洞察力发现和流程优化”(Beyer&Laney,2012)。这里的术语“体积”指的是数据集的复杂性,而不一定是它们的大小。“多样性”是指不同类型的结构化或非结构化数据,如文本和数字、视频和音频以及日志文件。“速度”是指数据可用于分析的速度。有时其他的V,如“准确性”(目标是数据完整性和组织自信地使用数据的能力)或“价值”(新数据是否能使组织获得更多价值?)。也突出了(Swoyer,2012;Villanova大学,2014)。
近年来,大数据的潜力不断上升,导致各国政府为几项新的倡议提供资金。欧盟最近启动了大数据公私论坛(称为BIG Project),与学者、公司和其他利益攸关方接触,为大数据研究和创新制定明确的战略。该项目的成果将作为Horizon 2020的投入,该倡议旨在确保欧洲的全球竞争力,并在欧洲创造新的增长和就业机会(BIG,2014年;欧盟委员会,2014年)。2012年,美国政府宣布为“大数据研究和开发计划”提供2亿美元的资金,该计划旨在从科学与工程、国家安全和教学领域的大量复杂数据集合中获得洞察力(Kalil,2012)。美国国家安全局正在犹他州建设一个数据中心,以处理他们通过互联网收集的信息。与这项发展相关的私隐可能会受到一些关注,因为这可能会导致收集个人的个人数据,如互联网访问历史、私人通信、信用卡使用情况和健康记录等。
预计在犹他州的设施处理(不存储)的数据量很可能是“yottabytes”-国际单位制(SI)中最大的单位前缀,并于1991年增加。一个yotabyte(前缀为yb)相当于1024个字节。表1列出了正在使用的数据存储单元。千兆字节仍然是硬盘容量最常用的度量标准,但是TB和PB也开始被使用。今天,一个1TB的磁盘驱动器(大约2.5英寸宽)可以装进一台笔记本电脑。令人着迷的是,根据一项估计,在TB大小的驱动器上存储一千兆字节需要100万个城市块大小的数据中心,与美国特拉华州和罗德岛州一样大(维基百科2014c;2014d;Diaz,2010)
这给出了一个概念,即未来几年可能会有多少流量通过互联网,以及政府(和私人组织)意识到这场数据革命的潜在影响所进行的投资(维基百科,2014a)。
根据计算技术行业协会(CompTIA)的数据,2013年,28%的英国公司在使用大数据,36%的公司计划当年的大数据计划,95%的公司认为数据是未来两年成功的关键(raconteur Media,2013年)。他们还报告说,2013年全球IT支出年增长率为5%,而数据增长率为40%。近年来,从在线使用中获得的数据呈现惊人的爆炸性增长。
根据一些估计(IBM,2013):
2012年,全球有14.3亿人访问了一个社交网站;
全球近八分之一的人拥有自己的Facebook主页;
2012年,推特上每天都有100万个新账户;
每月有300万个新博客上线;l 65%的社交媒体用户表示,他们使用它来了解更多关于品牌、产品和服务的信息。
预计在未来几年,组织中收集的数据量将会增长。这可能是由于数据存储和处理能力的效率提高和成本下降、数字技术的传播、从互联网和数字设备获得的数据量以及用于处理的算法的复杂性。这些数据中有很大一部分将在网上产生,这将需要对数据存储设施进行大量投资。最近有报道称,Facebook目前正在瑞典建设一个11个足球场大小的数据中心,并在美国建设另外两个数据中心,以收集和处理他们的数据(Bradbury,2013)。
教育组织对利用大数据和分析的应用程序有相当大的兴趣,预计这一兴趣将在不久的将来上升。然而,为了最大限度地利用大数据,组织应该明确他们到底想要调查什么,以及他们计划如何使用这些信息。我们认为,企业在实施大数据/社交媒体政策时需要考虑以下问题:
1.我们为未来做好准备了吗?
2.这是炒作还是必然?
3.有没有更简单和/或更经济的方法来获得类似的结果?
4.开发内部能力和租用外部资源哪个更好?
5.我们的客户/利益相关者会对这种监控感到满意吗?
6.我们是否需要向持份者宣传我们的政策?如果是,我们有没有这样做?
7.我们的竞争对手的准备情况如何?
8.我们是否遵守数据隐私法?
9.人们的在线行为可以被赋予多少价值?
10.我们是否也在使用传统的信息来源(如访谈和焦点小组)来补充在线指标?
11.我们是否也依赖于人的判断来解释数据(而不仅仅是依靠软件生成的结果)?
12.我们是否与组织内的其他部门合作,制定一项全面的政策?
大数据的应用
大数据如何被用于各个领域的例子很多。虽然这些与教育领域没有直接联系,但它们让我们了解了数据对我们日常生活的影响(raconteur media,2013)。示例包括:
IBM的深雷天气分析软件包:帮助农民知道何时灌溉他们的作物;
SAS:使用大数据识别保险部门的欺诈行为;
英国航空公司的Knowledge Me计划:使用收集的数据更好地洞察其常客的个人偏好和购买模式;
大曼彻斯特交通:使用实时交通信息避免道路拥堵;
美银美林:基于对客户需求的更全面、更全面的理解,为客户创造实用有效的解决方案;
东肯特医院大学NHS基金会信托基金:给予工作人员访问数据的权限,以适应实时变化,例如根据站点间需求的变化在站点之间重新分配医生和护士;
花旗:根据客户行为估计有针对性的预测分析;
英国公共卫生:通过最近宣布的国家癌症数据库,根据患者的实时反应创建高度有针对性的治疗(数据包含1100万条历史记录和每年增加的35万个新条目);
Ocado:递送在线购买的食品杂货。它跟踪车辆位置、驾驶风格和汽油消耗,同时每周递送110万件物品;
荷兰皇家壳牌:每年花费6.5亿GB汇编多个地点的大数据,以便他们能够更准确地预测某个地点是否存在碳氢资源-这可能有助于他们节省钻探成本(一次海上钻探的成本可能高达6500万GB);
埃森哲:通过使用数据和文本挖掘、语义、语言学和句法处理,收集社交媒体分析,用于情感分析;
Facebook:最近开始解码照片(识别人脸和物体)和视频的内容;
苹果:获得了一项专利,可以通过音频窃听来收集体温和心率的数据;
谷歌:调整语言处理中的算法,使其与文化相关(例如,区分美国和英国的习语),并提高其语音识别能力;
Temetra:整理人们在家庭和企业中如何使用天然气和水的信息,每15分钟给他们一次数据,而不是每年的读数;
Modak分析:在2014年4月至5月举行的印度大选期间,挖掘了约18TB的8.1亿选民的数据,这些数据涉及他们的客户–一个政党–的各种人口统计数据,如性别、年龄和经济状况(库尔马纳特,2014年)。
在制定政府政策时使用大数据的一个有趣的应用是Behavioural Insight团队(),该团队由英国政府和Nesta联合拥有,网址为。该组织汇集了一系列相互关联的学术学科(行为经济学、心理学和社会人类学)的数据,以了解个人在实践中如何做出决定,以及他们可能如何对各种选择做出反应,从而使政府能够相应地设计其政策或干预措施。
大数据在教育领域的应用
学校和高等教育中正在产生大量的数据。教育领域的大数据可用于:
了解学生的表现和行为模式;
跟踪学生在整个教育过程中的进展,以便在发现任何异常情况时及时进行干预;
为每个学生开发个性化的内容和教学方法,以便在不羞辱或孤立学生或在同龄人面前让他们难堪的情况下提供补救帮助;
评估学生在标准化测试(即预测性评估)中的表现;
找出哪些教学技巧最适合学生,并提供个性化教学(即诊断性评估);
实时反馈,帮助提高学生成绩;l进行适应性测试;
合并学习管理和课程管理等系统;
整合学生在教室和家里使用的信息通信技术设备,在自带设备(BYOD)等倡议下提供大量有关他们的有用信息;
综合各种数据来源,如课程记录、学生出勤率、班级花名册、课程参与度、学位成就、学科记录和考试成绩,从而能够更有效地管理招生、行政和学术研究;(Hoit,2012;West,2012)。
除了上述应用之外,机构还可以利用数据在测试开发和标记监测等领域进行更全面的研究。他们亦可利用大量数据,而这些数据很可能是透过电脑化评估和其他资讯科技措施,例如电脑化的互动系统来出题而产生的。
大数据教育课程
麦肯锡报告称,到2018年,仅美国就将面临多达19万名具有分析专业知识的人员以及150万名拥有根据大数据分析理解和做出决策的技能的管理人员和分析师的短缺(Manyika等人,2011年)。E-Skills UK3最近为SAS准备的一份报告显示,在接下来的五年里,英国对大数据专业人员的需求年均增长率预计约为18%(相比之下,IT员工的需求增长率为2.5%)。这相当于到2017年每年创造约28,000个就业机会(总计132,000个)(电子技能,2013年)。
英国多所大学都在开设大数据/分析/数据科学/商业智能/营销分析的硕士课程。这些学校包括伦敦大学学院(UCL)、帝国学院、皇家霍洛威大学、谢菲尔德哈勒姆大学、邓迪大学、华威大学、阿斯顿大学和威斯敏斯特大学。
伯恩茅斯大学与SAS合作提供应用数据分析硕士学位。SAS还与伯明翰城市大学(Birmingham City University)合作推出了SAS学生学院,以满足对大数据专家的需求(Shah,2012;Orater,2013)。
在国际上,提供类似课程的大学有新加坡国立大学(与合作)、乔治华盛顿大学、哥伦比亚大学、大数据研究所-弗吉尼亚大学、旧金山大学和纽约大学。该领域的在线课程也由多个机构和MOOC(大规模开放在线课程)提供商提供,如斯坦福大学、加州大学伯克利信息学院、大数据大学、麻省理工学院、Coursera和统计网站(KDnuggets,2014)。牛津大学和哈佛大学正在开办短期专业课程。IBM、SAS、SAP和Google等技术供应商也在该领域开展各种学术项目(Nerney,2013)。
大数据和社交媒体
企业兴旺发达的基础是最大限度地了解他们的客户。因此,对人们在线行为的监控对他们的成功来说变得越来越重要。各组织正在投资收集此类分析,将大数据作为监测社交媒体活动的关键组件,特别是在Facebook、Twitter和LinkedIn等社交网站上。
社交媒体分析是互联网用户行为的综合。有关消费者的网页浏览、网上购物行为、客户反馈和社交网络上的营销研究等数据的可获得性,使组织能够及时和广泛地洞察消费者。因此,机构可根据不同的目标,例如广告及产品推出、宣传及品牌管理、提升客户忠诚度、为客户提供个性化服务、密切留意市场趋势及竞争对手、尽量减低风险、节省成本及全面拓展业务等,集中市场情报策略。
应用于社交媒体的大数据现象正在推动一个名为“情绪分析”的新的、不断发展的研究领域的发展。它的目的是意识到人们在日常生活中说了什么或分享了什么。企业通过挖掘这些信息来了解他们的客户,并相应地改进他们的运营。教育机构还可以“倾听”学生的意见,进一步了解他们的看法。利用学生在社交网站上的活动,情绪分析提供了一个有用的工具,可以收集关于他们在线行为的信息,最重要的是,他们对教育系统不同方面的反馈,如大学招生过程、学历特点、考试和他们的抱负。
组织可以将这些信息提供给制定他们的营销战略。这可以通过多种方式来实现,例如瞄准学生在线活跃度低于预期的国家/地区,根据在线论坛上的讨论监控他们的考试体验,了解他们的品牌对学生意味着什么,以及获得对新产品的反馈。
工具和指标
更多来源和形式的在线数据的可获得性也导致了新工具的开发,以获取信息并产生关于网站可见性的衡量标准。可以收集诸如网站访问者所在的国家/城市、他们正在使用的网络浏览器、他们用来搜索网站的关键字以及他们在访问特定网站之前和之后访问过的网页之类的度量。下面介绍了一些这样的指标。
网站排名
可以对网站进行排名,以估计某个网站在指定时间段(例如,六个月或一年)内相对于所有其他网站的受欢迎程度。排名由和等工具提供。排名越低,网站的受欢迎程度越高(例如,Google.com的排名为1,然后是Facebook.com和YouTube.com)。这些排名可以被组织用来评估他们网站的总体受欢迎程度,以及与他们的竞争对手相比的受欢迎程度。图1显示了两个网站 ation.gov.uk和的排名比较。英国,2013年11月至2014年5月。
在线流量分析
在线工具,如Google Analytics和,以表格和交互式图形的形式提供网站的流量指标,用户可以定制。有些工具还提供以电子表格形式收集的数据,组织可以使用这些数据来生成自己的图表。提供的一些衡量标准包括:在特定时间段内访问网站的总次数、独立访问者的数量、浏览的网页总数、每次访问中查看的网页的平均数量、平均访问持续时间以及跳出率,即单页访问的百分比(即用户从第一个页面离开网站而没有继续查看网站内的其他页面的访问)。一般来说,跳出率越低,网站吸引访问者兴趣的能力越强。50%的弹跳率被认为是平均值(维基百科,2014b)。所有这些指标都有助于组织更详细地了解他们网站的访问者,这些访问者可以用来定位他们的产品和服务。这些指标还允许识别哪些网站部分受访问者欢迎,哪些不受欢迎,这反过来可以帮助组织改进他们的网站。
社交媒体监控
组织可以通过Facebook、Twitter、LinkedIn、YouTube和博客等社交媒体网站与客户保持定期联系。组织还可以使用Yammer等工具与员工和其他利益相关者(例如学生、客户、外部顾问)进行互动,Yammer是一个私有社交网络,可帮助跨部门、地点和业务应用进行协作。
组织还可以监控新闻,并找出在线对话中的关键贡献者是谁。他们可以衡量其活动的结果,并监控潜在的问题。培训提供者可以使用这样的网站监控工具来帮助他们了解和提高培训课程的覆盖面。企业可以从了解其在线用户之间的互连中受益。
使用一些提供基本指标的监控工具是免费的。然而,大多数真正能帮助企业的服务可能非常昂贵,每月从几百英镑到几千英镑不等。因此,对于企业而言,从战略上规划他们对在线监控工具的要求和期望是很重要的。这可能不是一件容易的事情,因为社交媒体是一个变化非常快的新领域。此外,这一领域的服务提供商数量正在快速增长,可能很难找到可靠的提供商。在选择最合适的解决方案之前,可能需要试用一些工具。并不是所有的工具都能满足每个组织的要求。这些工具生成的报告应该易于解释,并且物有所值。
社交媒体监控工具
一些流行的社交媒体监控工具有:Yomego,Ubervu,HootSuite和VOVUS。表2和表3给出了社交媒体经理可能会觉得有用的其他工具。表2列出了几个可用于从用户自己的网站产生洞察力的网络分析报告工具。数据使用可通过仪表板自定义的图形和表格进行可视化呈现。表3提供了网络流量估计服务,帮助收集网站接收的流量。
虽然这类数据可能不完全准确,但对于市场研究来说,获得一个整体情况是非常有用的。
结论
数据正在快速改变我们的世界。这一事实是不可否认的。我们买什么,吃什么,我们如何沟通,我们如何被管理,我们如何生活,都会受到数据使用的影响。然而,需要注意的是,在日常生活中使用数据并不是一个新概念。古代文明通过根据先前记录的数据预测行星运动来设计他们的日历。最近,数字和电信技术的进步导致了可用数据量的爆炸性增长。世界从未如此紧密相连。每个使用互联网、电话或信用卡的人都会留下一系列信息,这些信息可以被组织用来预测他们的行为并做出相应的调整。任何支付公用事业账单、提交纳税申报表或以某种方式向政府登记(选举登记处、医疗服务等)的人都是如此。大数据还被用于政府倡议以及所有研究领域,包括卫生、经济、制造、国防、安全和教育。
组织应仔细规划其大数据和社交媒体政策,并将目光放在长远的角度。由于这一领域的炒作,公司似乎急于收集大量的文本和非文本数据。然而,他们收集的数据不一定都是有意义的或必需的。从本质上讲,大数据意味着将来自不同来源的数据组合在一起。有一种风险是,积累非常嘈杂的数据并弄清楚它的意义可能需要比它创造的回报更多的资源。组织还需要意识到雇佣“大数据”科学家的成本越来越高。因此,最好从一开始就进行成本效益分析。事实证明,数据政策不成功的风险可能会让一个组织付出高昂的代价-无论是对其资产负债表还是对其品牌都是如此。
学校和教育组织拥有大量关于学生的数据。这可能包括总结性或诊断性评估中的传记信息(如社会经济地位和种族)和表现历史(分数/成绩/教师观察)。诸如基于计算机的评估之类的应用程序允许收集和分析更多的数据来源,例如考生在每个问题上花费的时间。这有助于更全面地了解学生的表现,可以在课堂上使用,以便进行更有针对性和更及时的干预。类似地,在线批改试卷使授予机构可以获得更多(当然也更容易获得)的数据,用于监控评卷和评估其考试。研究人员和企业可能期待数据的一些新的和创新的应用,以及更精细的统计方法来分析复杂的数据。
———END———
限 时 特 惠: 本站每日持续更新海量各大内部创业教程,一年会员只需98元,全站资源免费下载 点击查看详情
站 长 微 信: wxii2p22