发布时间:2023-03-06 点此:17次
大数据专业--新时代的“石油”
数字时代瞬息万变,层出不穷的数字科技正在快速改变我们的生活。如同蒸汽时代的蒸汽机、电气时代的发电机、信息时代的计算机和互联网,人工智能正成为推动人类进入智能时代的决定性力量。
不管是阿尔法狗战胜人类围棋世界冠军、无人超市开店,还是自动驾驶汽车不断“上路”,人工智能已悄然来到人们身边。什么是人工智能?创新工场董事长兼首席执行官李开复的著作《人工智能》中给予了精辟的陈述——深度学习+大数据=AI(人工智能)
就业前景
据预测,到21世纪30年代中期,仅在新西兰就将有24%的工作实现自动化,并将带来许多富有开创性的新兴职业选择。
为了应对席卷而来的数字化浪潮,新西兰政府在7月份颁布了The Digital Inclusion Blueprint,旨在促进新西兰全社会都能够参与到新西兰的数字建设中去,并且能从新西兰的数字科技发展中获益。
这也就意味着在新西兰实行将所有公民纳入数字化未来的指导方针下,对数据挖掘、分析与应用方面的人才需求将不断增长,数据科学专业的毕业生将拥有非常不错的职业前景。
坎特伯雷大学
Master of Applied Data Science
(应用数据科学硕士)
推荐指数 *****
推荐理由
课程设计适合来自不同背景的学生
课程学制短1年,费用相对便宜
课程涉及编程、Python,R、SQL,Database...含金量高
暑期的项目或者实习经验
国际生学费
2020年
$41,250
湖南出国留学云老师介绍,MADS专业顺应时代需求,非常受欢迎,每年甚至每个学期的学生数量都在大幅增长,但是每年学费涨幅稳定,相对其它世界同等级一流高校学费很有竞争力,想要申请同学的建议尽早准备。
注意:此学费不包含student levy fee,每年1000刀左右,书本费自理(下文会详细介绍所需要的学习资料),如果需要在N年内修完所有课程,那么必须支付的费用即为学费+(student levy fee*N)。
开学时间
开学季有两次,分别为2月和7月
根据经验,学姐比较建议首选二月份入学:
原因与学校课程设置有关,如2019年的课程设置:STAT 448 Big Data这门课在第一个学期并没有开课,STAT 462 Data Mining在第一学期有开课,而Data Mining的内容对学习Big Data有着很大的帮助,因此二月份入学的学生会更加适应。但是对于七月入读的学生,建议入学前多解统计学等Data Mining相关知识,以便做好充分准备。
入学要求
学术要求:
本科学位, 最后2年课程平均分不低于B,即:
国内 985 / 211 院校均分不低于75%
其它院校均分不低于80%
语言要求:
雅思 总分6.5,单科不低于6.0
PTE 总分58, 单项不低于50
CCEL EAP2 B+
NZCEL 5级
或同等其他英语要求
专业背景要求:
取得与数据科学相关学位,如生物科学、计算机科学、数字人文、经济学、环境科学、金融学、地理学、地质学、数学、物理学、心理学
具体要求可参见学校官网,以官网为准:https://checkwhatyouneed.canterbury.ac.nz/checkrequirements/postgraduate
学期安排
一般情况下一年分三个学期,以2019年为例:
第一个学期从2月下旬开始,到6月底结束;
第二个学期从7月中旬开始,到11月初结束;
第三个学期是暑期,少数课程以及summer intern多发生在此阶段。
备注:
第1、2学期分别有两周的term break。
第3学期summer intern通常指公司实习或是导师研究项目。
毕业后技能
1. 数据科学领域的前沿知识;
2. 利用数据解决问题,给出solution的能力;
3. 设计、实现数学建模过程;
4. 具备编程能力,包括R和Python及其它技术。
技能包
Python,R, SQL,Database, Spark, Hadoop, MapReduce, Neural Network等等。
就业方向
商务分析师
Business analyst
数据分析师
Data Analyst
大数据解决方案架构师
Big data solutions architect
数据工程师,大数据开发人员
Data engineer, big data developer
数据科学家
Data scientist
技术/项目分析师
Technical / project analyst
数据库协调/管理员
Database coordinator / administrator
信息情报顾问
Intelligence advisor
专业内容概要
MADS专业融合了数学课程(STAT开头),统计学课程(DATA开头),计算机课程(COSC开头),信息系统课程(INFO开头),商科课程(MBIS开头),以及生物学,健康学等课程。
学姐认为其中数学,统计学和计算机课程是重中之重,如果不会编程,那么你无法成为一个优秀的data scientist,如果只会编程但是不懂数学和统计学,那么你永远都是一个码农。
学习内容主要包括数据库的知识扫盲、数学建模、如何用R以及Python,以及大数据和分布式计算,包括Hadoop和Spark,mapReduce算法如何在大数据framework下实现。
需要注意的是,老师会对coding做一定程度的指导,但是更多情况下,需要自己多加练习,以及阅读大量的材料从而提升自己的coding能力。
官网链接:
https://www.canterbury.ac.nz/study/qualifications-and-courses/masters-degrees/master-of-applied-data-science
课程详细介绍
MADS专业的课程一共分为3个部分:
背景课程:DATA401 Statistics统计学,COSC480 Computer Programming计算机编程,以及MBIS 623 Data Management数据管理,如果有这些背景课程的学术背景或者工作背景,可酌情考虑不选择背景课程,因人而异;
必修课以及部分选修课:
DATA 420 Scalable Computing
DIGI 405 Texts, Discourses and Data: the Humanities and Data Science
STAT 462 Data Mining
STAT 448 Big Data
项目/实习:DATA 601(45个学分)
参与现实生活中的数据科学项目,学习和解决问题。学生可以参与学校导师的项目或者自己可以提供实习的机会的公司。因为基督城只有坎大提供数据科学专业,很多公司需要实习生都会联系学校,所以学校会有不少的实习机会推荐。今年暑假,这个很多学生顺利拿到公司带薪实习。
部分课程详细介绍
DATA401 Statistics:统计学基础,包括概率计算,密度分布等统计学基础知识,在后续的必修课程中,比如正态分布,偏态分布将会是处理数据的背景,如果缺乏类似的数学基础背景,后续课程会非常艰难。这门课是大课,与本科生一起上课,所以作为年龄稍大的研究生学生,可能会觉得老师的讲课方式比较偏幼龄化,不过每次上课都会有recording,也可以自己去看recording,或者网上找些资料学习一下,总体来讲,难度系数为2颗星。
COSC480 Computer Programming:主要学习Python编程,每周有作业,提交自己的code验证过关就好,对于没有任何编程经验的学生,建议还是学一下这门课比较好,因为后续的DATA 420 Scalable Computing需要使用大量的Python来完成,如果有Python经验则可以略过这门课程。
MBIS 623 Data Management:主要学习数据库管理,包括如何设计数据库,如何实现(授课使用MySql),以及关系数据库和非关系数据库介绍,这门课作业比较anoying,两次作业,分别要写4000字和3000字的论文,优点是老师讲课风趣。如果有数据库经验,建议略过,后续课程主要用到的是Sql querry。
STAT 462 Data Mining:强烈推荐第一个学期选这个课,2019年上半学期教这门课的老师是Blair Roberston,老师课前准备非常充足,上课条理清晰,数学术语解释到位,及时听取学生反馈意见,课下辅导认真负责,能够给出比较专业的建议,作业设置合理,实验和作业难度稍高,需要一定的时间去理解消化,但是总体来讲,学好这门课会对后续课程有着非常好的积极的影响,比如后续的大数据课程,某种程度上延续了此门课程的某些内容,还有一些选修课程比如General Linear Model也是此课程中的一个小知识点,只是学习深度更深。后续很多课程都会有这门课的影子,所以学习好这门课是小羊学姐的肺腑之言。难度系数4颗星。
这门课的主要内容有:Linear Regression, Logistic Regression, Cross Validation, Bootstrap, Random Forest, K-means clustering, Association Rules等等。
DATA 420 Scalable Computing:主要讲分布式计算,包括Haddop和Spark的Framework以及关键算法MapReduce的实现,每周都有作业和实验,老师给出一些code examples,根据这些code examples来实现其它功能。需要阅读大量的参考资料,课程里面会讲概念比较多,所以理解起来有一定的难度,而且因为结合了编程、hadoop、spark、MapReduce算法、python、甚至JAVA、bash script、pig等多种技术,难度较高,但是老师是有着实际经验的公司老板(老师自己有一个咨询公司),所以会给出比较专业的行业经验,提供多种视角,而且老师很乐意课后答疑,会积极回复学生的邮件,非常干练的一个老师。
选修课程DATA 422 Data Wrangling: 主要是讲数据清洗这个领域,作为data mining的pre-step,其中一个授课老师Tomas澳国立毕业,来UC教书,因为年轻比较好沟通,人也很热心,华人面孔但是不会讲中文,老师技术很好,自己的研究方向是Neural Netowrk,学术内的前沿消息可以找这个老师去打听。
其它的选修课程可到学校官网搜索,链接:https://www.canterbury.ac.nz/study/qualifications-and-courses/masters-degrees/master-of-applied-data-science
关于书本
大部分的课程其实不大需要买教材,原因如下:
老师上课会提供课件以及推荐阅读资料,所有的推荐材料老师都会在UC Learn上post出来,除了课件,实验课所需要的实验指南以及各种信息也都可以在UC Learn上找到,类似于国内的校内网,但是汇聚了所有老师想要分享的资源;
推荐的阅读资料分为几大类:学术期刊,专业书籍,网上一些有用的链接,其中学术期刊以及专业书籍可以在学校图书馆找到,学校图书馆有着非常丰富的藏书资源,包括纸质书和电子书,如果找不到的话,可以提出申请,要求图书馆出资购买,申请很简单,只需要填写想要购买的书籍信息即可,图书馆一般会非常迅速地买好,并通知申请人;
有些教材是免费给学生使用的,老师上课的时候会提供给学生这些免费的教材资源,比如Data Mining的教材是由作者为斯坦福大学,南加州大学的教授们写的一本名为“An Introduction to Statisticla Learning”的书,这本书售价100多刀,但是可以免费作为学术交流使用。