学员背景
L同学
本科背景
兰州大学 计算机科学与技术
GPA:85.44 托福:98
录取学校(2022年秋季入学)
香港中文大学(深圳) 数据科学
申请时间:2021.11.15
面试通知:2021.12.28
面试时间:2022.01.05
录取时间:2022.01.20
我本科所学的专业是计算机科学与技术(数据科学方向),也是兰州大学开办这个专业后的第一届学生,在就读过程中,我遇到了很多未曾料想过的机会、问题与遗憾,当然更多的还是各种深浅不一、奇形怪状的坑。
现在回想起来,如果有人在我入学伊始就能为我指点一下努力的方向,大学四年的收获也一定会更加充实。因此,我想和各位希望在数据科学这一新型领域进一步学习的同学们,特别是从留学申请的角度,分享一下自己的观点和经验。
在大三之前,我并没有特别的明确自己在毕业后是准备工作、国内读研还是留学,因此也参加了很多不同的比赛、实习、科研等活动,有些经历对于留学的帮助很大,还有一些则纯属浪费时间。
主要经历:
- 竞赛
Kaggle 银牌 × 1
IEEE Radar Conference 举办的人体活动雷达信号分类比赛第一名
- 科研 & 论文
校内:主题为旅游业与大数据,EI会议2作
校外:上述比赛成果在 IEEE Radar Conference 发表论文一篇
国家级大学生创新创业训练计划
- 课程设计
云计算与大数据课程设计 - 基于 Spark 与 LightGBM 的脉冲星甄别模型
接下来,我会根据自己的经历,总结一些心得来供大家参考。
科研
找学校里的老师“水”一篇论文
本科阶段的科研产出很难说有多么高的质量,但是在留学申请时一篇水EI就能拉开你和其他人的距离。我在大二时找到了学院里的一位老师,正好他有一篇论文的数据需要找人帮忙处理,我也就懵懵懂懂的参加了第一次科研并且发表了论文。
数据科学领域的科研项目还是比较好发文章的,尤其是和其他学科相交叉的项目,大家可以多留心本院或者其他院教授有没有正在开展一些和数据科学相关的项目。另外建议大家在大二就参加科研,因为文章的投稿和发表可能还需要半年左右的时间,要留心申请之前文章是不是能被接收。
国家级大学生创新创业训练计划
我参与的国创项目的题目是关于机器学习在金融领域的应用,和数据科学的关联程度比较高。国创作为一种上限很高,下限也不低的项目,我认为还是非常值得参加,一项成功的国创如果和导师合作紧密,也有很大的概率得到一些科研产出,如果只是水了过去写在简历上也不会成为减分项。
但是,国创涉及到大量的行政和非学术相关的活动,比如申报、开题&结题报告,甚至经费报销等等,会占用大量的时间,因此不建议大家以组长的身份参加,最好是以组员的身份,把和学术无关的内容交给一个认真负责的同学就好。
比赛
和数据科学无关的比赛
目前国内学校的数据科学专业大概率是在信息学院或计算机学院等下属开展,这些学院一般都有比较悠久的比赛传统,但是一些CS相关的比赛在很大程度上用处不大,比如蓝桥杯等编程比赛、美国大学生数学建模等数学建模竞赛。这些比赛在国外的认可度很差、而且准备时间和参赛成本又很高,非常不建议参加。ACM等国际认可的CS类比赛虽然要好一些,但是远不如把时间放在专门的DS比赛上。
和数据科学相关的比赛
Kaggle 作为最著名的数据科学比赛平台,每个数据科学专业的学生都不可错过。大家可以寻找一些机器学习而非深度学习的比赛作为开始,从探索性数据分析到数据预处理,从模型调优到结果评估,完整地体验一次数据科学家的工作流程。
奖牌很难一蹴而就,但是随着大家经验的增长一定会有收获,而一枚Kaggle奖牌也可以为大家在数据科学相关专业的申请上提供极大的帮助。大家可以考虑指南者提供的Kaggle相关项目作为入门,但是尽量不要把类似的经历写进简历,毕竟奖牌才是实力的证明,复现别人的代码写在简历上意义不大。
另外,还有一些学术会议会举办一些和数据科学相关的比赛,也非常值得参与,因为此类比赛的solution可以很容易地写成一篇论文在会议上发表。我的高中同学在大三时找我参加了一个由IEEE Rader Conference所举办的比赛,内容是人体活动的雷达信号分类。我在前面的科研环节也有提到,数据科学在交叉学科方面很容易得到不错的成果。我们将比赛的问题转换成了使用深度学习对图像进行分类,很容易就把准确率在这个数据集上刷到了世界第一并发表了论文,并且进入了 Student best paper 的 Final list。
实习
目前的申请竞争十分激烈,实习经历也从之前的“选修”变成了“必修”。在选择实习的公司时,自然是互联网外企和大厂优先,但目前实习机会的竞争也是越来越卷,在没有大厂可选的情况下,大家可以考虑中小厂的对口岗位(数据科学家、机器\深度学习工程师、数据分析师、大数据开发等岗位),如果能够完整地在实习期间经历一次数据科学项目,对于简历也很有帮助。
特别要注意的是,实习最好可以在大二完成,因为大三还要面临语言成绩、选校、文书写作等很多步骤,大三暑假不一定有额外的时间用来实习。
一些锦上添花的项目
奖学金
大家在刷GPA的同时可以研究下学院的评奖评优政策,应该很容易拿到,这里不再赘述。
Coursera之类的网课
平时课业压力不大的话,也可以挑一些专业相关的网课来看,在申请时也可以显示你对所选专业的兴趣和求知欲。比如我选择了数据科学的伦理问题、机器学习在金融领域的应用、机器学习的可解释性等课程来丰富自己的知识面,在面试的时候也确实有被问到相关的问题。
一些课程的大作业
能写进简历的不只是上面说的那些看起来高大上、有证书或者有奖牌的项目,有时候一些课程项目也会是很好的补充,因为并不是所有领域都有对应的比赛或者较低的科研门槛。比如我就把云计算与大数据课程的 Final project 放到了简历上相对靠后的位置,表示我对这个领域也有所接触。
我的申请过程
我在申请时专业和选校都比较明确,因此我需要的并不是一个指路人,而是一个路上的好伙伴,而指南者留学也并非只负责指南,在我最需要帮助的文书写作和简历润色上也为我提供了很大的帮助。
我的文书一共换了三个大版本,来来回回修改了十几个小版本,简历里的项目也是一边写一边换,负责文书和简历的老师感觉比我自己还要认真,体验满分。
再另外为大家介绍下港中深数据科学Msc项目的笔面经:
笔试在编程部分主要是选择题(考察列表、字典、numpy、pandas的一些基本操作)、填空题(代码补全,每次写一两行代码)、还有一道难度不大的算法题,对于本科数据科学的同学来说应该比较简单,注意编程部分是不能在电脑上运行代码的,所以必须要平时多写写,要不然平时写代码靠IDE考试时语法忘了就很吃亏。数学部分是微积分、线性代数和概率论,全是大题,难度比考研数一要简单一些,拿本考研书过一遍基础知识应该就足够了。
我来了学校之后发现今年的题是一个实验室学长出的,挺巧,但是明年如果换了其他人出题无论是题型还是考察的重点肯定会有不一样的地方,不过大家也不用怕,我打听了下,我们这届笔试分数都挺低的。
面试则主要围绕简历,会有两位面试官,一位教授面试专业课和数学、另一位老师聊聊职业规划。看得出来教授是有认真读每个人的简历的,问的问题也都是项目里的问题,足够检查出这个项目水不水,有没有认真做,不过也不会为难大家,如果项目是自己做的就肯定能答上来。另一位老师就和大家聊一聊职业规划,提前准备一下背熟就行。
顺便吐槽下港大数据科学项目的面试,港大的老师居然问我GPA是多少,还问我读的是full time还是part time,英语口音还很重,面试官准备的太不充分了,体验很一般。
上面所列举的每一项内容都无法一蹴而就,很多内容都需要几个月甚至一年的时间跨度来完成,大家更应当早日规划和行动,这样才能在申请季拿出一份充实而有竞争力的简历,为收获梦校的录取创造最大的可能。
最后,也祝每位希望在数据科学领域有所建树的同学,都能在成为Data Scientist的路上越走越远!