文 | 指南者留学学员Ben学长
哥伦比亚大学应用分析硕士(在读)
大家好,我是Ben,本科就读于广东某211院校经济学专业,通过指南者留学申请到了哥伦比亚大学的应用分析学(AA)硕士项目,目前已经念了一学期了。
在等待最终成绩的同时,我也来和大家分享一下这一学期以来的就读体验。
01 从就业到课程
在当今的经济大形势下,不论是较为传统的金融机构,还是趋于紧缩的科技公司,总体上求职情况都不太好。据我所了解,即便是强如CUBS或巴鲁克,获得暑期头部实习资格的比例也不容乐观。
在这样的背景下,综合素质上的竞争就显得格外激烈,其中商科和分析类的岗位竞争模式几乎又是一模一样,都是商业思维+数据能力的范式。
在商科思维方面,大多岗位要求应聘者对市场都一定的洞察力,即便不是金融相关的工作,现在也要求能够读懂财报并提取关键指标进行分析。
而数据分析方面,单纯的excel已经不能完全满足企业对于应聘者的期望,R、tableau、sql等数据分析技能已经成为相当一部分岗位的最低要求,诸如quant、ba等岗位甚至可能要求具备一定的机器学习功底。
从这样的劳动力市场需求看,AA的课程设置并没有如网上说的那般不堪,甚至可以说得上紧贴市场需求。
仅在第一学期且不要求选修课的情况下,学院也按照manage core和tech core相结合进行了课程安排。第一学期主要是5100 Applied Analytics in the Organizational Context、5200 Applied Analytics Framework & Method I、5300 Research Design、5800 Storytelling With Data四门课。
其中5100主要涵盖market、finance等business相关的内容,5200主要教学R的使用,5300囊括了统计、编程、research guidance等偏tech的内容,5800涉及了数据可视化、proposal等business和tech相结合的部分。
因为所有的课程都是以实操为最终目的,所以上课的形式不会过于教条,从最基础的数学推导讲到最终的应用扩展,相反,很多内容大多是直接跳过繁琐的中间过程直接过渡到结论和使用方法,对于那些数学基础不是太好的同学比较友好。
02 课程详情
我认为第一学期最精华的课程便是5200,是充满干货的纯tech课程。从时间跨度上来看,课程的第一周会先统一的进行入门教学,即便从来没有接触过任何编程也能很快上手;经过两周左右的扫盲式学习,课程会由浅入深的展开行业里使用最频繁的模型,从最简单的linear regression到稍显复杂的logit regression,再到更复杂的决策树、随机森林、支持向量机等。
从数据处理的逻辑上来看,课程涵盖了数据预处理(如resample、处理残缺值、subsample等)、模型的选取和比较(如比较AIC、AUC、RSME等关键指标)、模型的参数选取(tuning and ensembling)、结果的展示(interpretation and visualization),每个环节都环环相扣,有助于从整体上提高对数据分析逻辑的把控。
除了日常的作业和考试外,课程的考核还包括了一次Kaggle竞赛实操,要求通过所学的知识进行一次prediction competition,超过650个同学各自为战,最终的排名会直接影响课程最终的分数,很残酷也很刺激。
由于项目里中国学生很多,“卷”的风潮在这个比赛中会体现的淋漓尽致,可能前一天你还处在前10,为自己14.9的rmse沾沾自喜,后一天你就变成300名开外,人均rmse都变成14.8+了,甚至每0.01的rmse的提高就意味着10名以上的位次变动。我前几周14.91的成绩就能进入前1%,到最后14.3的rmse才能勉强挤进前15 (每0.1 rmse的提高可能就意味着模型上质的跨越)。通过这种方式,即使你第一周勉强打出“hello world”,到课程结束你也可以自信的在简历里说出熟练掌握各种机器学习的技能了。
5300也是属于一门项目较为核心的课程,主要内容涉及概率论、统计和少量编程。前几周会从最基础的条件概率、样本度量讲起,等积累一定的基础知识后,会要求你利用所学的知识完成一篇research proposal。虽然不要求去搜集数据进行试验,但也会要求完成文献综述、假设检验,预期、数据模拟等工作,算是一定程度上体现了一个完整的学术研究或案头研究的全流程。
除此之外,课程会迫使你不断在实际情景中熟练自己R语言的熟练度,由于5300并不是一门编程课,所以在需要用R语言对数据进行情景模拟、统计检验时,教授都会默认所有人都很熟练了,并不会在编程方面进行展开,如果你本身编程能力有待提高,学习时则会很痛苦。
5100和5800就属于很商科的课程了。5100主要侧重于商业直觉的培养,会涉及到金融、市场、管理等多学科的知识,而5800则更侧重于真实的商业情景模拟。单看这两门课,课程内容都不会很难,但要想学的很精,则需要下不少的功夫。
以5800为例,课程主要教授的就是数据的可视化和解译,乍一听就是用excel都能完成的工作,但如何在短时间内精准的传达出数据结果、向非技术性听众表明技术分析过程,则需要较为牢固的数据逻辑和理性分析能力。合理安排图表中的颜色、图像的形态对比、选取合适的图表类型,都需要一定的巧思。而这些细节,在真正的面试和工作中就显得尤为关键。
在纽约这样竞争激烈的大环境里,同一岗位上所有人的硬实力都不会相差很大,而决定一个人去留的,往往就是这些小细节。同样的方法,同样的技术操作,表达的越简练、精确,工作效率和沟通效率越高,也越可能获得更好的工作机会。
03 总结
我本身并不是一个喜欢埋头苦干的人,固然受不了干货满满的纯学术型项目的苦。AA这样的课程安排和模式反而很适合我自身的发展,使我既不用担心课程过难而担负过多学业压力,又可以利用空闲时间进行课堂之外的积累。
或许这就是一些人眼中的“水课”,但浅尝辄止可以给我个人更多的自主选择空间。倘若只是想做一名咨询师、分析师,能充分理解统计工具的使用场景和使用方法即可满足职业发展的需求。花费过多时间从数学式上完全理解计量工具的方法并不适用于所有人。由此,省下一定的时间,在自己觉得更欠缺的地方合理安排精力,未尝不是一种更优解。