学员背景
Y同学
本科背景
江南大学 化学
背提项目
指南者留学机器学习项目实战
携程智能酒店客房续住预测系统
01 契机背景
自从有留学打算后,我就有积极地与各家留学中介联系,与新东方、启德、金吉列等有过交流并就留学的事宜进行讨论。而指南者留学在我交流过的留学中介中是给我印象最深刻的,没有大而空的言语对话,而是直接把机构的后台数据展现给我看,简单明了地跟我分析了以我的背景能去到什么样的学校,这种坦诚和直接是我选择指南者留学的主要原因。
而且我想在研究生阶段转专业申请,因此相关背景的提升必不可少,指南者留学的签约费用与别家机构相差不多的情况下还包括了背景提升项目,更是性价比极高。综合考虑了种种因素,我最终选择了指南者留学作为申请机构在23fall帮助我的留学申请,并且参加了指南者提供的背景提升服务。
我本科专业为应用化学,但研究生想申请数据科学或者cs相关的专业,可谓跨度极大。但是好在我的数学课程的成绩还不错,如果能有数据科学或者cs相关的项目实战背景辅助,把该项目放在我的CV和PS中,可以很好地给招生官展现我为了转专业做出的努力,申请难度会缩小不少。
02 项目过程及收获
机器学习实战项目确定时间开始后,指导老师梅老师很快就联系到我,约了腾讯会议,给我详细的讲解了本次机器学习实战训练营的安排。
本项目分为两个阶段,首先是长达六周的学习时间作为第一阶段,通过网课+课后作业的形式,向我介绍了python的基础操作,各类数据分析库如pandas,numpy,Matplotlib的使用方法。之前对python语言并不是很熟悉的我,在经过了这几周的系统学习后,已经可以熟练地编写代码对各种数据进行处理了。由于之前没有系统性的学习过python,在刚开始学习的时候我有很多可能在专业人士看起来很匪夷所思的问题,但每次我问梅老师时,他都能及时且很有耐心地帮助我解答我的疑惑。
掌握了必备的编程技能后,便开始学习机器学习算法的理论和实践了。该项目提供的网课清晰有条理地讲解了各种机器学习算法的原理,比如线性回归,随机森林,stacking算法,Kmeans聚类算法等等,并且讲解完原理后,会有配套的实战案例进行算法的讲解和应用。
虽然现在机器学习的模型在python中已经被封装的非常方便了,只需调用其封装好的函数即可,但是对于原理的学习不仅让我明白简单的代码背后运作的真相,还让我在应用的时候更加得心应手。本项目通过理论+实战的方法,让我上完课程后对机器学习的基础算法已经能够形成一个大概的框架,这对于一个本科专业是应用化学的机器学习小白来说,我已经感到非常满意了。
机器学习中为了得到更好的训练模型,有许多超参数需要人为的调整,有很多特征也需要筛选。所以在本次课程中,也包含了调参技巧和特征工程的讲解,让我知道了各种参数的作用,以及如何对特征进行筛选。这么一套第一阶段的课程结束后,可以说我作为一个对机器学习一无所知的化学本科生,已经成功的被带入了机器学习这门学科的大门。
而第二阶段——项目实战阶段就是检验我学习成果的时候了。
我的实战课题是基于机器学习的智慧酒店系统。现如今大数据技术在各行各业得到广泛的应用。如何在酒店运营管理中更有效地利用大数据,高效地管理酒店,成为酒店经营者想要最大化收益需要考虑的重要研究课题。
我的智慧酒店系统根据携程酒店数据如:入住人数、入住时间、是否为老客户、车位需求数、历史取消入住数等,预测客户第二天是否会续住。该系统可以帮助酒店客房安排以及制定相关的营销策划。
在进行该实战课题的时候,首先第一个出现的困难就是面对海量数据无从下手的困境。虽然已经在第一阶段的课程学习过并且在课后作业实践过,但是之前使用的数据大多是规模相对较小和分布较为良好的数据。而现实中的数据大而广,并且在某些方面可以说是杂乱无章,虽然我自认为经过第一阶段的学习已经掌握了数据清洗和预处理的方法,但是首次面对实战数据集还是有点手足无措。
不过从另一方面来说,这正体现了实战课题的合理性,只有亲自动手实践面对,才能把理论与应用真正的结合起来。既然数据太大太杂我解决不了,那我就把这个大问题拆成好几个小问题,一个一个解决就行了。在经过去重,去缺失值,给类别型特征编码,给数据型特征归一化,删除没用的特征等操作后,我终于得到了可以应用于机器学习的数据集了。
得益于python的便捷性,可以较为简单地调用代码进行机器学习模型的搭建。我通过特征工程提取相对重要的特征数据,使用逻辑回归模型、决策树分类模型和随机森林模型应用于数据集进行训练,调整找到最佳参数,最终模型能够以较高准确率(逻辑回归 87%,决策树 83%,随机森林 82%)在测试集上预测客户是否续住。并且最终基于本次项目实战, 完成了一篇实战报告。
(实战报告节选)
这一次机器学习训练营丰富了我的背景经历,作为一个转专业的学生,如果能将这类与申请专业相关性较大的经历体现在文书和CV上,那么我相信比起其他没有相关经历的转专业的同学,能够具有一定的优势。并且对目标专业的学习和经历也能打动招生官,让ta看到申请人对转专业做出的努力,拿到offer的几率也会高一点。
对我个人而言,作为一个化学本科生,能有机会系统性地学习机器学习的理论知识,并且最后完成一个实战项目,拓宽了我的知识面,并且锻炼了我的能力,我对这个机器学习训练营是非常满意的。在这里我也非常感谢指导老师梅老师对我的帮助,任何时候都不厌其烦地回复我那些在内行看起来很奇怪的问题。总的来说本次机器学习训练营真的是收获满满。