学员背景
L同学
本科背景
复旦大学 会计
背提项目
指南者留学商业分析项目实战-基于电商大数据的新零食市场研究
01 契机背景
我是一名大四的本科生,在大三寒假参加了指南者留学的商业分析背景提升项目。通过此次经历,我不仅学到了许多知识与技能,而且还使我能够更好地为今后的求职与留学做好准备。那么,首先我将谈一谈我为什么选择指南者的商业分析背景提升项目。
其一是兴趣使然。
在大二的我眼中,商业分析尚且是一个陌生、神秘而又引人遐思的词汇。以我有限的生活经验,我已然对于网络时代数据体量的巨大和瞬息万变的程度有所体悟,我也进而感受到在这纷繁复杂的数据背后暗藏的宝贵信息与前沿洞察。当时的我猜想,这个抽丝剥茧的过程一定是华丽而又精妙的。由此,我对于分析现实事物,基于数据得出结论的过程非常好奇,同时也由衷地认可这样一种当时的我还接触甚少的思维方式。而正好是指南者留学的背提项给予了我这样的一个机会,让我对商业分析有了一定的了解和体验,完成了认知上的祛魅。
其二,是为了提升技能,增强个人综合实力。
当时我也留意到,许多实习岗位的JD当中,能用python进行基础的数据处理是一个加分项目。同时我也早有耳闻,职场上的前辈们使用python实现各种各样的实用功能,如数据清洗,相关性分析,批量建立文件夹并命名等等。由此,我萌生了提升编程能力的想法。当然,当时的我还非常欠缺这方面的知识。虽然学校有python课程,但我还没能找到机会修读。于是,指南者留学的商业分析项目便成了我的最佳选择。我主要是想借着参加项目的机会,提早接触python,熟悉编程语言,并且通过项目实战增强实践经验,夯实编程基础,进而帮助我在职场取得优势。而指南者的背提项目也确实帮助我做到了这一点。
其三,是为了在留学申请的时候能够多一条相关的经历。
由于当时我还没有确定具体的申请方向,但是商业分析的能力是所有商科专业和学校都比较看重的一方面。因此,我针对这一背提项目进行了一些了解,毕竟,谁不想以一种性价比较高的方式提升自己的专业素养,从而在多个专业的申请当中都能发挥效用呢?由于以上种种原因,我最终选择了参加该背提项目,也确实收获颇多。
02 项目过程及收获
接下来,我就具体谈谈我的项目经历以及收获吧。
项目分为两个部分:
首先是通过录播课程学习python基础(包括Numpy库、Matplotlib库、Pandas库、statsmodel库等),SQL基础,以及商业分析的基本逻辑。
虽然之前没有接触过编程,但是通过以上课程,我快速掌握了利用python对真实数据进行清洗和整理的方法。课程中王老师清晰地讲解每一个功能的代码实现,有非常多的例子帮助我理解课程内容,每节课都干货满满。
在学习过程中,每学完一个板块,王老师都会和我开一次腾讯会议,解决我的疑惑和问题,这也帮助我更好地领会知识,学到技能。每一章节结束,都会有一些课后作业来巩固所学知识,例如练习逻辑回归、多元线性回归的编写,情感得分计算等。这些作业都极大地帮助我打牢了编程基础,为我进行商业分析报告的写作做好了铺垫。
(实践过程展示)
完成课程阶段的学习后就进入了项目实战阶段。项目的主题是基于“每日坚果”概念的新零食市场分析。项目将三只松⿏、沃隆、洽洽等品牌的每⽇坚果及其他零⻝数据作为研究对象,通过研究价格、库存、评分等因素对于产品销量的影响,意图量化“每日坚果”概念在新零食市场的重要性,以及其在消费者心目中的整体印象。
研究过程中,首先我需要对各零食品牌的数据进行清洗。通过使用python中的pandas和numpy模块,我对异常值和缺失值进行填充以及删除;接着,我运用数组、构建函数等方法对数据进行变换,完成了各种数据处理的工作。例如:对商品价格进行分箱,创建价格等级列,将价格转换为区间形式,提取发货地址中的发货城市,合并不同表格中的数据等功能。
(缺失值处理)
(将区间价格转换为平均价格)
(价格分箱)
(提取发货地址中的城市)
接着,我通过导入Matplotlib模块,完成皮尔森相关性热力图的绘制,以此直观地展示各变量之间的相关性程度,并计算各变量之间的相关系数;之后,我又运用plt语句,绘制各变量的密度分布图,以对其进行描述性统计,呈现其分布特征。这一可视化过程也使我更深地领略到商业分析的生动形象之处。
(绘制皮尔森-相关系数热力图)
(绘制各变量密度分布图)
在对于商品自身的价格、库存、收藏数等属性变量进行处理后,我又利用百度智能云aip模块,针对用户给出的商品评论进行自然语言处理。这一过程的逻辑是:算法通过识别数千条评论中象征正面情感和负面情绪的词汇以及其占比,对购买此产品的用户态度进行综合评价,由此,计算出该商品的情感得分属性。这一过程让我实实在在地体会到人工智能机器学习算法的精妙以及神奇,也让我对商业分析愈发产生了兴趣。
(情感得分数据)
最后,在剔除非数值型变量后,我针对剩余的12个数值型变量进行多元线性回归。由于生成的多元线性回归模型还不够概括,我在王老师的指导下了解到还需要对数据进行PCA降维,进行主成分分析以抽取出几个最能概括所有数据的影响因子。因此,我又通过sklearn中的PCA模块,计算出各变量的累计贡献率;通过这一数值,我又确定了主成分的数量,即需要至少几个变量才能够解释绝大部分(95%以上)的数据,由此我最终提炼出三个最主要的影响因子,完成了代码的编写,并得出结论:在商品的各项属性中,商品吸引和商品库是对商品销量影响最大的两个因素,而对商品销量几乎没有影响的是商品价格、商品折扣、店铺各项评分以及商品的情感得分。这可能是由于零食市场中品牌多样、价格集中偏低的特性决定了价格并非消费者决定购买的主要因素;同时,各电商店铺的平均评分差异很小,故各店铺只需保持一个平均水准,保证自己不处于平均线以下即可。
(PCA降维与回归)
最终,在整套代码的编写完成后,我还需要在此基础上完成了一篇严谨的研究报告。相比于以往在校内完成的偏理论性的论文及科研,这份含有量化以及编程的研究成果更具含金量,同时,对个人能力的培养及提升也更明显。
(研究报告截图)
当然,该研究的过程也并非一帆风顺。比如,某次作业我的代码始终无法跑通,起先我找了很久都没有发现为什么会报错。当时问了王老师,王老师鼓励我说再仔细看一遍就能发现问题。我一开始尚且有些不耐烦,可是沉下心来我真的找到了问题,原来是漏写了一个符号。这次经历让我意识到写代码细致入微的重要性,也让我养成了自查的习惯,之后再也没有在同样的问题上出错。
除此以外,我在项目中期因病入院一月余,是王老师始终不懈地督促我,关心我的状况,而且并没有因为我的项目因故拖延而区别对待,才使我顺利克服困难,完成了项目。
在我备考GRE和托福而耽误项目进度时,王老师也给予了非常大的理解。这些都给我带来了一定的支持和安慰。
03 背景提升与申请
最后,我将以一个正在申请的学生的身份再来谈谈这一项目带给我的收获。
其一,指南者留学商业分析背提项目让我更加清楚、明晰了自身的兴趣。在此之前,我并没有认真考虑过将商业分析作为我的求职以及申请方向,因为我始终觉得那是一个相对困难,需要很高的数学基础的领域。
但通过这一项目,我对于今后自己的职业生涯有了更详细的规划,同时,我也考虑申请开设更多数据分析课程的会计专业的院校。因为我本身是会计专业,数据分析的技能可以很好地与财务融合,帮助我在求职过程中脱颖而出。同时,大数据也是当今时代的风口所在。这对我来说无疑是非常重大的影响之一。
其二,指南者商业分析背景提升项目也提升了我的能力,充实了我的个人履历,增强了我的个人竞争力。我已经将这段经历写在了简历当中,这很好地帮助我贴合了一些实习岗位中对于python和数据分析能力的要求,并在求职面试的过程中受到了对方的询问。当然,这也帮助我找到了相关的实习。
其三,这激发了我的学习能力和求知欲。此前,我一直对自己的学习能力有些不自信,但这次商业分析背提项目中,王老师细致入微的讲解和耐心认真的批阅使我相信编程并不是什么特别高不可攀的存在,由此,我也对于生活中学习中遇到的各种难题有了更强大的信心和勇气去积极地面对。
总结而言,我认为指南者的商业分析项目值得参加。其一,是课程设置科学合理:在正式着手实践之前,足足六个章节的学习内容使我作为一个从未接触过python的小白也能较快地上手,把握商业分析的基础逻辑,并指导我更好地开展后续的个人任务;其二,是课程内容难度适中,老师耐心引导,非常适合零基础的同学进行学习。其三,项目阶段也充分让学生发挥主观能动性,在撰写报告时,我按照自己的想法补充了行业背景的分析内容。其四,项目时间的安排也相对灵活,弹性,使我能够兼顾标化考试,实习和商业分析项目。整体上,我向各位同学推荐这一背提项目,希望所有同学都能从中收获到自己所想和所求,达到自己的目标~