新闻中心
数据分析面试(数据分析面试经验)
一.自我介绍
建议两分钟以内,简单说一下姓名学历专业,之前的工作经验以及为什么应聘这个岗位,重点挑选符合岗位招聘jd的部分说明。二.简历环节
项目部分:项目背景-项目目的-项目流程-项目实现过程-项目结果
整个项目的环节一定要能够清楚大方自信的表达,一般情况下面试官不会挨个或者仔细的盘问你得项目,因为你项目中涉及到的东西他也不一定了解,所以他会重点提问与自己公司业务相关或者自己了解的地方,那么在面试前最好要做下功课,了解应聘公司的行业性质,主要业务类型,可在(看准,脉脉)等平台参考其他应聘者分享的面经。当你分享自己项目经验时,尽可能逻辑清晰,有理有据的表达,比如:你是如何将业务问题转化为你所选择的这个模型问题,为什么选择这个模型,使用它最终实现了怎样的结果,如何评价这个模型的好坏,你怎么知道最后出来的结果符合你的要求,模型效果不如预期你会采取什么办法,怎样得出的数据分析结论,以及在这个项目过程中遇到怎样得困难,举例说明。
工作经验部分(针对有工作经验的同学):当你已经有了工作经验,面试官往往会更注重你对业务的理解和实际工作项目的落实,完成情况。因为招聘一个有工作经验的人,他会希望你是直接能帮他干活的人,很多简历中花里胡哨的内容他不会重点关注,他关注的是:你的技能,工具使用情况是否满足用人要求,以及你过去的工作内容做了什么事情,有怎样的成果。如果面试官针对自己公司的某一业务来提问,而你之前并没有接触过,此时在你说完这一方面目前没有接触过之后,要把你了解到的哪怕是相关的东西表达出来,将重点引到你会的内容上,而不是他问的问题你不会只简单交代不会就不说话了。
三.笔试部分
Excel题目
1.数据透视表,vlookup,match,countif,sumif等函数,要去练习落实,知道每个参数的意思。
Sql题目
1.sql优化(围绕尽量使用索引,避免全表扫描,节省资源,提高执行效率具体具体几条说明即可)
2.行转列(case when)
3.窗口函数(row_number/rank/dense_rank要知道具体区别及使用)
4.时间函数表连接union和union all区别,where和having区别sql部分基本每次我遇到的笔试题就这些,一定要自己去刷题,建表,跑出结果来,如果平常不常用到,很多只是你以为你会了!!!
Python题目
一般python考的不多,常用的几个库,pandas,numpy,matplotlib,如果有笔试考核基本题目出在pandas文件导入,读取(csv,excel等格式都要会)
1.Pandas中的主要数据结构是哪两种:Series和DataFrame
2.iloc和loc区别
3.groupby,merge的用法
4.处理日期,时间类型数据(datatime用法等)
5.简单作图可视化可视化部分一般除了excel外还要熟练掌握一门bi工具,如tableau,power bi以及国内的帆软,使用公司也越来越多。另外也可用python作图。
算法问题
所有简历中项目涉及的算法模型,一定要知道模型的类别,应用场景,评估指标,底层原理(知道大体即可),优缺点以及如何调优。
1.模型分为哪几种:一般回答监督模型和非监督模型即可,半监督模型可不说
2.常见的分类模型有哪些
3.非监督模型你知道什么
4.分类算法有哪些评估指标
5.异常值,缺失值用模型可以怎么处理
6.聚类包括哪几种,具体区别什么
7.决策树分为哪几种,具体区别什么
8.对集成学习算法有哪些了解
9.过拟合,欠拟合怎么解决
10.回归分析,时间序列分析,主成分分析等分析方法,应用场景
11.归一化和标准化区别
12.特征工程手段有哪些
13.什么时候需要标准化
14.逻辑回归为什么使用log loss而不是平方差loss
业务思维题费米问题:
1.如估计今年新生儿数量(可用公式化思维分析)针对某个指标下降怎么分析:如次日留存率下降5%(首先可采用两层模型人群画像和人群转化,对用户细分,计算每个维护下的次日留存率,其次可从内外部因素分析,外部采用pest分析方法,内部swot分析方法,4P营销理论等角度具体分析),所有指标类的问题都可套用,但是不要用的太死,结合相关指标分析。
2.A/B test是什么,怎么使用能简单说明吗
3.对于用户画像你有什么理解
4.RFM模型分为几层,根据什么来对用户细分的
四. 离职原因
在实事求是的基础上,不要太官方(渴望学习),不要太离谱(如不想加班),具体说明原因即可。 五. 你还有什么要问我的吗 提前准备几个问题,一般问一下团队架构,团队规模,岗位工作职责,是否有出差情况等,结合自身所需来问,最好不要在面试环节就问薪资福利等问题,面试通过后,这方面会有hr来具体沟通。