Google · Data Scientist · Product Analyst · Interview · Virtual Onsite
作为世界顶尖的科技公司之一,谷歌拥有多款超过10亿活跃用户的产品。拿搜索举例,根据2019的数据统计,谷歌平均每秒处理超过40,000个搜索查询,相当于每天35亿次的搜索量。应对如此巨大的数据量,谷歌也专门设有数据科学团队,从中挖掘宝贵的信息,为公司提供战略支持。
那么,数据科学家在谷歌到底是一个怎样的角色?想要面试谷歌数据科学岗位,要如何做准备?
在Google,数据科学家是什么角色?
在谷歌,和数据相关的岗位有很多,包括数据科学家、机器学习工程师、产品分析师等等。
其中,数据科学家的工作主要以定量分析为主,利用分析、机器学习理论以及统计学概念和方法来确定产品开发方向、改善用户体验。
在不同的团队,数据科学家的工作侧重点也有所不同。比如在Search Ads,数据科学家主要负责设计和分析测试实验,以了解系统更改的影响并提供建议。同时与分析师和软件工程师合作研究核心算法,以改善客户体验。
Google数据科学岗位面试流程
谷歌的面试非常标准化,主要由Recruiter电话面试、技术面试和Onsite三部分组成。由于疫情的影响,目前onsite已经改成了虚拟面试(VO)。
Recruiter电面(30min左右)
在这轮面试中,recruiter会和你阐述关于该职位的细节。同时,他/她也会进一步了解你的兴趣和目标,与公司文化、价值观的契合程度,以便将你安置在不同团队。
技术面试(45min左右)
技术面试将通过Google Hangouts进行,该轮面试由数据科学家或招聘主管作为面试官主导进行。面试内容包括实验设计,统计、coding等各方面的技术问题。同时,面试官也会针对你过去的研究经验或工作经验进行技术讨论。
问题举例
- A statistics question (computational stats) or causal inference question
- Coding question on a shared code editor
- Describe a past data science based project.
- What problems did you encounter? What approach would you have used if the data was different?
Virtual Onsite(原onsite)
和传统的onsite一样,谷歌的VO也是分5轮进行,不过VO不再有传统onsite中包含的lunch break环节。
在每轮面试中,你将分别和一位面试官进行1v1的交流,长度也在45min左右。其中既包括技术面试,也涉及BQ方面的问题。
- 技术面试:
技术面试将由不同的面试官从机器学习、统计概率、产品、编程等不同的维度对求职者进行提问。
问题举例
Machine Learning:
- What is the difference between K-mean and EM?
- Why use feature selection? If two predictors are highly correlated, what is the effect on the coefficients in the logistic regression? What are the confidence intervals of the coefficients?
Statistics & Probality:
- For a sample size of N, the margin of error is 3. How many more samples do we need for the margin of error to hit 0.3?
- What is the assumption of error in linear regression?
- How can you tell if a given coin is biased?
Product & Business:
- How would you detect inappropriate content on Youtube?
- How do you test if a new feature has increased engagement in Google's ecosystem?
- If the outcome of an experiment results in one group clicking 5% more than the other, is that a good result?
Programming:
- Write a function to generate N samples from a normal distribution and plot the histogram.
- BQ面试:
BQ问题有可能平均分散在各轮面试中,也有拎出来作为单独的一轮。在准备BQ时,建议大家重点关注谷歌的四个Behavior要点:General cognitive ability, Leadership, Googleyness, Role-related knowledge,面试的时候尽量将自己的符合公司文化的那一面展现出来。
Google数据科学岗位面试Tips
谷歌DS的很多面试题都是基于自家产品的真实情境。面试前,求职者可以对谷歌的一系列产品做好research,提前设想一下可以如何改进产品或测试产品。
我们前面提到过,谷歌的数据科学家岗位侧重量化分析,因此在面试考察时也很重视统计&概率方面的问题,大家在面试前要做好充足的准备。
是的,数据岗位也是要考coding的!
近年来谷歌对于BQ越来越重视,这也是在你技术关达标后,最终是否能拿到offer的关键因素,重要性不容小觑。
来Offer【人工智能与数据科学强化课程】12月2日,免费试听 点击了解课程学详情:https://www.laioffer.com/zh/course/ai-and-data-engineering/