一方面我是今年的应届毕业生,也面了几家公司;另一方面我在拿到return offer之后,也部分地参与了我实习所在公司今年的秋招;所以大概可以提供一个兼顾双方的视角。提前声明,我的描述只适用于部分985中上等高校学生和部分一线AI公司算法岗位招聘现状,如有不妥之处请大家指正。
概括而言,两种略显矛盾的供需不平衡同时存在,而且都很严重。一方面,有海量的同学跟随这股AI大潮转投算法岗,收到的简历量几乎是headcount的数十倍。另一方面,即使不断被HR小姐姐们要求降低录取bar,本着宁缺毋滥的原则,计划的headcount依旧用不掉。
于是展示在大家面前的现象就很有趣。学生群体里,大概都是如下的情绪:「kaggle类比赛打了一堆,连面试机会都拿不到」,「实验室里做的东西,怎么面试官都看不上」,「算法题也做不出来,数学题也做不出来」。
而researcher这边,完全是另一种反馈:「项目都是拿人家code来跑的,别说魔改了,code都没读明白,一问就露馅」,「没paper没项目就只能问你算法和数学了,再答不上来那培养成本也太高了」,「有不少也就刚够intern的bar,这full-time怎么再往下调bar啊」。
我认为这种现状是和AI领域的发展状况有关系的。现阶段的AI,尤其是Deep Learning,某种程度上是一个易上手难精通的东西。网络上有丰富的电子书、公开课、blog、code等资源可以帮助一个人入门DL,但看过一篇blog->看过原paper->跑过原code->通读过原code->从零复现过原paper,仅仅到这里,这个人和一开始就已经完全是两个水平了。而大多数人还没到这里就已经被淘汰掉了。同事面试时经常会遇到做keypoint但搞不清OpenPose细节,做detection连NMS都写不出来的学生,这样的学生也别怪竞争激烈,确实是没法要。
然而即便是做到这里都不一定意味着这个人能满足一线公司的需求,可能也就刚刚达到一线公司愿意给你个internship开始培养你的程度。一线公司需要的是能快速跟进业界新方法,并能根据产品线作出针对性改进的人。想达到这个能力,可能要阅读>50篇paper打底,且要么在实验室里扎扎实实地跑过一两年的实验,要么在公司里扎扎实实地锻炼半年以上;单凭做几场比赛拿个Top30,跑几个demo,是绝对达不到一线公司的需求的。
而且国内的高校除了几个实验室之外,大多数组里做的东西都很水,在一线公司researcher眼里就是搬不上台面。一方面,很多经费不充裕的实验室一个人只有一块GPU可用,甚至要几个人分时段用一块GPU,而多数一线公司research团队早就可以给intern配备4卡以上的计算资源了(比如我就经常独占几十块卡跑实验,我还不是用得最多的intern)。另一方面,即使是985中上等高校的很多实验室,无论是教师水平还是学长水平都too simple,sometimes naive,学生经常得不到准确和及时的指导。几个月下来,对自己做的项目的理解依旧令人捉急,这样积攒来的稚嫩经验显然是很难满足业界需求的。至于那些有知名度的实验室出来的学生,一线公司都是常年盯着,定向抢人,根本不愁出路。
因为DL的理论跟不上实践,很多东西其实是没有标准答案的,一线公司的research团队都积累了大量的经验性结论(包含但不仅限于调参);倘若学生没有一定量的实践经验,是很难招架得住面试官的几轮追问的,而这个经验限于高校教育水平和硬件条件,不是那么容易积攒的。但另一方面,倘若在面试过程中学生体现出了他是科学地设计了他的项目,从motivation到experiments都很有条理,有一定的思考深度和实现难度,能合理地评价实验中的pros&cons,是一定能得到面试官的青睐的。
我也思考过简历上的哪些东西可以切实地打动面试官。能做到以下至少一条的基本不用担心offer的问题;都做不到的并不意味着拿不到offer,但可能就是borderline的评价,淹没在茫茫人海中,要在各家公司的waiting list里徘徊一阵。
你会发现,能做到这些的人都已经是学生们口中的大佬了,数量真的不多,各家公司都在抢,甚至一家公司里不同组都会抢,根本填不满headcount;而且这批人基本在提前批就被一线公司捞干净了。
而更多其他的人,都处在borderline和weakly reject的水平;这也没办法,公司确实需要高于这个水平线的人。一个简单的例子,我所在的组里,如果是一个比较成熟的领域,经常是周一有个需求,周二拿出个方案,周四就要给出一个初版结果,根本不会有实验室里花半个月吭哧吭哧调模型的时间;没有上述水平垫底,怎么做得到呢?
而上述标准各自往下调,基本就是招intern的bar了;能做intern的时间越久,这个bar就越低;基本上每多3~6个月的实习期,bar就可以多往下调一档;当然也是有个底线。
关于顶会paper的事情额外多说一点。这些年顶会投递量大幅增长,但accept比例基本保持不变,再加上paper过多导致reviewer数量不足、质量也良莠不齐,这些因素叠加在一起导致有顶会paper不再是稳定的offer收割机。
面试就像现场rebuttal,现在面试中已经出现了不少虽然有顶会paper,但要么motivation很模糊,要么idea经不起推敲,要么experiments不完善甚至不科学,要么没有排除很多因素的影响,要么对比数据有猫腻,根本经不起追问。所以我上面强调有含金量,不能太水,更重要的是,要有自己的思考,而不是别人喂了你一个idea挂了个名就完事了。我被面试过很多次,也面试过很多人,相信我,一篇paper、一个项目,里面有多少干货,自己的实际贡献有多大,在面试时很容易就能试探出来。
而且不要坐井观天。有些人在很多国内高校实验室里做出来的东西,中了个CCF B/C类会议,或者侥幸中了个A类,觉得很满足;可是由于环境水平限制,没有对比,不知道自己做得其实有很多不足甚至硬伤,结果拿出去面试时被秒杀,然后在网络上在生活中宣扬面试问得太深太难,这种现象我也是见过几次了。而实际上,哪怕你做过的东西真的有很多不足(这很正常,谁还没个起步阶段),但倘若在面试时能表现出对自己做过的东西有清醒的认识,有正确的复盘,面试官是不会轻易否定这样的人的。
在一个优秀的环境里时常被大佬们challenge,其实是一种幸福,水平提升会非常快。积攒的干货多了,即使没有顶会paper又怎么样呢。
如果一线AI公司算法岗位暂时够不到,或者还剩一两年的时间打算冲击这样的岗位,该怎么做呢?我想这就像摆在你面前有一个你想够但是够不到的台子,你要做的就是搭一个梯子逐步地(而非一次性地)爬上去。
首先还是夯实基础。现在很多高校计算机系的数学和算法课程水到令人发指,跟着老师上完一学期课拿个75分的水平,跑来搞AI基本是不够用的。书该看就看,题该刷就刷。
挑实验室选导师要慎重。如果在一个实力不错的实验室,那就好好跟着老师干。这里实力不错的定义是实验室每年能稳定输出顶会paper(且不是凭借某个大神学长,而是实验室整体实力使然)。要是做不到,就尽可能出来实习,不要浪费时间精力在没有意义的项目上。要相信导师不放人并不是完全不可克服的阻碍。找不到太好的实习就先找一个次一点的实习,一点点提升。
尽可能专注于一个方向,不要方向ABC各做3个月,多数情况下都不如只做6个月方向A。如果可能,尽可能做基础的方向,做与业界需求贴近的方向。比如如果你做Detection的,那以后无论是Face Detection还是Text Detection你都能比较容易地上手,让你转做Segmentation也不会吃力,让你做Tracking也不会很难。学术界做的很多东西和工业界还是有差异,如果你很早就想好了要进工业界,那还是早做打算。
如果算法不太行,还想靠近AI行业,其实也有不少路可走。工程类岗位每年也有大量需求,DL框架的优化,分布式训练平台的开发,ARM/FPGA/ASIC平台的适配……有很多事情可以做。data management和QA类相关岗位也有不少需求,而且虽然要求不高但愿意干的人少,竞争还小。
无论是做什么方向,包括但不限于AI岗位,解决问题的能力、持续学习的态度、独立思考的意识,永远是最值钱的。具备了这些,没有什么技术类工作是永远够不到的。
update:
加个广告,旷视研究院Detection组常年招收full-time & intern,本组研究范围定义为category level的一切task,涵盖且不限于Detection、Segmentation、Keypoint、Skeleton、Tracking等,包括2D、3D、Video,近两年拿了COCO冠军若干项。有意者可投简历至wangjianfeng@megvii.com。对其他组、其他方向、其他岗位有兴趣者同样可以发简历过来。
AI岗位这说法比较笼统,这个领域还有许多细分的职位。如算法工程师,数据挖掘工程师,智能硬件产品工程师等等。下面分析几个案例,让准备参加校招的学生们加深对AI领域一些基础岗位的认识。
男 2 年工作经验|本科
XX医学科技有限公司 | 算法、数据工程师 | 8k/月
行业类别:计算机软件
工作描述:
1.运用数据挖掘技术和数据预处理等方法获取标准数据;
2.利用C/C++、Python等语言结合CUDA、TensorFlow、Kares等机器学习框架;搭建适应场景的算法模型;
3.通过对标准数据的测试验证;分析测试效果,再结合领域知识,实现模型的优化。
4.曾担任过产品经理,为实现客户需求、推广公司AI产品,绘制产品需求文档和原型交互设计等材料,准确地传递了客户的需求,明确了产品的研发方向。
项目经验--胃镜病灶的目标检测 |
工作描述:
利用python语言在TensorFlow/Kares学习框架上搭建AlexNet、VGG、ResNet等目标识别算法实现对含有病灶的图像进行识检出;搭建RCNN、SppNet、FastRCNN、FastRestCNN等目标检测算法,实现对含有病灶的胃部图像进行识别检出;对运算结果的精确率、召回率和特异性建立RoC曲线和PR曲线,结合TensorBoard来测评模型的性能及其合理性。
男 1 年工作经验|本科
XX科技有限公司 | 深度学习算法工程师 | 8K/月
行业类别:互联网/移动互联网/电子商务
工作描述:
负责公司图像方面的项目任务,对深度学习算法进行研究并实现,利用常用的深度学习模型诸如卷积神经网络、递归神经网络,对图片进行模式识别、人脸检测等;完成神经网络模型搭建与训练,对模型进行超参调优,实现算法的改进与优化;配合项目经理及团队成员共同完成业务要求,并撰写报告文档。
专业技能:
1、掌握C,python等编程语言;
2、熟悉深度学习相关神经网络,如DNN、CNN、RNN、LSTM、GAN等,对机器学习相关算法有所了解;
3、熟悉TensorFlow深度学习开源框架;
4、熟悉Numpy、PIL、Matplotlib、OpenCV等模块库;
5、掌握Linux常用的操作命令;
项目经验--门禁系统(人脸识别) |
工作描述:
训练样本数据获取,搭建P网络、R网络和O网络,训练神经网络模型,优化深度学习框架。
男 2 年工作经验|本科
XX软件有限公司 | 数据挖掘工程师 | 12K/月
行业类别:计算机软件
工作描述:
1、对前期数据进行清洗,规整等操作
2、对数据进行特征工程的处理,包括特征抽取,特征的选择,创建特征,创建自己的转换器等
3、分别抽取训练集与测试集,选定特征值与目标值
4、通过算法对数据进行预测
5、将预测值与真实值进行比较,得出准确率
6、通过算法,对结果进行不断优化(或者选择更加合适的算法)
7、后期通过真实数据的检测,不断优化算法
项目经验--乙方公司客户诉求热点分析 |
工作描述:
1. 需求落地和方案编写;
2. 数据准备和预处理,去除停用词;
3. 特征工程:运用td-idf模型构建文本特征,并且进行数据的降维PCA;
4. 数据分析的实现,包括数据验证和模型优化等;
5. 分析报告的编写与汇报;
男 1 年工作经验|硕士
XX科技 | 产品经理 | 20K/月
行业类别:电子技术/半导体/集成电路
工作描述:
智能硬件的产品经理,深度参与了人工智能设备——智能音箱的设计、研发、上市过程,工作内容描述如下:
1. 市场调研;
针对AI语音领域及其应用场景,进行市场调研分析、竞品分析,撰写MRD、可行性分析和立项申请报告;
2. 产品设计;
参与AI智能音箱产品的设计,撰写PRD和核心SPEC定义产品,包括硬件架构定义、软件功能需求、关键技术和性能指标需求、交互设计等;
3. 硬件方案选型;
针对AI音箱的功能需求及成本限制,进行了如CPU、ADC等关键器件的方案选型等;
4. VUI以及软件功能定义;
定义AI音箱的的软件功能,设计了部分功能的VUI(语音交互逻辑);
5. 成本控制;
进行产品的成本核算及管控;
6、产品生命周期管理;
推动产品的硬件、软件、外观、电子和结构设计,跟进研发、测试,直至试产、量产,确保产品按照规划设计与实现。
7、项目管理;
协助项目经理进行项目进度管理,并参与协调供应链、研发等资源,保证进度。
男 1 年工作经验|硕士
XX | 软件开发(人工智能方向) | 12k/月
行业类别:IT服务(系统/数据/维护) | 公司性质:民营
工作描述:
项目:小白机器人的项目设计和研发(业务 AI 化)
工作内容:
1、搭建人工智能软硬件计算环境。
2、研发发票识别并验真的深度学习神经网络,优化发票识别的精度、速度。
3、完成语音识别查报价、查库存、展示经营状况分析的功能。
4、研发门店区域客流量分析的深度学习神经网络以预测货架如何铺货,优化刷脸和客流分析系统的人脸识别速度。
5、引入营业执照识别并验真的 API 接口。
6、利用目前最先进的各种 AI 技术场景化公司现有的业务。
7、采用 SSD、Faster r-cnn 和 YOLO 做过拍照测肤方面的目标检测项目,根据各模型的精度和速度来优化算法。掌握 CNN、RNN、LSTM 等基本神经网络结构,熟练图像识别、分类和目标检测,熟悉图像分割和 NLP,了解语音识别。
AI行业目前处于风口上,吸引大量想入行的求职者。尤其是学计算机科学与技术,电子信息工程,应用数学等相关专业毕业的学生。但是,总体来说社会上相关的职位比做web开发,游戏开发的要少。对于大部分相关专业毕业生来说,进入不了AI领域,做其他领域的程序员也是不错的选择。
更多专业就业分析,职业案例解读,欢迎关注公众号:职评榜
巴黎场完整版视频:
http://www. bilibili.com/video/av14 307530
(直接从知乎看只能看前段)
会翻墙的话有Youtube完整版:
------------------------------------去年有幸在巴黎看了一场久石让指挥的Ghibli工作室演奏会。而那晚成了我终生难忘的一晚。
我很早之前就把武道馆的录像看了不下一百遍。学习听做家务听,因为真的太喜欢了。我最喜欢的便是演奏魔女里的小提琴。真的太好听了。在武道馆拉小提琴的大叔便成了我的最爱之一。还有呀,天空之城里吹小号的。那是我第一次知道原来小号吹成这么样的。语言形容不出来。对啦还有拉龙猫的大提琴的一个小胖子,大提琴的声音的力量,低沉,有力。可惜他们三一个都没来。来的是久石让,他女儿和欧洲这边的乐团。
即使是这样,演奏会上的歌一出来,我便起鸡皮疙瘩,然后一边觉得很欣慰很幸福一遍止不住得哭。那个音乐里的世界便是最美好的了吧。这不,我打下这话眼里又有泪水了。
我买的票比较靠后,所以久石让我也没看清。可是整场都能感受到大叔的可爱。大叔会一边笑一边上台。
票一张差不多两百欧,人民币大一千多。即使这样,我仍然觉得超值。嗯。那一晚的音乐能温暖我很多年。我看过很多演唱会,Coldplay, Maroon 5, 苏打绿等等(大部分都是Mainstream). 大部分也都是那个月狂热一下,然后就没了。而久石让的Ghibli音乐会,听完的心情,听的时候的满足感,与再听的满足感,回味无穷,都是现在所有Pop不能带给我的。
那晚,大部分时间也是我和男朋友手牵手看完的。有着一生我最爱最爱的人,还有难忘至今的音乐。那个晚上,真回味。
巴黎场完整版视频:
http://www. bilibili.com/video/av14 307530
(直接从知乎看只能看前段)
会翻墙的话有Youtube完整版:
------------------------------------去年有幸在巴黎看了一场久石让指挥的Ghibli工作室演奏会。而那晚成了我终生难忘的一晚。
我很早之前就把武道馆的录像看了不下一百遍。学习听做家务听,因为真的太喜欢了。我最喜欢的便是演奏魔女里的小提琴。真的太好听了。在武道馆拉小提琴的大叔便成了我的最爱之一。还有呀,天空之城里吹小号的。那是我第一次知道原来小号吹成这么样的。语言形容不出来。对啦还有拉龙猫的大提琴的一个小胖子,大提琴的声音的力量,低沉,有力。可惜他们三一个都没来。来的是久石让,他女儿和欧洲这边的乐团。
即使是这样,演奏会上的歌一出来,我便起鸡皮疙瘩,然后一边觉得很欣慰很幸福一遍止不住得哭。那个音乐里的世界便是最美好的了吧。这不,我打下这话眼里又有泪水了。
我买的票比较靠后,所以久石让我也没看清。可是整场都能感受到大叔的可爱。大叔会一边笑一边上台。
票一张差不多两百欧,人民币大一千多。即使这样,我仍然觉得超值。嗯。那一晚的音乐能温暖我很多年。我看过很多演唱会,Coldplay, Maroon 5, 苏打绿等等(大部分都是Mainstream). 大部分也都是那个月狂热一下,然后就没了。而久石让的Ghibli音乐会,听完的心情,听的时候的满足感,与再听的满足感,回味无穷,都是现在所有Pop不能带给我的。
那晚,大部分时间也是我和男朋友手牵手看完的。有着一生我最爱最爱的人,还有难忘至今的音乐。那个晚上,真回味。