百科问答小站 logo
百科问答小站 font logo



如何看待 2022 年秋招算法岗人间地狱? 第1页

  

user avatar   eric314 网友的相关建议: 
      

好像没人提一个事:算法部门的人地矛盾越来越激烈了。

ai发展依赖算力增长,但是近年来单卡算力增长放慢,大家开始扩大分布式,结果是调研需要的资源越来越多。同时算法工程师也越招越多,每个人能分到的实验次数越来越少,有的地方一个人平均一个月开不了一次实验,人地矛盾突出,能有多少产出取决于能抢到多少资源。

求职卷,进来了做实验也卷,卷翻天。


user avatar   yunshizhijian 网友的相关建议: 
      

好家伙,人间地狱出来了,看看2023年怎么造词


user avatar   breaknever 网友的相关建议: 
      

这说明了算法岗位的名字需要加前缀,而职责也需要进一步细分

比如拿成熟的软件工程师而言,你有很多种分类的方法,比如前端、后端。又比如专门做移动端的,甚至移动端你还能继续分用Android studio针对安卓机的和IOS工程师。按照语言分也可以分成专门搞C++、Java、Python的等等。虽然这些分类都交叉重叠,但基本你说出一个岗位名称,我们大致都知道基本的技术栈是啥,自己合不合适,是否有机会

那所谓的算法岗呢?有人知道具体技术栈是啥吗?

是深度学习调包搭积木?import tensorflow as torch吗?

是搞统计学推公式,证明bound吗?

是业务岗,每天部署做A/B测试吗?

是优化算法,加速现有的程序吗?

是熟知各种架构,能在底层对系统进行分布式吗?

需要发论文吗?没做过科研是不是肯定会被刷?

让我们提供一个最严格的假设,假设这些都是必备的要求,所需的能力上限为( ),。那试问全世界有几个人能完全的符合?从数学到部署到业务理解一条龙都懂,这种不给个大几百万都不合适。

让我们再提供一个最松的假设,假设这些条件满足一条即可,即所需要的能力下限为( )。那试问大部分正经学校的相关专业毕业生,从本科生到博士生,是不是人人都有机会试试?

如果你把以上这些标准都量化起来,其实是很难得到一个准确而客观的个人实力评估的。就像输入10维特征,输出1维的个人能力,再加上没多少参考案例,因此我们对个人实力的评估会很混乱。

而两个假设中间的巨大空间导致了评估难度的进一步变大毕竟每个人都在 这个区间里,而并不知道自己在这个巨大区间上所处的位置。因为算法岗不像其他岗位我们能精确定位自己实力,了解供需,因此投岗基数大,而大概率的分布是「大部分申请人都不满足用人单位的基本条件,而少部分符合条件的人又觉得没那么难」。就像一个长尾分布,导致申请者众多,很多人觉得倍难。但又会有少数人觉得怎么offer全给我了,我真牛逼。

这种迷惑性使得个人感受两级化,要不是好难好难,要不是我拿了10个offer。

而其他岗位需求大概就看起来更加明晰,申请者对于录取标准的把握可能也更准确:

在这种前提下,如何理智的聪明的选择算法岗呢?

我的建议是参照条件是师兄师姐的去处,评估自己属于以下哪种情况。毕竟我们大概率就是师门中段班,或者往届学生中的中上水平

  1. 如果你是行内人或者出身名门条件过硬(学校、实习、论文,编程数学都不错),以前师兄师姐有相当比例都能拿到offer。那就大胆投,大概率你能赢者通吃。
  2. 如果你只满足一两条以上条件,周围的师兄师姐偶有去做所谓算法岗的。大胆跳过这些岗位,把注意力放在开发的应聘上,需求更大,且更明确。

我个人的推测是未来的算法岗肯定会具体细分起来。第一步是先把搞研究的和搞开发的分流,毕竟两者真的没啥本质相似。这样没论文,没博士学位就可以不必花更多的时间。第二步就是按照方向细分,比如搜索推荐业务、比如识别又比如语音文字类的。没有相关经历就不会在这浪费感情。最终所谓的算法岗就会祛魅,至少让大家看清楚自己的背景是否和岗位匹配。而不是现在每天小马过河,人心惶惶。

地狱不好,我们应该在人间。


user avatar   zheng-hua-bin 网友的相关建议: 
      

看到解大 @谢流远回答提到了算法部门的“人地矛盾”,我也来贡献一个观察到的矛盾点:汇报宣传时高大上的算法模型,与实际干活时主导成败的脏活累活之间的矛盾。理解了这个矛盾,一定程度上就可以解释,为什么一方面很多学生觉得算法岗很难找,另一方面企业又总是吐槽算法岗很难招了。

有很大一部分算法从业人员,在尚未深入一线业务落地的时候,接触到的最多的信息就是各种高大上的算法模型。大家喜欢兴致勃勃地谈论最近又出了一个什么魔改变形金刚,又出了什么即插即用的涨点神器,ImageNet又被刷爆了,XXX又被屠榜了,PapersWithCode某个Leaderboard右上角又冒出一个新的SOTA散点了,超大模型的参数量破万亿了……他们对于AI技术的理解主要来自于一篇篇顶会论文上的漂亮故事,或者是各大公众号上花团锦簇的PR稿。其中功力较为深厚者,对各种网络结构、训练技巧如数家珍,能对某个领域近年来代表模型的演进路线侃侃而谈,各种设计的insight也能阐述一二。

我说的这部分从业人员,不仅仅包括实验室里的学生,还包括一部分已经身在企业、但是偏中后台技术支持的算法工程师。事实上,一两年前的我也是这样的认知。

但是当这部分从业人员深入一线业务之后,就会发现,算法模型在实际工作中可能只占20%,剩下80%的时间都在围绕着数据做很多脏活累活。在一些成熟任务上如简单的图像分类,算法模型占据的比例可能会更少。他们会发现自己熟知的那些”黑科技“其实作用有限,有时候费了很大劲,把三年前的技术换成上个月的技术,性能也就提升了一小截,而且就到此为止了。当然,有野心的算法工程师会想,我上我也行!我也要来魔改网络结构,拼凑训练技巧,在自家业务上提点!不过这种尝试往往不是以失败告终,就是只提升了可怜的零点几个点,也许还不如毫无技术含量地调调几个超参数。

与之相反,对数据的处理往往可以带来大幅度的、持续的提升,可行的手段除了粗暴地标注更多样本,还包括重新审视原有的标注规则是否合理,现有数据集标注质量如何,要不要定义一些细粒度的类别来辅助模型学会更微妙的语义,当前的模型经常在哪些场景下出问题,能不能从其他数据渠道补充这些场景的样本……上面列举的还只是一些粗糙的思路,很多一线干活的算法工程师肯定还能举出更针对具体任务、具体场景的操作,比如做NLP的朋友就告诉我实际工作中”正则表达式yyds“,当然这种经验在CV任务上就没什么大用了。

于是,实事求是的算法工程师开始深入一线之后,顶着业务指标的压力,很快就会用脚投票,不再花费过多精力在算法模型上,而是老老实实把一些数据上的工作做好,因为他们知道,算法模型不关键,follow最新的黑科技只是锦上添花,唯有数据才决定了业务落地的成败。

但是问题就来了,算法工程师做完这些脏活累活,达成了业务指标,等到向上汇报、对外宣传的时候却傻眼了。有些领导并不关心你做了多少实在的工作,只想听到你用了什么最新技术;有些领导尽管明白业务落地的关键在哪里,精力应该放在什么环节,知道但架不住总还有更上面的领导,要求在汇报中体现出「技术水平」;就算上层领导确实很懂行,但又架不住对外宣传的时候,也没办法把那些实际的工作讲出花来,必须包装成花里胡哨的先进技术,才能体现自家的技术壁垒,对群众秀肌肉,对同行放烟雾弹。

这样一层层压力传导下来,一线的算法工程师难免就会动作走形,甚至会慢慢形成「双重思想」:实际干活时用的都是简单粗暴有效的东西,汇报宣传时又要强行包装出一个又一个fancy的故事。

既然形势如此,很多聪明人就会慢慢拥抱这种评价体系,不管实际干活的时候怎么玩,最后一定会想方设法讲故事、发论文,企业会拿着这些「先进技术」出去宣传,各种AI自媒体也乐见其成。于是很多尚未深入一线的从业者每天看到的,就都是各种高大上的算法模型,为了跟上潮流,他们也卯足了力气卷这些东西,凑成一份份光彩夺目的简历送到面试官手上。可是这个时候,一线出身的面试官可能又开始「双重思想」了:业界平常大力鼓吹的是这些东西没错,但你是要来实际干活的,我得考察你实际干活的能力如何,不然来了拖后腿,团队业绩不达标,我们也有压力啊!

于是,招人时实际考察的,与平日里大力鼓吹的,就产生了脱节。

而且这种脱节有愈演愈烈之势,因为追求高大上的业界舆论影响汇报宣传的导向,汇报宣传的压力又反过来诱导出更多高大上的算法模型,会形成一个正反馈的闭环;而另一方面,即使算法工程师从业务中打磨出了简单粗暴有效的方法,也缺乏汇报宣传这两条重要的内外渠道获得足够的激励,形不成正反馈,散落的单点进步无法连成一片,就会被一直雪藏在算法工程师自己的脑中。

可以把上述逻辑总结为这么一张图:

当然,这些只是我的一家之言,有不同观察或意见的话,欢迎在评论区留言。


user avatar   chen-bo-89-7 网友的相关建议: 
      

德州扑克 的经验:

加注的前提是有起码的胜率;

fold的好处是较小代价扛过对方的大牌;

用1w炸胡500的行为纯属脑子有坑;

目前看 算法岗位并没有晋升和薪酬上的优势,反而易脱发、易失业;




  

相关话题

  如何评价一线大厂资深 APP 性能优化系列之异步优化与拓扑排序? 
  广告算法工程师的核心竞争力是什么? 
  你在生活中用过最高级的算法知识是什么? 
  利用无理数压缩数据是否可行? 
  学物理为什么会觉得计算机很难? 
  怎么证明每个位上的数字之和可以被3整除的数可以被3整除? 
  一个关于拓扑排序的扩展问题,可以做到的最优复杂度是? 
  如果一个算法空间复杂度是指数级,时间复杂度是多项式级,那么这个算法复杂度怎么算呢? 
  Matlab中的conv函数与卷积公式是什么关系呢? 
  递归和循环相比耗费更多的空间,对于循环来说除了可以简化逻辑外还有什么优点吗? 

前一个讨论
2021 上半年中国游戏开发商跃升海外游戏市场份额首位,这对中国游戏的未来有什么启示?
下一个讨论
如何看待B站UP主“小昭昭昭昭昭昭昭昭昭”的动态信息?B站经历了“墨茶”事件后是否会出手相助?





© 2024-11-21 - tinynew.org. All Rights Reserved.
© 2024-11-21 - tinynew.org. 保留所有权利