感觉挺好的,任何清晰明确的数据总是要比含糊不清的要求更有利于人们做出判断的,只要数据真实性问题不大,不管是维权还是统计都是更好的选择。
如果三方数据都一致,没有互相推诿甩锅余地的话,公布数据出来挺好的,有利于减少矛盾争端缓解焦虑心情,看着数据分析比单纯的还有几分钟到要舒适和信服一点,瞅着瞅着,外卖就到了。
当然,大部分人可能是看不懂的,但无所谓,作为一种凭据,平常看不懂没关系,有用的时候,你看与不看,它都在那里,不离不弃。
将「骑手与消费者」两者的需求矛盾化,这逻辑本身就是错的。
骑手永远希望安全,希望赚钱,和消费者希望配送费少,希望送得快的矛盾。
消费者要求的并不是快,而是准时,快与准时是不同的概念。
倘若张三希望第二天早上7点吃上新鲜的馒头,那么他的需求是新鲜的馒头+七点前送达。
倘若张三希望现在15分钟内能吃到热腾腾的炸鸡,那么他的需求是新鲜的炸鸡+15分钟内送达。
对比两者需求可以发现,两者的共同之处在于新鲜的食物以及准时,食物不新鲜以及超时意味着体验下降。
王二麻子包子铺给了张三隔夜的馒头,这个责任是在商家而不是外卖平台,而外卖平台没有在承诺的时间送达,这个责任就落在平台上。理性的消费者知道,一个远在一公里外的店铺,你不可能要求快递员在5分钟内送到。倘若外卖市场是充分竞争的,他会去寻找一个最接近其需求的承诺送达时间平台,但很可惜现在做不到。因此,我们发现快这个字并不是针对消费者,而是针对平台。即平台在要求快。
平台为何要求快?浅显的理由认为,平台将这些骑手当成是自己的雇员,必须要在单位时间里充分利用雇员的剩余价值;或者平台认为这些骑手都是懒惰的,骑手数量永远跟不上订单量,因此要督促他们提高效率。
前一个理由目前已被平台自己的行为所否定,也不被大多数与平台合作的人力资源公司所承认,目前为止大多司法判例不认可骑手与他们之间存在劳动关系。他们更希望骑手们是自己的雇员,又不用承担雇员责任。而且现阶段从北京市就业工作领导小组印发的《关于促进新就业形态发展的若干措施》可以看出,倘若平台以及人力资源公司对骑手过度管理,不让骑手在各个平台自由接单,那么骑手就要被认定为「平台网约劳动者」,因此,在没有劳动关系的情况下剩余价值论这种观点没有实际的讨论意义。
后一个理由目前已被骑手行业的现状给否定。骑手数量实际已基本饱和,而是平台长期居于行业垄断没有优化资源配置合理配置骑手资源以及配送价格导致外卖订单被不合理的分为:优质订单、普通订单以及劣质订单。优质订单的特点是固定、集中、距离近,一个骑手同时可以送几单、甚至更多……普通订单的特点是供需两端的距离具有稳定性,供给端(商圈)辐射的需求端(居民区以及商业楼宇)确定。而劣质订单则是距离长、需求不固定、供给端与需求端的距离过长。平台通过算法将优质订单、普通订单分配给长期专职从事的骑手,将劣质订单分配给一些零时做的骑手。这种现象的具体表现为,零星从事配送工作的众包骑手们与优质订单基本无缘,配送枪单还需要靠手速。这也是北京人社局副处长辛苦一天才挣41元的主要原因之一。
因此,反垄断的意义就在于逼迫平台从这种不合理的资源分配惰性中苏醒过来,从「惯养」消费者的惰性中苏醒过来。重新制定更科学的分配方案,平等对待骑手、科学设置骑手站点、科学设置配送费用。出租车网约车以距离收费,为何配送费不是按距离收费、或按重量计件收费?相信倘若有一个更合理的、透明的收费标准,而不是这么一段模糊的提示说明——任由平台设置,消费者是愿意接受的。
这是对“外卖小哥被困死在算法里”的一种危机公关吧。
但要把小哥从算法解救出来,仅仅公布算法是远远不够的,还应对算法进行合规性论证。例如程序可以跟踪每个外卖小哥每一单的路线、速度,这样可以随时得知每一单在送外卖过程中,有没有逆行?有没有超速?甚至会得知有没有闯红灯。只有将那些有过逆行、超速、闯红灯的外卖单剔除出学习数据库,算法才能得出每一单合理的配送路线和时间,在不违章的前提下送出的外卖才是有效的外卖,否则就像以前那样,靠外卖小哥疯狂违规来提升送外卖的效率,终究不是一条好路。
但要实现对每一单送外卖过程的合规性监督,靠平台自身是没有用的,在利益驱动下,平台不可能自己监督自己断自己的财路。只有靠政府监管或者第三方监管,甚至是竞争对手的监督举报,才能真正把送外卖产生的违规路线、超速、闯红灯等行为减少直至杜绝,才能切实保证送外卖小哥的人身安全,并提升其尊严感,否则靠在人流车流中超速穿梭才能完成平台派单任务,路口遇到交警又抱头鼠窜到处逃,哪里来的尊严感呢?
看看下面这张图片,必然有一人是逆行的,平台一定是知道的,但是没有主动去管理。
再看看这一排逆行的:
其实平台更应该清楚,我们已经过了靠违法赚钱的年代了,如果还停留在劳动力红利上面,而不去做技术先进性、合规性的适应,也就只能“盯着的老百姓的菜篮子”在窝里横,出去与外国互联网平台竞争,一点都不能打。
坦白说,这份算法的价值,远远小于“公开算法”本身的价值。
这不是美团第一次公布算法,在上一次针对配送的算法公布中,我看见评论区有这么句话:
这不是我第一次看见这句话。
《人日》在2008年发布的一篇稿子中,标题就是这个:
这篇文章中,有一段我深以为然:
进一步完善信息发布制度,对于正视听、明是非、堵小道,效果很好,同时也是一种有力的舆论引导。
美团在做的,其实就是算法的透明化。
说实话,许多形形色色的算法与我们密切相关,我们却完全不知道背后的算法是什么。
买东西,不一样的手机,不一样的人搜索同一个人,价格不同。
打车,同一个地点,换个手机价格不同,
拼多多砍一刀就更不用说了。
常说你我困在信息的茧房里面,但现在我们想知道的算法机制都隐藏了,信息又有什么开放性可言?
我觉得之前骑手、平台、商家、用户四方出现矛盾,而且矛盾无法解决的原因,就是因为信息不透明。
出现问题之后,我们甚至都分辨不出是谁的问题。
至少,现在一切都在阳光下,而一旦到了阳光下,事情就必将往好的方向发展。
无独有偶,你我历史课本上肯定学过,那个关于周杰伦《爱在西元前》的黑色玄武岩。
“古巴比伦王颁布了汉谟拉比法典,刻在黑色的玄武岩至今已三千七百多年”
3700多年过去,我们今天重新审视汉谟拉比法典,
他完美吗?他不完美。
我们看看这几条:
If anyone is committing a robbery and is caught,then he shall be put to death.
(给入室偷窃者死罪)
If a "sister of a god" open a tavern,or enter a tavern to drink,then shall this woman be burned to death.
(修女喝酒、开酒店会被处死)
If a slave say to his master: "You are not my master." If they convict him his master shall cut off his ear.
(奴隶忤逆主人,死刑)
我们依旧可以从这份法典上看见奴隶社会的残余,看见对人、对女性、贵族对民众的压迫。
但是汉谟拉比法典的意义是什么,是成文。一旦成文。双方各有监督。
这本质上是古巴比伦的贵族,在向平民让渡自己的权利——对法律的知情权,以及部分对法律的解释权。
没有公开透明的成文法之前,法律本质上是贵族说什么是什么,贫民没有和贵族讨论的权利。
有了透明的成文法后,才有了法律面前人人平等的概念——至少,面对规则的时候是平等的,后续只要更高规则就好了。
我们看回到美团这个算法。
美团这个算法完美吗?不完美。
至少在目前,这个算法不能解决两个矛盾,
1,骑手永远希望安全,希望赚钱,和消费者希望配送费少,希望送得快的矛盾。
这个是永远不可能解决的问题,我们今天以同为打工人的身份提骑手叫屈,但自己点外卖的时候还是希望可以越便宜、越快越好。
骑手也会希望每一单的配送时间长一点,但是单位时间内总的配送费变低了之后自己就会加速。
这个是算法解决不了的问题。
2,现阶段技术无法完美的矛盾。
这一点就更好理解了,你打开一个不要18岁以下打开的网站,看看目前我们吹上天的人工智能翻译的结果:“山雀、猫咪,公鸡”
你就知道目前算法无法做到完美。
订单会撞车,配送时间会bug,商家出餐可能会慢,天气预报可能不准——等等等,目前的算法还有待升级。
这个是算法目前解决不了的问题。
但这不能说明美团此举是坏的,反而,就跟汉谟拉比法典一样,算法透明化之后,本质上是美团把算法的知情权和解释权,给到了用户和骑手。
只有这样,骑手和用户,与平台在对话关系上才是对等的。
我们可以想象到这份算法出来之后的诸多好处。
第一,他会有争议,争议会有意义。
会有用户,会有骑手站出来说这个算法不合理——但仔细想来,这份争论的权利是建立在算法透明的基础上的。你我如今都想抗议大数据算法不合理,却连个不合理的地方都说不出来。
面对透明的算法,争议有迹可循。
第二,有争议就会有迭代的方向。
美团既然公布了,说明他们有面对争议的准备。
而且有了争议,就有算法进步的方向,君不见miui当年这么火,不就是因为对用户开放评论反馈吗?
接着,争议会变少。
这一点就不用说了吧。
最后,这个行业会进步,甚至整个互联网行业都可以作为学习范本。
美团公布了,饿了么公布吗?
外卖公布了,电商公布吗?
电商公布了,打车公布吗?
种种算法机制透明化之后,我们作为用户这个个体,才能更好的使用互联网。
最近,不少APP都被网信办列为了超级APP,监管之下,互联网巨头们的“服务”作用必然更加凸显。
二更
这里从人力成本上分析一下。
对于一个外卖配送站,最重要的考核指标包括:承接的单量、超时率、差评率、投诉率。
其中,超时率是重中之重,很多差评和投诉都是因为超时。
配送站的绩效考核指标,相当于是一家公司的事业部或者项目团队,而部门的整体绩效考核指标,还会层层分解,落实到具体岗位和员工个人。
所以,平台对配送站的考核指标毫无悬念全部落到骑手身上。
在已经上市的美团财报中,活跃用户数、客单价等由客户决定的指标是投资市场对美团成长性的重要评价标准,而投资平台不会关注外卖平台的外卖骑手数量增加了多少,恰恰与之相反,在财报中,外卖骑手数量越来越指向成本指标。
这是什么意思?
骑手数量竟然是成本?
合作商家数据、新增及活跃用户数据,决定了外卖平台的业绩和市值,尽最大可能对外卖骑手进行压榨式的产出考核,才能让外卖平台实现更有效的成本控制。
这真是对互联网新经济神话最大的讽刺。
企业成本压缩和利润最大化的实现竟然是对骑手人性的压迫。
看似光鲜亮丽的外表下竟然隐藏着如此的反人性。
当外卖等新兴互联网业态出现,在某种程度上确实带来了市场供应效率的提升,商家、用户受益了,骑手也受益了。
但这不是靠技术革新,没有拼研发实力,而是探底人的生理极限,这跟若干年前,车间缝纫工拼命踩脚踏板,电子厂工人手速飞快的插接电子原件有什么区别?
这一次公开详解算法如何判断一个骑手的时间宽裕程度和顺路程度。
就这个问题我找了几个算法岗的朋友研究了一下:
在基于人工智能算法的外卖配送系统中,从顾客成功下单的时刻起,该系统便会自动化计算最优的订单分派和骑手配送路线,并且预测订单的“预计送达时间”,然后以此考核骑手的“准点率”;一旦订单配送超时,骑手们将面临降低收入甚至淘汰出局的惩罚。
在此过程中,值得重点关注的是,这套“最优”方案只是在给定的历史数据和预设的模型参数下、通过模拟现实得到的“理想值”或者“乐观值”。
因此,面对复杂多变的现实场景,外卖骑手的激励机制需要具备容错性和灵活性,帮助外卖骑手抵抗已知或者未知的市场不确定性带来的负面冲击,降低外卖骑手收入的波动,这不仅有助于提升骑手们的福利水平,也将会增强平台的总体运力。
预计送达时间容错是否有个弹性预留时间?
面对无法避免的外卖订单配送超时风险,平台可以考虑引入“超时容错机制”,订单的“预计送达时间”设置和显示为一定的时间段(例如,“17:20~17:25 到达”),并且根据商家的备餐状态和骑手的配送情况动态调整、提前向顾客提醒可能的超时送达,而不是精确到具体的时刻(例如,“预计17:23到达”)甚至故意将顾客端显示的“预计送达时间”设定的短于骑手端。
从技术层面而言,即便是采用先进的深度学习算法,模型学习到的结果也只是关于“预计送达时间”(Estimated Time of Arrival,简称 ETA)的统计分布,并不能做到对每个样本的预测值都有绝对准确的“信心”。
ETA 参数的区间估计结果(“17:20~17:25”)会比点估计结果(“17:23”)更加具有可信度,因为后者并不能告诉顾客真实的送达时间与它的距离,而前者则可以反映真实的送达时间所处的大致可信范围(confidence interval)。
从管理层面而言,区间形式的“预计送达时间”是应对预测算法的误差和外部配送环境的变化的容错策略,体现的是对骑手和顾客负责任的态度。与此相关,平台还可以根据送达时间的区间设置弹性的实际送达时间考核标准:如果实际送达时间在“预计送达时间”前后N分钟,则该笔订单配送记录判定为“正常”,如果实际送达时间超过“预计送达时间”N分钟,则该笔订单配送记录判定为“超时”而纳入超时评估体系;最后,如果实际送达时间早于“预计送达时间”N分钟,则该笔订单配送记录判定为“快速”而纳入高效奖励体系。
类似思想已经被外卖平台的ETA预估算法所采纳 ,也可以作为超时容错策略体现在骑手激励机制设计中。
弹性的超时奖惩也会更有效果?
围绕超时容错机制,平台可以考虑针对骑手“超时率”划分多个区间段、设计更具有弹性的阶梯式超时奖惩规则:超时率被划分成多个区间段,例如,[0%, 5%]、(5%, 10%] 以及10%以上,如果骑手的超时率处于第一个区间段,则骑手的绩效水平不会受到影响;如果骑手的超时率处于第二个区间段,则骑手的绩效水平将受到适当轻微的负面影响;但是,如果骑手的超时率处于更高的区间段,则骑手的绩效水平将受到显著增强的负面影响。
当前,骑手们的超时率通常不得高于3%,否则,包括骑手、站长甚至区域经理等所有人都将面临绩效的惩罚。那么,从激励机制设计的本质而言,无论是预计送达时间容错机制还是弹性超时奖惩机制,从数学模型的角度,都是在期望构建基于骑手工作绩效(即超时程度或者“超时率”)的非线性激励机制。
类似分段阶梯式的非线性惩罚机制在线上多边平台市场中经常出现,例如,在网约车市场,为了杜绝司机的刷单作弊行为,平台会设计阶梯式作弊违规处罚标准:“第一次禁用3天,第二次禁用15天,第三次解除合作;累计非法获利≥1000元时,解除合作永不录用”。
在激励骑手们准时配送以最大化日成交金额(Gross Merchandise Volume,简称 GMV)或者日完单量的问题中,订单的送达状态取决于配送过程中环境的不确定性、骑手们的工作业务水平、以及骑手们对承担风险的态度等多方面因素,有一些因素只有骑手们自己知道,而平台并不能完全掌握。
那么,采用非线性激励机制是否一定会提升平台整体的运营效率呢?从管理学理论上讲,基于绩效的激励机制包含激励强度的“斜率”(slope of incentive intensity)和激励的“形状”(shape of incentive contract)两个特征:斜率是指激励强度关于绩效的变化率,例如,超时率增加一个单位将会带来的收入惩罚绝对变化值,而形状是指激励关于绩效水平的非线性(或者称凹凸性)。
研究表明,高激励斜率有助于改善绩效水平,而强非线性将会增强个体承担风险的偏好;同时,最新的实证结果显示,激励的斜率会影响个体的风险偏好,而激励的形状也会影响绩效水平。
因此,构建基于骑手工作绩效的激励机制需要综合上述多方面因素,合理选择激励关于绩效水平的斜率和形状,这样有助于提升配送系统整体的效率。
骑手考核周期是否可以延长?
为了进一步帮助骑手降低收入的波动性,平台可以考虑延长对骑手的考核周期,将以较短“时间段”(例如,现在平台的冲单奖励活动和考核时间段一般是一天的某个时段),或者以“天”为单位的奖励或者惩罚考核周期适当延长至“星期”甚至“月”,通过实践寻找出最佳的考核周期,以降低骑手对短期高频考核的焦虑,提高系统的整体效率。
类似基于时间段的冲单奖励看起来有助于满足高峰期时段的旺盛需求,但是,关于共享经济商业模式的实证研究表明,理性的服务提供者为了尽可能获得活动期的高冲单奖励,可能会选择在活动期开始之前策略性的停止工作,以等待高峰期的到来,这种“前瞻”(forward-looking)行为将会导致平台在高峰期到来之前的运力供给出现下降,给整个系统的运行效率造成负面影响。
考核周期的延长将有助于平滑骑手在不同时间段内的平均收入,激励骑手们维持稳定的服务质量水平,保障平台总体运力的平稳运行。那么,平台是否应该尽可能延长或者缩短激励机制中的考核周期呢?最近,一份关于产品销售人员薪酬体系设计的研究表明,销售人员的工作绩效将会显著受到考核周期的影响:当平台将激励机制的考核周期缩短时(比如,从“月”度考核调整为“天”度考核),原本优秀的销售人员就表现出了下降的绩效水平。
值得关注的是,已有的行为学实验研究和现实商业现象表明,基于考核目标的高频绩效评估会潜在地增加人员的焦虑心理和工作压力,甚至会因为激发人员过于激进而引发欺诈和不道德行为。
基于上述结论,并结合现实中“外卖小哥在电梯里急哭了”和逆行违章等现象,我们可以总结到,在外卖市场中,虽然商品性质和商业逻辑并不一样,但平台也需要综合骑手们的配送努力程度,配送能力的差异性,以及他们在进行运力供给决策中的前瞻行为等综合因素,非常谨慎地制定出有助于降低骑手收入不确定性和提升平台整体服务能力的最佳的考核周期。
多层次多属性绩效评估
除了上述直接根据“超时率”和“完单量”评估骑手绩效的指标,平台应该建立基于综合服务质量、配送效率和安全保障等多属性的多层次骑手绩效评估体系。当前,系统为骑手设置的积分等级体系是直接基于完单量、准时率或者顾客评价奖励积分,可以进一步提升骑手们的安全保障、违章记录、以及公益活动等有助于建设外卖生态体系的多个属性的重要性。
评估体系可以尝试根据政府部门监管法规和平台发展目标为不同评估指标设定优先级,其中,遵守交通安全法规应该成为外卖配送的基本要求。
在多层次多属性绩效评估体系的设计过程中,在第一层次,考虑到遵守交通安全法规是外卖配送的基本要求,那么,骑手的“违章率”就需要摆在优先级最高的位置,在一定的考核期内,如果骑手的“违章率”超过了阈值,则该骑手将被“一票否决”,不会进入到下一层次的绩效评估;在第二层,维持并且提升市场占用率可能是当前平台运营的关键目标,那么,骑手们的“完单量”可以摆在优先级次高的位置,在对“完单量”合理划分不同等级的奖励区间之后,各骑手再根据实际“完单量”进入相应的评估区间;最后,在特定的基于“完单量”的评估区间内,机制再综合服务质量和顾客评价等属性设定奖励金额。
另外,平台可能需要同时实现“违章率”、“日成交单量”和“超时率”等多个关键绩效的管理目标,对此多属性绩效目标导向的决策问题,平台不仅需要考虑到实际绩效水平和管理目标的不确定性,还需要关注多个绩效指标之间的相关性(例如,严格控制“违章率”会减少当前的“日成交单量”)对绩效评估体系的影响。
多向评分反馈体系
外卖市场主要是由顾客、平台、商家和骑手共同建立起来的生态圈,当前系统采取的是顾客给商家或者骑手的单向评分方式,忽视了骑手们的重要作用。平台可以建立起“多向”评分反馈系统,其中,顾客给商家和骑手分别评分,顾客对商家的菜品健康和口味等进行反馈,对骑手的派送服务进行反馈;骑手也可以自由选择给商家评分,反馈商家出餐及时性等信息;更进一步地,骑手还可以给顾客评分,反馈订单交付难度和顾客接单态度等信息。
与此同时,平台根据商家、顾客和骑手们的权力和义务,并综合天气、路况和其它不可控因素等,设定公平合理的判责系统。
在实际商业场景中,例如,网约车市场,不仅乘客可以给司机评分,司机也可以向乘客评分。本质上而言,建立多方评分反馈系统(multi-lateral rating systems)的核心目的是增强在线市场中各参与方之间的信任度,降低各参与方之间的信息不对称性,从而“驱逐”低质量的参与方,并且降低交易成本。
为此,平台需要认真思考两个重要问题:一方面,相比于传统的单向评分反馈系统,多向评分反馈系统是否真的会提升市场效率和社会福利?另一方面,由于参与方做出准确的评分是基于自愿且需要付出成本的,在平台没有提供适当奖励的情况下,作为公共产品的用户评分将会供给不足;因此,如果采取多向评分反馈系统,平台应该如何激励尽可能多的参与方真实地披露信息并给出可信的评分结果?
关于第一个问题,以共享经济商业模式为背景的理论研究表明,相比于仅有顾客的单向评分,顾客和服务提供者之间的双向评分将弱化服务提供者之间的竞争,从而提高市场的均衡价格;另外,在一定条件下,双向的评分机制将会提升社会福利。
关于第二个问题,平台需要合理设计向各参与方展示彼此评分结果的方式和时间:如果平台在参与方完成评分之后立刻披露结果,那么,相关的被评价方可能在后续采取报复动作,故意压低对方的评分,从而导致顾客评分的“失真”;但是,如果平台在双方或者多方都完成评分或者允许评分的时间窗结束之后才披露结果,那么,这种策略将会显著降低评分者进行报复的可能性,并且增加评分的真实性和供给量。
优化建议:
顾客端:餐馆推荐系统
平台可以在实时餐馆推荐系统的设计中采用更多与应用场景相关、反映实时供需情况和骑手空间分布的数据。例如,针对一个商家,如果过去 1个小时的骑手等待时间较短、当前周边分布的骑手较多、店内聚集的正在等待取餐的骑手较少、或者正在准备的订单数量较少等,在其它属性相近的条件下,那么,该商家在推荐排序算法的输出结果中可以被优先推荐。
推荐系统还可以根据实时已有订单的餐馆和骑手位置进行拼单推荐,实现外卖的“顺风车”。例如,如果一位骑手正在顾客周边的商家等待取单,而且预估取餐时间较长,那么,即使该商家不是距离顾客最近或者价格最低,推荐系统也可以在一定程度上提高该商家的推荐权重和优先级。
在当前实现的推荐系统中,算法输入的应用场景数据至少由三大类组成:一是用户画像,例如,性别、常驻地、价格偏好、食物偏好等;二是食物画像,包含商家、外卖、团单(即团购订单),其中,商家特征包含商家价格、商家好评数、商家地理位置等,外卖特征包含平均价格、配送时间和销量等,团单特征包含适用人数和返购率等;三是场景画像,包含用户当前所在地、时间、定位附近商圈、基于用户的上下文场景信息等。
如果基于上述方案改进餐馆推荐系统,系统可以采用基于在线优化(online optimization)和增强学习(reinforcement learning)的算法,实时更新客户端的餐馆推荐结果,最终将餐馆推荐系统打造成调节市场供需平衡状态的重要工具之一。另外,关于实现外卖的“顺风车”,类似思想已经在网约车市场中实现,目的是希望通过将目的地相近或者顺路的订单整合在一起,从而提升配送资源的利用率,其中,需要同时解决订单与骑手的双边匹配问题、以及针对“顺风车”订单的配送费定价问题。
顾客端:预计送达时间预测算法
预计送达时间预测算法可以融合来自骑手的手机 GPS 实时定位数据、手机运动传感器移动数据、和安卓操作系统特定应用程序搜集的活动识别数据等多源异质数据集,识别骑手在不同时刻所处的活动状态以及状态改变的时间点。这将有助于提升订单交付时间的预测准确性,尤其是和楼层高度、小区内配送和顾客交付相关的时间。同时,为了明确商家和骑手的责任,并且方便顾客对商家和骑手进行公平的评分,平台应该分别预测、显示和评估“商家出餐时间”和“骑手送餐时间”。
在外卖配送场景中,预计送达时间(ETA)是用户成功下单时刻到骑手将外卖送达到顾客手中的送达时间预测结果,具体可以分解为压单时间(从商家接单到骑手接单)、到店时间(从骑手接单到骑手到店)、取餐时间(从骑手到店到骑手取餐)、送餐时间(从骑手取餐到到达用户)、以及交付时间(从到达用户到完成送达),此过程还包含了出餐时间(从商家接单到商家出餐)。
关于骑手送餐时间,一个最大的技术性挑战,也是目前网友们激烈讨论的实际问题是对交付时间的预估,即骑手到达用户附近下车后多久能送到用户手中:一方面,老旧小区没有电梯、或者写字楼难以等到电梯等现实问题给骑手们快速交付订单带来困难;另一方面,在进行交付时间预估时,算法的输入字段较少,重要的维度特征仅包括交付地址(文本数据)、交付点的经纬度、区域、以及城市。
对此,如果基于手机GPS实时定位数据、手机运动传感器移动数据(motion sensor data)、以及安卓操作系统ActivityRecognitionClient API搜集的活动识别数据(activity recognition data)等改进ETA预测算法,平台将更清晰地识别骑手运动状态,例如,电动车骑行中、步行中、奔跑中或者原地等待中等,然后采用深度学习方法进行序列建模(sequence modeling),实现对ETA尤其是交付时间的更准确地预测。
骑手端:派单算法
在派单过程中,派单算法应当考虑骑手之间的订单负载均衡,让不同骑手当前累积分配到的订单数量相对比较平均,避免出现个别骑手承载过大的配送任务、而有些骑手被闲置的局面。同时,派单算法还应当考虑骑手在当地区域的熟知程度和配送经验等有助于提升派单效率的多种因素。
实时派单算法是智能配送系统中的重要组成部分,当前的实时派单问题被描述为以离散马尔可夫决策过程(Markov Decision Process)为核心的动态随机优化问题,其目标是一段时间内的顾客体验(例如,准时率)和骑手效率(例如,单均行驶距离或者单均消耗时间)等指标最优,算法需要计算动态到达的订单分配给骑手的策略、以及每个骑手后续的节点访问顺序(即路径规划,routing optimization)。
在对该问题进行合理建模和算法优化之后,派单算法可以实现骑手订单负载均衡(workload balance)和融合骑手当地区域知识和配送经验。对此,建模人员可以通过在目标函数中引入“最大化所有骑手的最小订单负载”(maxmin)或者“最小化所有骑手的最大订单负载”(minmax)的方式进行调整。
另外,派单算法引入骑手在当地区域的熟知程度和配送经验等因素,这不仅意味着 ETA 的预测算法需要纳入骑手在当地区域的熟知程度和配送经验等重要指标,也意味着派单算法需要考虑骑手们之间在这两个维度上的差异性。综合以上因素,由多目标优化算法(multi-objective optimization)给出满足多个目标的最佳派单结果。
骑手端:路径规划算法
与派单算法紧密关联的是路径规划算法,算法应该引入与实际路况更为贴切的特征,例如,单行道、限行、机动车道和非机动车道,以及交通管制和交通拥堵等,并且根据实时信息进行调整。
针对骑手路径规划的问题,平台需要建立基于有向图的实时动态路径规划模型,输入该模型的可行路径集合(set of feasible routes)需要根据离线信息进行缩小,例如,许多单行道、限行路线和过街天桥不允许电动车经过的路线就应该作为强约束从集合中剔除;另外,该集合还需要根据实时信息进行调整,例如,出现严重交通拥堵或者临时交通管制的路线也应该被剔除。
同时,面对随机的订单需求和配送时长,该问题可以考虑借鉴离线-在线近似动态规划算法或者在线再优化策略的思想进行求解。
平台端:算法参数管理
平台端对算法参数进行及时审核并且合理设置是解决外卖骑手困境的关键之一,在此应该得到重点关注。这个问题起源于平台在预测订单“预计送达时间”探索实践中的模型迭代过程:在实际的ETA预估场景下,算法的损失函数设计是以“整体的预估结果能够尽量前倾”为目的,而且对于迟到部分会增加数值惩,这意味着算法在不断“逼迫”骑手缩短实际送达时间,而骑手每一次成功避免超时的历史记录都会让算法“学习”到可能更短的送达时间,即便这个送达时间是骑手通过闯红灯、逆行等违反交通规则甚至冒着生命危险的方式实现的。基于此逻辑,这些历史数据会进一步提高算法对骑手送达时间的“期待”,从而使算法朝着缩短送达时间的方向进行要求和优化。
对此,平台应该通过对实际送达时间等算法的参数进行及时审核和调整以终止上述的恶性循环,也就是赋予算法“底线思维”。遵守交通法规和维护行人安全是不可逾越的底线,是数据预处理环节进行历史数据清洗和校正必须考量的因素,是数学模型中的“硬约束条件”,也是优化算法剔除不可行路径中必须满足的规则。这也意味着订单送达时间应该存在着一个合理的、无法通过算法不断优化而逾越的下界,否则,不管在任何激励机制和评分体系之下,缺乏“底线思维”的算法流程会一直将骑手困在系统之中。
平台端:基础设施建设
针对最后 100米配送问题,平台可以尝试自建或者联合第三方物流公司建设外卖取餐柜。取餐柜的候选位置可以是办公场所、写字楼、医院以及高校,而顾客可以选择线上下单、线下取餐。
考虑到取餐柜的选址将会影响顾客线上下单、线下取餐的便利性,平台可以进行两阶段的取餐柜网络设计优化:在第一阶段,平台可以结合各个区域的人口社会统计、经济发展、历史完单、以及配送时长等多维度数据建立机器学习模型和计量经济学模型以预测各区域的潜在需求和建立取餐柜对需求的影响;在第二阶段,平台可以建立取餐柜设施选址和骑手服务区划分的多阶段随机规划模型,联合优化取餐柜的位置和骑手的派单服务策略。
除此之外,在需求量较大的办公楼、小区、学校和医院等场所,平台也可以考虑配备专职的终端派送人员,一方面是因为终端配送人员对小区周边和电梯设备更加熟悉,可以帮助降低因骑手对环境陌生而造成的顾客等待时间,另一方面是能够实现对局部区域的订单统一管理和配送、从而避免骑手的重复劳动。
配备专职终端人员在提升平台整体运营效率的同时也会增加平台的运营成本,需要进行深入的成本-效益分析。分析框架可以将配送过程视为一个排队系统,在指定场所配备专职的终端配送人员将会增加固定人力成本,但是,值得关注的是,根据排队论,配送骑手的每单的平均派送时间和顾客的等待时间等系统的服务质量指标之间存在着强烈非线形的关系,这意味着通过配备专职终端人员以适当降低骑手们在这些场所所花的派送时间可能会带来系统服务质量指标的显著提高,从而使得带来的配送效益可能会高于额外的人力成本。
供需调节机制
在实际的运营中,外卖平台可以尝试对配送价格进行调整以调节市场供需。平台可以根据配送距离和配送时段等诸多因素合理设计基础的派送价格和骑手端补贴;另外,平台也可以针对突变的供需情况,实时调整骑手的配送费用来缓解供需不平衡的问题。
其实,作为企业收益管理的重要工具,动态定价已经在多个行业得到广泛使用,包括在上个世纪 80 年代开始得到采纳的航空业、90 年代开始得到采纳的酒店业和租车业、以及当前新兴的共享出行行业。
在外卖行业,平台面临的市场供需不协调的问题更加突出,而且市场供需状态随时间变化剧烈。采取不同形式的配送价格可以区分顾客对等待时间的实际需求和时间敏感性,这对提高和使用供需弹性,缓解供不应求带来的负面影响具有一定积极作用;然而,基于配送价格的动态定价机制并不能解决所有问题,无论是在现实生活还是学术研究中仍然存在争议,这依赖于平台对该策略的价值进行更加深入的探究。
基于区域和时间段的时空动态定价
在调节市场供需平衡状态的过程中,平台可以针对每笔订单的配送费实行基于配送区域、下单时间或者送达时间的动态定价,并且对愿意等待的顾客提供愿等打折。
基于区域和时间段的时空动态定价通常可以分为“乘积溢价”和“加和溢价”两类:在特定区域和时间段内,前者是指在基础价格上乘以一定倍数(例如,1.5倍),美国的网约车平台Uber早期就是使用该类溢价策略;而后者是指在基础价格上加上与距离无关的常数(例如,10元),这是 Uber 平台当前采用的最新溢价策略。研究表明,在供需动态变化的环境下,相比于乘积溢价策略,加和溢价策略是激励相容的定价机制,这为外卖平台设计基于配送费的实时动态定价策略提供了新的方向。
值得提醒的是,实时动态定价策略在社会各界中仍然存在争议,理论研究结果显示,在共享出行市场的背景下,理性的乘客和司机会策略性地等待更合适的价格或者收入,如果市场状态比较平稳,那么,平台没有必要采用实时动态定价策略,尤其是该策略可能造成乘客、司机、监管者之间对立的局面。
参考文献:
Ahmadinejad, AmirMahdi, Hamid Nazerzadeh, Amin Saberi, Nolan Skochdopole, and Kane Sweeney. (2019). Competition in ride-hailing markets. Available at SSRN 3461119.
Avery, Christopher, Paul Resnick, and Richard Zeckhauser. (1999). The market for evaluations. American Economic Review , 89(3),564-584.
Bai, Jiaru, Kut C. So, Christopher S. Tang, Xiqun (Michael) Chen, and Hai Wang. (2019). Coordinating supply and demand on an on-demand service platform with impatient customers. Manufacturing & Service Operations Management , 21(3), 556-570.
Basu, Amiya K., Rajiv Lal, V. Srinivasan, and Richard Staelin. (1985). Salesforce compensation plans: An agency theoretic perspective. Marketing Science , 4(4), 267-291.
Bertsimas, Dimitris, Patrick Jaillet, and Sébastien Martin. (2019). Online vehicle routing: The edge of optimization in large-scale applications. Operations Research , 67(1), 143-162.
Bolton, Gary, Ben Greiner, and Axel Ockenfels. (2013). Engineering trust: reciprocity in the production of reputation information. Management Science , 59(2), 265-285.
California Legislative Information. Assembly Bill No. 5. September 18, 2019. https://leginfo.legislature.ca.gov/faces/billTextClient.xhtml?bill_id=201920200AB5.
Calo, Ryan, and Alex Rosenblat. (2017). The taking economy: Uber, information, and power. Columbia Law Review , 117, 1623.
Chen, Yiwei, and Ming Hu. (2020). Pricing and matching with forward-looking buyers and sellers. Manufacturing & Service Operations Management , 22(4), 717-734.
Chung, Doug J., Das Narayandas, and Dongkyu Chang. (2020) The effects of quota frequency: Sales performance and product focus. Management Science .
de Figueiredo Jr, Rui JP, Evan Rawley, and Orie Shelef. (2019). Bad bets: Nonlinear incentives, risk, and performance. Strategic Management Journal . https://doi.org/10.1002/smj.3111
Einav, Liran, Chiara Farronato, and Jonathan Levin. (2016). Peer-to-peer markets. Annual Review of Economics , 8, 615-635.
Fradkin, Andrey, Elena Grewal, and David Holtz. (2020). Reciprocity in two-sided reputation systems: Evidence from an experiment on Airbnb. Working Paper, MIT Sloan School of Management. https://andreyfradkin. com.
Garg, Nikhil, and Hamid Nazerzadeh. (2019). Driver surge pricing. arXiv preprint arXiv:1905.07544.
Glaeser, Chloe Kim, Marshall Fisher, and Xuanming Su. (2019). Optimal Retail Location: Empirical Methodology and Application to Practice: Finalist–2017 M&SOM Practice-Based Research Competition. Manufacturing & Service Operations Management , 21(1), 86-102.
Hagiu, Andrei, and Julian Wright. (2019). The status of workers and platforms in the sharing economy. Journal of Economics &Management Strategy , 28(1), 97-108.
Ke, Jintao, Hai Yang, Xinwei Li, Hai Wang, and Jieping Ye. (2020). Pricing and equilibrium in on-demand ride-pooling markets. Transportation Research Part B: Methodological 139: 411-431.
Ke, T. Tony, Baojun Jiang, and Monic Sun. (2017). Peer-to-peer markets with bilateral ratings. In MIT Sloan Research Paper No. 5236-17; NET Institute Working Paper No (pp. 17-101).
Li, Ruijie, Yu (Marco) Nie, and Xiaobo Liu. (2020) Pricing carpool rides based on schedule displacement. Transportation Science 54(4):1134-1152.
Liu, Sheng, Long He, and Zuo-Jun Max Shen. (2018). On-time last mile delivery: Order assignment with travel time predictors. Management Science .
Lyu, Guodong, Wang Chi Cheung, Chung-Piaw Teo, and Hai Wang. (2019). Multi-objective online ride-matching. Working paper, National University of Singapore. Available at SSRN 3356823.
Morduch, Jonathan. (1995). Income smoothing and consumption smoothing. Journal of Economic Perspectives , 9(3), 103-114.
Schweitzer, Maurice E., Lisa Ordóñez, and Bambi Douma. (2004). Goal setting as a motivator of unethical behavior. Academy of Management Journal , 47(3), 422-432.
Sun, Hao, Hai Wang, and Zhixi Wan. (2019). Model and analysis of labor supply for ride-sharing platforms in the presence of sample self-selection and endogeneity. Transportation Research Part B: Methodological , 125, 76-93.
Tsetlin, Ilia, and Robert L. Winkler. (2007). Decision making with multiattribute performance targets: The impact of changes in performance and target distributions. Operations Research , 55(2), 226-233.
Tunc, Murat M., Huseyin Cavusoglu, and Srinivasan Raghunathan. (2019). Two-sided adverse selection and bilateral reviews in sharing economy. Available at SSRN 3499979.
Uber Blog. California drivers: Set your own fares when you drive with Uber. June 25, 2020.
https://www.uber.com/blog/california/set-your-fares/.
Uber Engineering. How trip inferences and machine learning optimize delivery times on Uber Eats. (2018). https://eng.uber.com/uber-eats-trip-optimization/.
Ulmer, Marlin W., and Barrett W. Thomas. (2018). Same-day delivery with heterogeneous fleets of drones and vehicles. Networks ,72(4), 475-505.
Ulmer, Marlin W. Justin C. Goodson, Dirk C. Mattfeld, and Marco Hennig. (2019). Offline–online approximate dynamic programming for dynamic vehicle routing with stochastic requests. Transportation Science , 53(1), 185-202.
Wall Street Journal. (2015). Now prices can change from minute to minute. December 14, 2015.https://www.wsj.com/articles/now-prices-can-change-from-minute-to-minute-1450057990.
Wang, Hai, and Amedeo Odoni. (2016). Approximating the performance of a “last mile” transportation system. Transportation Science , 50(2), 659-675.
Wang, Hai. (2019). Routing and scheduling for a last-mile transportation system. Transportation Science , 53(1), 131-147.
Zoltners Andris A, PK Sinha, and Sally E. Lorimer. (2016). Wells Fargo and the slippery slope of sales incentives. Harvard Business Review . (September),
https://hbr.org/2016/09/wells-fargo-and-the-slippery-slope-of -sales-incentives.
滴滴出行. 滴滴专车司机作弊违规处罚标准. 2019 年 04 月 24 日. https://www.eycen.com/post/545.html.
发展改革委网站. 关于支持新业态新模式健康发展 激活消费市场带动扩大就业的意见. 2020 年 07 月 14 日. https://www.ndrc.gov.cn/xxgk/zcfb/tz/202007/t20200715_1233793_ext.html.
金融界. 浙江湖州外卖骑手撞伤行人,法院判未签劳动合同的平台需担责. 2020 年 09 年 15 日.https://baijiahao.baidu.com/s?id=1677901965178599201&wfr=spider&for=pc.
京东. 什么是退换货运费险?2019 年 12 月 10 日. https://help.jd.com/user/issue/430-499.html
美团研究院. 新时代 新青年:2018 年外卖骑手群体研究报告. 2019 年 1 月 17 日.
https://s3plus.meituan.net/v1/mss_531b5a3906864f438395a28a5baec011/official
website/c21d0443-decf-41d5-9813-ef8eaa6516d0.
美团技术团队. 深度学习在美团推荐平台排序中的运用. 2017 年 07 月 28 日. https://tech.meituan.com/2017/07/28/dl.html.
美团技术团队. 即时配送的 ETA 问题之亿级样本特征构造实践. 2017 年 11 月 24 日.
https://tech.meituan.com/2017/11/24/gbdt.html.
美团技术团队. 美团外卖骑手背后的 AI 技术. 2018 年 03 月 29 日. https://tech.meituan.com/2018/03/29/herenqing-ai-con.html.
美团技术团队. 深度学习在美团配送 ETA 预估中的探索与实践. 2019 年 02 月 21 日.
https://tech.meituan.com/2019/02/21/meituan-delivery-eta-estimation-in-the-practice-of-deeplearning.html.
美团技术团队. 配送交付时间轻量级预估实践. 2019 年 10 月 10 日. https://tech.meituan.com/2019/10/10/distribution-time-prediction-practice.html.
美团技术团队. 美团智能配送系统的运筹优化实战. 2020 年 02 月 20 日. https://tech.meituan.com/2020/02/20/meituan-delivery-operations-research.html.
青年报. 快递、外卖行业交通事故频发 去年 117 起事故致 9 死 134 伤. 2018 年 02 月 10 日.
http://app.why.com.cn/epaper/webpc/qnb/html/2018-02/10/content_51905.html.
人物. 外卖骑手, 困在系统里. 2020 年 9 月 8 日. https://mp.weixin.qq.com/s/Mes1RqIOdp48CMw4pXTwXw.
依稀还记得去年 9 月一篇《外卖骑手,困在系统里》火遍全网。我们唏嘘算法的冷漠与刻板,同情骑手的无奈与艰辛,同时也开始担忧人类是否在逐渐沦为算法的“奴隶”,而后算法的存在也开始变得“妖魔化”。
但归根结底,这并不是“算法”自身的问题,而是制造算法和使用算法的“人”的争议。在人们批判算法“没有道德”、“冷血无情”的时候,是否想到其实算法只是一个在数字经济时代下、初衷在于改善人们生活而诞生的技术?算法并不能决定人的生死,它也志不在此。
最后,引用两位网友对美团公开算法规则的看法,希望大家不再一味将算法视为“原罪”,理智评判技术为我们带来的意义:
技术分析
就这个问题求解了搞智能工厂的朋友, 他饶有兴致地给我科普了一下MES跟APS
APS的作用:根据工厂的生产资料(人员、原料、设备等)跟生产需求,通过算法计算出最近生产排单
MES的左右:接受APS的排单指令,安排车间进行生产,并采集生产数据(人员工时、原料消耗与采购、产品生产进度等数据)反馈给APS,给APS下一步的排单运算提供实时数据支持
那啥叫MES跟APS?
MES (Manufacturing Execution System) 制造执行系统
MES是位于上层的计划管理系统与底层的工业控制之间的面向车间层的管理信息系统”,它为操作人员/管理人员提供计划的执行、跟踪以及所有资源(人、设备、物料、客户需求等)的当前状态。MES的功能包括:
1) 数据采集(DataCollection/Acquisition)该功能通过数据采集接口来获取并更新与生产管理功能相关的各种数据和参数,包括产品跟踪、维护产品历史记录以及其它参数。这些现场数据,可以从车间手工方式录入或由各种自动方式获取。
2) 过程管理(Process Management)该功能监控生产过程、自动纠正生产中的错误并向用户提供决策支持以提高生产效率。通过连续跟踪生产操作流程,在被监视和被控制的机器上实现一些比较底层的操作;通过报警功能,使车间人员能够及时察觉到出现了超出允许误差的加工过程;通过数据采集接口,实现智能设备与制造执行系统之间的数据交换。
3) 人力资源管理(Labor Management)该功能以分为单位提供每个人的状态。通过时间对比,出勤报告,行为跟踪及行为(包含资财及工具准备作业)为基础的费用为基准,实现对人力资源的间接行为的跟踪能力。 6、维修管理(MaintenanceManagement)该功能为了提高生产和日程管理能力的设备和工具的维修行为的指示及跟踪,实现设备和工具的最佳利用效率。
4) 资源分配及状态管理(ResourceAllocationandStatus)该功能管理机床、工具、人员物料、其它设备以及其它生产实体,满足生产计划的要求对其所作的预定和调度,用以保证生产的正常进行;提供资源使用情况的历史记录和实时状态信息,确保设备能够正确安装和运转。
5) 生产单元分配(DispatchingProductionUnits)该功能以作业、订单、批量、成批和工作单等形式管理生产单元间的工作流。通过调整车间已制订的生产进度,对返修品和废品进行处理,用缓冲管理的方法控制任意位置的在制品数量。当车间有事件发生时,要提供一定顺序的调度信息并按此进行相关的实时操作。
6) 生产的跟踪及历史(ProductTracking and Genealogy)该功能可以看出作业的位置和在什么地方完成作业,通过状态信息了解谁在作业,供应商的资财,关联序号,现在的生产条件,警报状态及再作业后跟生产联系的其他事项。
7) 执行分析(PerformanceAnalysis)该功能通过过去记录和预想结果的比较提供以分为单位报告实际的作业运行结果。执行分析结果包含资源活用,资源可用性,生产单元的周期,日程遵守,及标准遵守的测试值。具体化从测试作业因数的许多异样的功能收集的信息,这样的结果应该以报告的形式准备或可以在线提供对执行的实时评价。
APS高级计划排程系统(Advanced Planning and Scheduling)
APS是利用许多进步的管理规划技术,包括限制理论(Theory of Constraints,TOC)、运筹学(Operations Research,OR)等,在有限资源下,追求供给与需求间的平衡规划;同时,利用资讯的储存与分析能力,以最短的期限,达到最有效的规划。
需要注意的是,目前市面上的一些国外APS都是拉通式排产,并非是可执行有限产能计划。计划依然是MPS无限产能计划,不能够管控误差和约束,也不能将供应商或者节奏进行有效的协同。
无限产能纯排产的模式是无法适用企业的,因为直接排产意味着直接铺开过于精细的管理单元,一旦出现生产或者销售的异常情况,局部的变更调整会导致大面积的排产错乱和现场混乱,造成额外的管理费用和沟通成本。
优秀的APS应该是“计划+排产”模式,通过多维度约束和合理预留缓冲保证交期,制定生产计划,在准确计划的前提下细化机器排程。这不仅达成准时交付目标,也为异常应急处理奠定基础,最终稳定生产按期交付,提高客户满意度。
他接着跟我说:
从APS角度理解美团的配送大脑算法 智能调度系统是外卖配送平台的超级大脑,从公开的文章中,试着从计划排产排程角度理解这个超级大脑。
核心功能“订单分配”
订单分配问题一般可建模为带有若干复杂约束的 动态整车路径规划DVRP(Dynamic Vehicle Routing Problem)问题,可以追溯到典型的TSP(旅行商问题),这就是著名的NP难题(非确定性多项式)
TSP(旅行商问题)通常的求解方案主要有:
(1)TSP_旅行商问题- 蛮力法( 深度遍历优先算法DFS )
(2)TSP_旅行商问题- 动态规划
(3)TSP_旅行商问题- 模拟退火算法
(4)TSP_旅行商问题- 遗传算法
(5)TSP_旅行商问题- 粒子群算法
(6)TSP_旅行商问题- 神经网络
还有另一种说法的解决方案
(1)数学解析法
(2)人机互动法
(3)先分群再排路线
(4)先排路线再分群
(5)节省法或插入法
(6)改善或交换法
(7)数学规划近似法
先不纠结哪种算法,只需记住一点,这是个数学难题!
将订单分配问题建模,可以理解为:决策变量加上约束条件进行目标优化
★部分变量和约束可以用历史数据或模拟来生成,这里就是机器学习,这算是AI的一种应用吗?
订单分配问题演变成A骑手路径规划B骑手分配方案,这两个部分会互相影响,也可以互相迭代优化
B骑手分配方案 采用二分图匹配(匈牙利算法和KM算法)。
A骑手路径规划 涉及三层逻辑:⑴长期基础规划(网络/运力)⑵中短期市场需求平衡 ⑶短期实时匹配,看到这里是不是很熟悉,和工厂标准计划层次一模一样,长期产能-中短期平衡-短期排程。
其中一个“智能骑手排班”模块,有三个参数:按组排班(骑手分组),半小时为排班最小时长(高峰低谷),运力校验(每时间单元的进单量除以峰值单量),这实际上是一个产能匹配过程。
路径规划则涉及订单-取送餐任务-通行时间-承诺送达时间,这个场景可能一个骑手身上有很多配送任务,这些配送任务存在各种约束,怎样选择最优配送顺序去完成所有任务,然后,这又是一个TSP难题,前面提到了TSP的若干种算法,但在实际应用中,NP难题直观上就是目前计算机科学家们现在没有找到有效算法可以解决的问题!
但实际上,美团的算法专家将这个TSP问题转化为“流水线调度问题”,每个订单可以认为是任务;一个订单的两个任务取餐和送餐,可以认为是一个任务的执行;任意两个任务点之间的通行时间,可以认为是序列相关的准备时间。每一单承诺的送达时间,包括预订单和即时单,可以映射到流水线调度问题中的提前和拖期惩罚上。
流水线调度问题:加工一件物品,有n条流水线,每条流水线都有m个工序,不同流水线的相同工序处理功能相同,但处理时间可能不同,为t [i] [j]。. 若工序的进出站时间不计,流水线的调换时间也不计。. 求加工一件物品最少需要多少时间
流水线调度问题在学术界和工业界已经被研究很多年,其结果是一个序列,有大量的启发式算法可以借鉴,这也是APS的核心
APS排程结果其实是一个序列(排序),而序列(排序)一旦生成,很方便用于插单操作和路径(时间)预估,即使有干扰和异常发生,也很容易进行时间重计算。
美团配送为什么能发展到今天,一个很重要的原因就是它完成了配送的工业化,工业化意味着效率快速提升,想想还有哪个行业没有实现工业化?
一顿说完,我还是分享出来,大家一起琢磨琢磨~
作为运筹学的博士,几年前也曾经采访过美团配送的技术负责人,所以借助这个机会也特地做一些关于配送算法方面的科普。几年前的采访文章,感兴趣可以看一下:
这里边涉及到两个问题:1是需要对骑手到达时间进行一个预测(这本质上是一个预测问题,可以采用机器学习方法来进行预测);2是基于之前预测出的到达时间将订单分配给骑手(这本质上一个决策问题,可以采用运筹学的方法来解决)。
配送系统输出的就是一个配送的方案,就是每个订单由哪个骑手去配送。这个在我们专业术语中被称为决策变量,可以由如下表达式确定:
(1)
在订单配送中有一些规则是绝对不能违反的,在运筹学中是通过约束来描述这些规则的。那么在订单配送中主要就是2个约束,这2个约束也是很显而易见的,如下所示:
这个很好理解我就不多解释了,如下式所示:
(2)
其中 为所有订单的集合, 为所有骑手的集合。
我们不能一下子给骑手安排太多的订单,因此我们用一个常数 来描述骑手能接订单数量的上限。另外每个订单的工作量是不一样的,有的订单距离远工作量就大,有的订单距离近工作量就小,所以我们还需要用 来描述每个订单的工作量,相当于给每个订单做了一个加权。由此我们可以给出骑手配送能力上限约束:
(3)
我们做配送算法的根本目的是什么?就是要让所有订单配送的延误时间最小。我们设 为订单 实际配送到用户的时间, 为订单 计划配送的时间。点过美团外卖的都知道,在我们刚下单的时候系统里马上就有一个订单预计到达时间,这个时间就是 。所以我们的目标就是希望实际到达时间 和这个预计到达时间 尽量接近,所有如下目标函数:
(4)
不难发现这里边难点在于实际到达时间 不太好确定,它和订单本身有关(订单距离的远近,订单商家出餐快慢),还和路况有关(路上有没有堵车),还和天气有关,还和订单所处每天的时间段有关(例如中午饭点餐厅很忙,路上送餐的人也非常多)还和骑手有关(熟练的骑手和不熟练的骑手肯定配送有差异),还和订单配送的客户有关(例如客户不在家,客户手机无人接听等等)。
所以 是一个随机变量,严谨点的话 我们应该将上式改写为 期望的形式:
可以看到影响 的因素非常多,这些因素背后的机理也是多种多样的,很多因素也是事先很难确定出来的。所以从纯学术问题的探讨来看,上面给出的订单配送问题(1-4) 是运筹学中的广义指派问题,虽然想获得广义指派问题的最优解也并不容易,但是目前来说求解大规模的广义指派问题的算法已经有很多了,都还可以取得相当不错的效果。因此能否准确预测出 是订单分配问题能否得出一个理想结果的关键点和难点所在。
上面是纯学术问题的探讨和科普,和伦理道德,和骑手配送体验,和用户体验等等无关。下面我聊一点个人对这个外卖配送系统的看法。
可能很多骑手会说“我不懂什么算法,我也不关心什么公开算法流程和数据,我就关心你们得出的结果。”可能很多点餐用户又会说“我不懂什么算法,我也不关心什么公开算法流程和数据,我就关心我能不能付出较低的配送费用按时按点吃上外卖。”
OK,我觉得这个说法没有问题。公开意味着有了监督,你不懂算法过程,自然有人能懂。例如马航MH370出事的原因就是在于信息的不公开。在马航MH370出事之后,各国都强制在民航飞机上安装 ADS-B系统(一种主动雷达系统可以实时向空中广播飞机的当前位置 高度 速度等信息,任何人借助一些设备都可以收听这个广播)。对于大多数普通人来说你不会闲着没事去收听每个航班的ADS-B信号,但是公开本身就意味着总有人能收听,这就意味着有人能监督,出了事情也会很快找到是谁的责任,而不会重蹈马航MH370的覆辙。
另外一方面对于我们这些研究者来说,除了可以监督之外,也可以利用这些数据和算法来自己研究配送算法,乃至于改进配送算法,实现整个配送效率的提升。
最后是我个人的一点碎碎念,外卖配送问题,快递配送问题,库存管理等等这些背后所用到的算法都是运筹学。而普通人对运筹学没有什么概念,但实际上运筹学已经深入到我们生活的方方面面了,只是更多的时候它是在背后悄悄地发挥作用普通人看不到,也了解不到。希望借助这次美团公开外卖订单分配算法的契机,能够更多的科普运筹学,提升普通人对运筹学的认识。我坚信科技能改变我们的生活,运筹学能提升我们的生活质量,但科技并不能解决我们目前面对得所有问题。
参考文献:Liu, S., He, L., & Max Shen, Z. J. (2020). On-Time Last-Mile Delivery: Order Assignment with Travel-Time Predictors. Management Science.
记得今年夏天在去南京的高铁上,
有一个中国人带着两个日本人坐在我后面,看起来是日企的中国员工带着日本领导出行。
他们三个(尤其是日本人)说话声音有点大,让我不自觉地就听到他们的谈话。
两个日本人会讲一些中文,口音很重,时不时遇到不会讲的词就会换成英语和中国人交流。
我记得很清楚有这么一个对话
“那个,窗外的,就是中国的乡村吗?”
————当时正好经过一片田野
“是的,这就是普通的农村。”
一片惊叹声,“看起来太好了,比日本xxxxxx(夹杂了一堆乱七八糟的中文,听不懂),简直和这个火车一样优秀。”
那一刻我突然感到,时代的风向变了,
中国不再是弱国了。