又到毕业季,今年有4位硕士毕业生从特赞和同济合作的设计人工智能实验室毕业,祝贺他们!特赞也将有好几位不同学校毕业的应届毕业生加入。今年是我们实验室毕业的第5届学生,过去的毕业生有些选择了大厂,有些选择了国企,有些选择了政府,有些选择了创业公司(比如加入特赞),有些选择了继续深造。每年总有年轻人问我到底该去做什么?
回想我自己毕业的时候是非常迷茫的,不知道该做什么。因为研究生毕业之前,只要尽力好好学习,选择最好的学校,而毕业以后的工作,就不存在最优解了,而只存在短期的权宜解。可能工资高一点、机会好一点、起点轻松一点这些局部优势都会成为选择一份工作的决定原因。
一转眼近十几年过去了,如果现在我可以给毕业的学生一些建议,那句应用数学的原理“局部最优不代表整体最优,整体最优一定是局部最优”再合适不过了。我们选择一些短期目标的最优解,可能会带着我们越走越偏离长期的目标。而有时候我们觉得挫折与弯路,却是走向长期目标的最好安排。乔布斯说:我们只能回过头来连点成线。就是这个道理。我曾经考试不中,看上去这个考试的局部最优我并没有抓住,但是回过头来,如果没有考试不中,就不会有卧薪尝胆的努力,也不会有后面一系列的机缘和机会。短期的挫折可能是长期发展的最优解,却不是短期目标(考试)的最优解。
这个道理也是计算机科学的“登山”问题(hill climbing)试图解决的(投资人Chris Dixon也说到过):想象你被放置在随机的丘陵地带,只能看到每个方向几米的距离(假设有雾)。你的目标是到达最高的山丘。首先考虑最简单的算法,在任何给定时刻,向使你爬得更高的方向迈出一步(局部最优)。这种方法的风险在于,如果你恰好从较低的山丘开始,你最终会到达那座较低山丘的顶部,而不是最高的山丘顶部。
而另一种算法是:在行走过程中加入一些随机性。你一开始有很多随机性,随着时间的推移逐渐减少。这让你在开始专注、非随机爬升之前,有更大的机会在更高的山丘附近徘徊。更好的算法是反复将自己放置在地形的随机部分,进行简单的爬山,然后在多次尝试后退一步,决定哪座山丘最高。
但是我们的本能往往是制作一次选择,就进入自身的惯性中去了,然后不断的被当前山丘的诱惑吸引,而不去追究这是不是最高的山丘。人类有一种自然的倾向,就是让下一步是(局部)最优解。他最终会落入行为经济学家所强调的一个常见陷阱:人们倾向于系统性地高估短期回报,而低估长期回报。这个效应在有野心的人身上似乎更强。他们的野心使他们难以接受下一步不上升。
总之,以如下两个角度与走出校门的年轻人共勉。我们可以从应用数学学习:整体最优一定是局部最优,但局部最优不一定是整体最优;我们可以从计算机科学中学习:1)在行走过程中多徘徊一些(尤其是早期);2)随机将自己放置到地形的新部分;3)当你找到最高的山丘时,不要再在当前山丘上浪费时间,无论下一步看起来多么诱人。
局部最优其实这么叫容易误解。
我本科毕业后学习和工作过三四年的系统优化,当时优化始终只有一种目标,就是:找不到另一个解,在任何方面都比当前解优。所以一定意义上这种最优解就是无法被超越了,不是全局,但肯定不是局部。
具体选哪个解,就是看你的“品味” 😁 。反而优化的过程更有意思,要去发现一个个的 pattern,施加一个特定的方法。
这个comment水平很高,要不微信贴下面也留一个?