Optimal Transport: Old and New 最优传输:今与昔

前言

我着手参与2005年圣弗卢尔概率论暑校的授课事宜的时候,不能不说是万分憧憬、受宠若惊又有些如履薄冰*。(编者及译者注:虵和Tom Waits的粉丝应该能get到此处的梗)除了将一个相当“概率论”的东西带给一群大都是分析背景的听众所带来的困难,另一个风险是弄不好就会变成只是把我最近的一本书《浅谈最优传输》再喋喋不休地复述一遍。但是,我渐渐发现这是一个千载难逢的机会:我可以借此把整个故事用另外一套观点、另外一套证明和另外一种聚焦的视角来重塑一遍,并且给出一套更“概率论”的论述,引入一些新鲜出炉的点子。在这些点子里最令人振奋的之一无疑是整个研究者社区渐渐注意到John Mather的最小测度 (minimal measures)和最优传输有着千丝万缕的联系;两者事实上也可以用一套统一的框架来描述。还有一个发现是最优传输可以给Ricci曲率张量的上下界分析提供一个可靠的处理方法。最优传输理论和动力学系统还有微分几何这些千丝万缕的联系在我第一本书里面着墨不多,但是在这里将成为我们整个论述的基础。总而言之,更概率论了,更几何了,也更富于对动力学系统的讨论了。当然我们并不能什么都“更”进一步,所以这一版论述可能某些意义下没那么分析了,也不太物理,有意思的扯淡也可能少一点(译者注:但是译者给出这一版的翻译恰恰是为了加入一些有意思的扯淡!)

所以总体来说这些讲义既不是我那本书的一个简化版,也不是什么扩充,更多意义上应该被看成是一份独立的补充阅读材料。两份材料可以完全独立成书,也可以互为参鉴;我理想当中,这些视角的相互参照应能带来一些启发。

正文被切分成很多小的章节,大体上可以分为三大块:第一块着眼于对于最优传输给出一个定性的描述;第二块着眼于讨论最优传输在黎曼几何里的应用;最后第三块则致力于讨论最近的一个针对Ricci曲率张量有界性的综合解决方案。我对结论和相关展开讨论的优化精练不可不谓是贯穿全书,尤其注重对那些最重要结论给出一个完整的、自洽的证明。很多命题和定理是为了这个课程特别写出来的,另有一些结果首次以一种相当犀利的方式被呈现出来。为了给非专业读者呈现一些数学领域的内容,或者是对一些重要的附加内容提供一些证明,我特别加入了几页附录。这些林林总总的添笔让本书的篇幅膨胀甚多,最后直达我最初计划篇幅的六倍(!)之巨。非专业读者第一次阅读此书的时候,可以跳过那些篇幅冗长的证明,专注在解释、结论、例子和证明的大致思路(如果有的话)。我也试着给出一个比较全面的参考书目——就本书的篇幅膨胀之速而言,这无疑是一个艰巨的任务。

关于术语的问题是这样:想了想我还是觉得用最优“传输”(transport)而不是“传送”(transportation)比较妥当,不过这真的也就是品味问题罢了:)

对于已经比较了解最优传输理论的朋友们,我想特别强调一些重要的改动:从文章立论的一开始,动态的、动力学的观点(重点是麦凯恩McCann的位移插值displacement interpolation这个概念)就被放在了一个突出的位置。这一概念的讨论先于任何在Lagrangian action的抽象设定下,在一个延拓了的长度空间里对Monge问题可解性的讨论。此观点亦包含对长度空间中最优传输问题之处理的一些新进展,及针对在黎曼流形上的光滑拉格朗日代价函数的一类最优传输问题的一些进展。

我详细写下了John Mather(在一些文章中相当知名)的一些重要的估计,并且加以扩展运用,尤其是用来证明中间态的传输映射(从某个中间时刻开始而非初始态开始)的Lipschitz正则性时。如此一来位移插值点的绝对连续性就是显然的,并且这样做将Mather和Monte-Kantorovich的理论统合联系了起来。我也如法炮制地重写了在欧氏空间中Monge问题的二次代价可解性的相关经典定理。最终,这套处理方式允许我们将与最优传输有关的变量表达式的演化用具有Lipschitz性的变量的演化来处理(而非仅仅是讨论个中变化的有界性)。

在第二部分中,很多已知的最优传输的几何应用被放在Ricci曲率的观点下系统地讨论了(或者,更精确一点,曲率维的上下界)。这一部分从对Ricci曲率的引论展开,因此理论上来说读者并不需要相关概念的准备知识就可以着手阅读。

第三部分从对Gromov-Hausdorff收敛性理论的演绎讨论展开。其余部分则主要基于Lott,Sturm和我本人的一些近期工作。

全书中非紧情形被相当规矩地处理了:要么得益于引入极限过程,要么得益于引入限制条件(最优传输的限制条件亦是最优的——这是一个简单但是强大的原理)。Luigi Ambrosio引入此领域的近似可微的概念看起来在研究非紧黎曼空间中的最优传输问题时特别好使!

最优传输理论中有几块我最终决定不去用很多篇幅展开讨论。其中一个是最优传输的正则性:一方面这个东西的容量过大,离有所定论还差得远;另一方面对我们这些讲义来说也没什么必要。最近颇有一些讨论流形上最优传输问题的正则性的工作(主要来自Neil Trudinger,王旭佳(音),Gr´egoire Loeper及其他一些同仁)——显然关于正则性的工作,一个一致、紧凑的体系之形成正方兴未艾。

另一个没有被着墨的问题是对最优传输的数值模拟。除了经典的诸如单纯形算法的方法,有一些更加新鲜的类似Dimitri Bertsekas提出的拍卖算法,以及更新的一些基于Monge-Ampere方程的数值方法。我觉得非常需要一个看得过去的对此一类算法的百科全书式参考目录。

还有另一个没怎么展开讨论的是渐渐在动态系统的研究里浮入视野的Monge-Mather-Mane问题,尤其是一个特例:一类最优传输问题里面基代价函数本身是一个距离。这个问题在几本关于理论Lagrangian mechanics的书里面得到了一些解决,比如Albert Fathi即将出版的专著Weak KAM theorem in Lagrangian dynamics。不过个人认为更理想的是把所有东西用一个能包含最优传输问题于其下的框架重新整理一遍。Patrick Bernard和Boris Buffoni就跨出了这其中重要的一步。这本讲义中倒是会有一点对Mather’s approach的初步介绍,但是其实可讨论的还很多。

我对第22章(测度的收缩)的处理深受Michel Ledoux的书《The Concentration of Meature Phenomenon》的影响。第23章至25章的结果则颇得益于Luigi Ambrosio、Nicola Gigli和Giuseppe Savare的专著《Gradient Flows in Metric Spaces and in the Space of Probability Measures》。我极力推荐将这两份参考文献作为附加的阅读材料。

最优传输在概率论里还有一些其他的经典应用,本书中不再一一细数,有兴趣的读者可以在Svetlozar Rachev和Ludger Ruschendorf的一篇两卷长的论文Mass Transportation Problems里面获得一些补充。

在本文的撰写准备中,我得到了一些朋友和同事们的帮助。其中,Luigi Ambrosio和John Lott是我认为做出了最多贡献的;这些文稿颇得益于他们详尽的评价和建议。第三部分的很大一块,及第一第二部分的重头,都可以追溯到我和John开始于2004年的合作——至今我仍感恩彼时伯克利的Miller学院对鄙人之看顾。同Patrick Bernard和Albert Fathi的促膝长谈使我理解了最优传输的现代理论与Mather理论之间的深刻联系,这种理解也成为第一部分的理论铺陈的基石。除了这些朋友之外,我还要感谢以下这些朋友的鼎力支持,他们是: Fran¸cois Bolley, Yann Brenier, Xavier Cabr´ e, Dario CorderoErausquin, Denis Feyel, Alessio Figalli, Sylvain Gallot, Wilfrid Gangbo, Diogo Gomes, Natha¨ el Gozlan, Arnaud Guilin, Michel Ledoux, Gr´egoire Loeper, Robert McCann, Shinichi Ohta, Felix Otto, Ludger R¨uschendorf, Giuseppe Savar´e, Karl-Theodor Sturm, Anthon Thalmaier, Hermann Thorisson, S¨uleyman ¨Ust¨unel, Anatoly Vershik, 王旭佳(音)及其他一些此处未特别提及的朋友。

这门课程的精简版得到了一些试讲的机会。几次是面向Bonn大学、Dortmund大学、Grenoble大学和Orleans大学背景多样的听众,有一次是在Leysin的Borel研讨会上,还有一次是在Bures-sur-Yvette的IHES活动上。文稿中不可或缺的一部分是在Oberwolfach让人流连的MFO研究所和Luminy的CIRM研究所完成的。所有这些研究机构,本人在此致以诚挚的谢意。

能够在此向Jean Pieard表达本人的谢意是我的荣幸。感谢他组织了2005年度圣弗卢尔暑期学校。另一些致谢献给那些参与了提问、评论和纠错的工作的好朋友们,尤其是Sylvain Arlot(特别感谢他的斧正!),Fabrice Baudoin, Jerome Demange, Steve Evans(同样感谢他带来的精彩课程),Christophe Leuridan, Jan Obloj, Erwann Saint-Loubert Bie和其他一些朋友们。我也在此对一群有爱的博士小朋友们表示我的谢意,感谢他们作为东道主让我在圣弗卢尔享受到了可口的食物、安逸的居所及这整段舒适的旅程中不可胜数的其他有趣的日程。(也特别感谢我的私人司机,Stephane Loisel和我的乒乓球球伴Francois Simenhaus)

这些讲义的输入大都是在Miller学院赠送给我的这台值得信赖的笔记本上完成的。我永远感谢那些让数学家们能够用上便利的输入系统的先驱者们,特别是发明了TeX的Donald Knuth,以及开发了LaTeX,BibTeX和XFig的设计者们。

一如既往,我欢迎读者朋友们告诉我书中误写误印的地方。此书发表后,我会在我的主页上长期维护一个勘误表,以供大家参考。

Cedric Villani

2006年12月于Lyon

重要的理论前提

公理系统

我使用经典的一组集合论公理,不过不包括完全版的选择公理,仅包含经典的可数非独立选择公理。

集合和结构

Id代表任意空间上的恒等映射.

令$A$为一个集合,那么函数$1_A$是$A$上的指示函数,即$1_A(x) = 1$当且仅当$x \in A$,否则为0. 若$F$是一个方程,那么$1_F$代表$F$定义出的集合上的指示函数.

若$f$和$g$是两个函数,那么我们记$(f,g)$为函数$x\mapsto(f(x),g(x))$.通常我们使用$f(g)$来表示$f\circ g$.

$\mathbb{N}$表示全体正整数集合:$\mathbb{N}={1,2,3,…}$.一个数列记作$(x_k)_{k\in \mathbb{N}}$,或者当不致混淆时,简记作$(x_k)$.