凸函数保凸操作中有关标量复合函数结论式的理解 您所在的位置:网站首页 if函数双重条件 凸函数保凸操作中有关标量复合函数结论式的理解

凸函数保凸操作中有关标量复合函数结论式的理解

2023-03-13 17:17| 来源: 网络整理| 查看: 265

今天分享Stephen Boyd《Convex Optimization》书中P83-86页,凸函数有关标量函数在复合操作中满足保凸性的条件应该如何解读。首先书中讲解了有哪些操作可以对凸函数具有保凸性,例如:

nonnegative weighted sum;与仿射函数的复合;pointwise maximum and supremum(逐点求最大值和逐点求上确界);标量复合 f=h\circ g , h: \mathbb{R} \rightarrow \mathbb{R} ,g: \mathbb{R ^n} \rightarrow \mathbb{R};向量复合f=h\circ g , h: \mathbb{R^k} \rightarrow \mathbb{R} ,g: \mathbb{R ^n} \rightarrow \mathbb{R^k}。

我觉得书中在讲解后面两种函数复合的时候,例如标量复合操作中给出的满足保凸性的条件,对于小白来说可能会觉得有点晦涩难懂,特别是给出的标量复合定理(3.10)和(3.11)会看得一头雾水,因此今天要帮助大家好好理解这部分内容。具体来说,今天打算解决以下问题:

标量复合的第一种特殊情况(假设存在二阶导):当 n=1 时,且标量函数 h 和 g 的定义域均为全体实数 \mathbb{R} ,且h 和 g在定义域内均存在二阶导。书中P84给出的复合定理(3.10)一堆描述如何去理解。

2. 标量复合的一般情况(对假设进行放松:即不要求定义域为整个实数空间和整个高维空间,也不要求均有二阶导,但增加一个假设,即函数h的扩展函数\tilde{h}要满足nondecreasing(or nonincreasing)): n \ge2 ,为什么扩展函数要求满足不减(不增),以及书中(3.11)一堆描述如何去理解。

下面是我对这部分内容的整体笔记。

下面我会根据上图的笔记一步步结合今天要解决的内容再具体分析。

复合操作的保凸性

什么是函数的复合?书中的描述如下:

从书中的描述可以看得出,通过两个函数 h 和 g 的复合成一个新的函数 f 。当时 k=1 ,称为标量复合(否则称为向量复合)。今天就是要讨论当函数 h 和 g满足什么具体条件时,新的函数 f是凸函数。这里要注意复合函数后的函数定义域 domf 。

Special CASE: n=1 ,即是函数 h 和 g均是一维函数,即复合后的函数f是一维函数。

假设:(1)函数 h 和 g的定义域均为全体实数 \mathbb{R};(2)且h 和 g在定义域内均有二阶导数

对函数求二阶导

那么我们回顾一下,对于一个函数,若满足二阶条件即定义域内均有二阶导,且二阶导数恒为非负数,则该函数为凸函数。根据我下面的笔记分析,就可以看成为什么要提出上面两个假设条件了。

从上面图片分析可以看出,一维函数 g 和 h 的定义域均为全体实数空间,那么复合后的函数 f 的定义域肯定是凸集(证明也是很容易)。同时我们也可以得出在假设的两个条件下,同时满足(3.10)第一条要求的函数 f ,它的二阶导恒为非负,故 f 是凸函数。

根据(3.9)的式子,函数 f 的二阶导在什么条件下是非负(或非正)给出了四种具体情况。

其实组合定理(3.10)这四种情况还是挺容易理解的。

2. General Case: n\gt1 ,即是函数 h 是一维函数,但 g是 n 维函数,即复合后的函数f是高维(n维)函数。

我们发现Special Case的假设太强了,即要求函数的定义域要是全体实数 \mathbb{R},还要求均存在二阶导。因此对于general case的时候,需要对假设进行放松,即不要求一维函数 h 定义域是全体实数 \mathbb{R},也不要求高维函数 g 的定义域是整个 n 维空间 \mathbb{R^n} ,更不要求均存在二阶偏导。但需要增加扩展函数\tilde{h}要满足一定的限制条件

假设:扩展函数 \tilde{h} 要满足一定限制要求,即\tilde{h} 在全体实数 \mathbb{R}内满足nonincreasing or nondecreasing。

至于为什么要增加这个假设呢,书中给的描述如下:

注意理解我highlight那部分

上面描述highlight部分,我一开始的时候看得很懵逼,特别是突然跑出来两个含有字母 a 区间 ( -\infty , a) 和 ( -\infty , a] 。我下面都会一一帮助大家去理解。

书中的描述(上面图片)中给了一个例子“\tilde{h} is nondecreasing”到底意味着什么。这里有四句话需要我们拆开来仔细理解:

第一句话:for any x,y \in \mathbb{R} , with x \lt y , we have \tilde{h}(x) \le \tilde{h}(y) .

这句话容易理解,这本来就是“\tilde{h} is nondecreasing”的本来定义。

第二句话:this means that if y \in domh , then x \in domh.

这句话很重要,我们在证明组合定理(3.11)的时候要用到的(后面再说)。但我们首先需要证明推导第二句话:

那扩展函数 \tilde{h} 是nondecreasing到底有什么用呢?我们接下来结合(3.11)第一条,通过分析推导,证明出在函数 g 和 h 都是凸函数的前提下,且\tilde{h}是nondecreasing的时候,复合函数 f 的定义域 domf 才是凸集。

注意highlight部分,这是增加扩展函数满足nondecreasing的原因之一

从上面分析我们可以得出,由于现在函数 g 和 h的定义域已经不是全体实数空间,所以即使是 g 和 h 是凸函数还不足以推出它们的复合函数的定义域是凸集,故还需要扩展函数\tilde{h}要满足nondecreasing,才能使得复合函数的定义域是凸集!

第三句话:the domain of h extends infinitely in the negative direction: it is either R, or an interval of the form of ( -\infty , a) or ( -\infty , a]

这句话要结合扩展函数的要同时满足凸性定义以及满足nondecreasing,我画个图后,大家就容易理解想象了:

第四句话:In a similar way, to say that h is convex and \tilde{h} is nonincreasing means that h is nonincreasing and domh extends infinitely in the positive direction.

同理,这句话,我也画个图,大家就容易想象了。

3. 复合定理的证明

一维情况的复合定理(3.10)就很容易了,大家直接看书或看我上面的解释就很容易理解

高维情况的复合定理(3.11)就要好好想想了,以(3.11)的第一种情况作为例子,我们来证明一下。

即证明下面这条结论:

书中给出的证明过程如下:

要看懂这个证明,这其中要用到一个结论tips:x \lt y,if y \in domh , then x \in domh. 我们上面也已经证明过了。

要证明(3.11)第一条复合定理,即“if g is convex, h is convex, and \tilde{h} is nondecreasing, then f=h\circ g is convex.”

我的证明过程如下:

扩展函数要满足nondecreasing的原因之二是要满足复合函数凸函数的第一定义条件

如果看不懂书中的证明,看我上面的证明梳理估计也能看懂了。扩展函数要求满足nondecreasing or nonincreasing的根本原因有两个,一是证明复合函数的定义域是凸集,二是要证明复合后的函数要满足凸函数的第一定义

书中P86页也给出了复合定理的具体应用例子Example 3.13.

还有不懂的话,看我下面对这个例子的注释就能看懂了。

今天分享完毕,如有问题,网友们请不吝赐教。后面我也会陆续给出书上一些看起来不显眼但读者(例如我,哈哈)可能感到迷惑的例子 ,且书上没有给出相应证明,我会找出来尽量写一些自己的看法和证明及解释。

参考:

Boyd, S., Boyd, S. P., & Vandenberghe, L. (2004).Convex optimization. Cambridge university press.



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有