凸函数

You are currently browsing articles tagged 凸函数.

除了博文Peter Lax《微积分及其应用》第4.2节的一个注记之外,我们在此再
给Peter Lax《微积分及其应用》第4.2节添加一个说明.

这一节对凸函数定义如下:


定义4.4:如果一个可微函数其图象位于其切线的上方,我们称它为凸函数.

但是该节有一道课后习题4.33:


(习题4.33) 当$f$是凸函数时,$e^f$是否也是凸函数?


在这道题的参考答案中,作者假定了$f$二阶可微.不禁要问,如果$f$不是二阶可微的,而仅仅是可微,那么这道题的结论还会成立吗?答案是依然成立.

首先,需要指出,Lax教材上对凸函数的定义不如有的教科书上的定义广泛,在那些教材上,对凸函数的定义去掉了可微的条件,采取了如下定义:

凸函数的更广泛的定义:设$f$是以$D$为定义域的函数,若对于任意的$a,b\in D$(其中$a<b$)和$\lambda \in (0,1)$,都有
$$
f(\lambda a+(1-\lambda)b)<\lambda f(a)+(1-\lambda)f(b),
$$
(其中$\lambda a+(1-\lambda)b\in D$),则称$f$是定义在$D$上的凸函数.

下面我们说明,只要可微函数满足凸函数的第二种定义(推广定义),它就满足凸函数的第一种定义(定义4.4).只需要证明,

定理:若$f$是定义域为$D$的可微函数,且对于任意的$a,b\in D$(其中$a<b$)和$\lambda\in (0,1)$,都有$$
f(\lambda a+(1-\lambda)b)<\lambda f(a)+(1-\lambda)f(b),
$$(其中$\lambda a+(1-\lambda)b\in D$)则$f$的图象在其切线的上方,即对于任
意的$c\in D$,以及$x\neq c$,都有
$$
f(x)>f(c)+f'(c)(x-c).
$$

证明:\begin{equation}\label{eq:1}
f(\lambda a+(1-\lambda)b)<\lambda f(a)+(1-\lambda)f(b)
\end{equation}
等价于
$$
\frac{f(b+\lambda (a-b))-f(b)}{\lambda (a-b)}>\frac{f(a)-f(b)}{a-b}
$$
令$\lambda (a-b)=t$,其中$a-b<t<0$,则上面的不等式即
\begin{equation}\label{eq:2}
\frac{f(b+t)-f(b)}{t}>\frac{f(a)-f(b)}{a-b}.
\end{equation}
令$\lambda=1-p$,则不等式\eqref{eq:1}等价于
\begin{equation}
\label{eq:3}
f(pb+(1-p)a)<pf(b)+(1-p)f(a),
\end{equation}
不等式\eqref{eq:3}等价于
$$
\frac{f(a+p(b-a))-f(a)}{p(b-a)}<\frac{f(b)-f(a)}{b-a},
$$
令$p(b-a)=h$,则上面的不等式即
\begin{equation}
\label{eq:4}
\frac{f(a+h)-f(a)}{h}<\frac{f(b)-f(a)}{b-a}.
\end{equation}
将不等式\eqref{eq:2}和不等式\eqref{eq:4}结合,即
\begin{equation}
\label{eq:5}
\frac{f(b+t)-f(b)}{t}>\frac{f(a)-f(b)}{a-b}>\frac{f(a+h)-f(a)}{h}.
\end{equation}
在不等式\eqref{eq:5}中,分别令$t\to 0$,以及令$h\to 0$,可得
\begin{equation}
\label{eq:6}
f'(b)\geq \frac{f(a)-f(b)}{a-b)}\geq f'(a),
\end{equation}
于是$f'(b)\geq f'(a)$.下面说明$f'(b)>f'(a)$,否则$f'(b)=f'(a)$,导致对于任意的$x\in [a,b]$,都有$f'(x)=f'(b)=f'(a)$,则$f(x)$在区间$[a,b]$上将成为线性函数,这与$f$的凸性矛盾.

因此$f'(b)>f'(a)$.由于$a,b$是在定义域内任取的数字,因此$f’$在定义域内单调递增.

为了证明对于任意的$c\in D$,以及$x\neq c$都有
$$
f(x)>f(c)+f'(c)(x-c),
$$

  • 当$x>c$时,只需要证明
    $$
    \frac{f(x)-f(c)}{x-c}>f'(c).
    $$
    由微分中值定理,存在$\xi\in (c,x)$,使得$f'(\xi)=\frac{f(x)-f(c)}{x-c}$.故只需要证明
    $$
    f'(\xi)>f'(c),
    $$
    由$f’$的递增性,这是成立的.
  • 当$x<c$时,只需要证明
    $$
    \frac{f(x)-f(c)}{x-c}<f'(c).
    $$
    由微分中值定理,存在$\omega\in (x,c)$,使得$f'(\omega)=\frac{f(x)-f(c)}{x-c}=f'(\omega)$.故只需要证明
    $$
    f'(\omega)<f'(c),
    $$
    由$f’$的递增性,这也是成立的.命题得证.$\Box$

下面,我们使用推广了的凸函数的概念,来解决习题4.33:

习题4.33的解决:当$f$是凸函数时,说明对于任意的$a<b$以及$\lambda\in (0,1)$,都有
$$
f(\lambda a+(1-\lambda)b)<\lambda f(a)+(1-\lambda)f(b)
$$
而由推广了的平均值不等式(Peter Lax《微积分及其应用》习题4.16)
$$
e^{f(\lambda a+(1-\lambda)b)}<e^{\lambda
f(a)+(1-\lambda)f(b)}=(e^{f(a)})^{\lambda}(e^{f(b)})^{1-\lambda}\leq\lambda e^{f(a)}+(1-\lambda)e^{f(b)},
$$
因此$e^f$也是凸函数.$\Box$

Tags: ,