Processing math: 0%

现代精算风险理论02:个体风险模型

第二讲 个体风险模型

第一节 个体风险模型的分布

一、定义和相关说明

在个体风险模型中,我们感兴趣的是多份保单总理赔额的分布。首先给出其定义和相关说明。

X1,X2,,Xn 分别为 n 份保单的理赔额,假设理赔风险 X_i\ (i=1,2,\cdots,n) 是相互独立的,定义个体风险模型

S_n=X_1+X_2+\cdots+X_n.

个体风险模型又称为短期风险模型,即不考虑时间因素,保单总数 n 为非随机的风险模型。

从数学的角度看,总理赔额 S_n 是独立同分布的随机变量的和。我们的研究目标就是个体风险模型 S_n 的分布函数和数字特征等。

关于个体风险模型的一些说明:

  1. 一般非寿险保险的合同期往往较短,绝大多数是一年期。因此,通常不考虑货币的时间价值。但对于寿险来说,货币的时间价值是非常重要的。
  2. 独立性的假设在保险实务中往往是不满足的。例如同一建筑中不同楼层的火灾保险保单,那么这些保单风险相互之间是不独立的。同样,当某一自然灾害发生时,如地震、台风等,同一地区的各类人寿保险或财产保险的索赔风险也是相关的。
  3. 本章中我们总是假设理赔风险 X_i\ (i=1,2,\cdots,n) 是相互独立的。

二、卷积与变换

卷积运算是通过两个独立随机变量 XY 的分布函数来计算它们的和 X+Y 的分布函数的计算方法:

\begin{aligned} F_{X+Y}(s)&=\mathrm{Pr}(X+Y\leq s) \\ \\ &=\int_{-\infty}^\infty\mathrm{Pr}(X+Y\leq s|X=x)\mathrm{d}F_X(x) \\ \\ &=\int_{-\infty}^\infty\mathrm{Pr}(Y\leq s-x)\mathrm{d}F_X(x) \\ \\ &=\int_{-\infty}^\infty F_Y(s-x)\mathrm{d}F_X(x) \\ \\ &\equiv F_X*F_Y(s). \end{aligned}

分布函数 F_X* F_Y(s) 称为分布函数 F_X(\cdot)F_Y(\cdot) 的卷积,即为 X+Y 的分布函数 F_{X+Y}(s)

如果 XY 是离散型随机变量,用 f_X(\cdot)f_Y(\cdot) 表示其概率分布列,则有

f_X*f_Y(s)=\sum_{x}f_Y(s-x)f_X(x),

其中求和是取遍所有使得 f_X(x)>0x ,即随机变量 X 的所有可能取值。

如果 XY 是连续型随机变量,用 f_X(\cdot)f_Y(\cdot) 表示其概率密度函数,则有

f_X*f_Y(s)=\int_{-\infty}^\infty f_Y(s-x)f_X(x)\mathrm{d}x.

注意:卷积运算满足交换律结合律,即

F_X*F_Y(s)=F_Y*F_X(s) , \\ \\ \left(F_X*F_Y\right)*F_Z(s)=F_X*\left(F_Y*F_Z\right)(s)=F_X*F_Y*F_Z(s).

卷积运算可以用来计算个体风险模型总理赔额的分布函数:

  • 如果理赔风险 X_i 的分布函数为 F_i(x)\ (i=1,2,\cdots,n) 且相互独立,则 S_n 的分布函数为

    F_{S_n}(s)=F_1*F_2*\cdots*F_n(s).

  • 进一步假设 F_i(x)=F(x) \ (i=1,2,\cdots,n) ,则 S_n 的分布函数为

    F_{S_n}(s)=F*F\cdots*F(s)\equiv F^{*n}(s).

    称为分布函数 F(x)n 重卷积。

利用 Laplace 变换可以方便我们对卷积进行运算:

  • Laplace 变换:对于函数 f(t) ,如果积分

    F(s)\equiv\int_0^\infty f(t)e^{-st}\mathrm{d}t<\infty,

    则称 F(s) 为函数 f(t) 的 Laplace 变换,记为 F(s)=\mathcal{L}[f(t)]

    也称 f(t) 为函数 F(s) 的 Laplace 逆变换,记为 f(t)=\mathcal{L}^{-1}[F(s)]

  • 卷积定理:对于函数 f(t)g(t) ,其卷积的 Laplace 变换为

    \mathcal{L}[f(t)* g(t)]=F(s)\cdot G(s),

    其中 F(s)G(s) 分别为 f(t)g(t) 的 Laplace 变换。

例如:设随机变量 XY 分别服从 \Gamma(\alpha_1,\beta)\Gamma(\alpha_2,\beta) ,其密度函数分别为 f(t)g(t) ,利用 Laplace 变换可得

\begin{aligned} &F(s)=\mathcal{L}[f(t)]=\int_0^\infty\frac{\beta^{\alpha_1}}{\Gamma(\alpha_1)}t^{\alpha_1-1}e^{-\beta t}e^{-st}\mathrm{d}t=\left(\frac{\beta}{\beta+s}\right)^{\alpha_1}, \\ \\ &G(s)=\mathcal{L}[g(t)]=\int_0^\infty\frac{\beta^{\alpha_2}}{\Gamma(\alpha_2)}t^{\alpha_2-1}e^{-\beta t}e^{-st}\mathrm{d}t=\left(\frac{\beta}{\beta+s}\right)^{\alpha_2}. \end{aligned}

由卷积定理可知

\mathcal{L}[f(t)* g(t)]=F(s)\cdot G(s)=\left(\frac{\beta}{\beta+s}\right)^{\alpha_1+\alpha_2}.

比较 \Gamma 分布的 Laplace 变换,可知 X+Y 仍服从 \Gamma 分布,参数为 (\alpha_1+\alpha_2,\beta)

利用 Laplace 变换判断随机变量的方法,和矩母函数、特征函数的道理是一致的。

第二节 近似分布

一、中心极限定理

在概率论的极限理论中,当样本量足够大时,我们可以用中心极限定理去近似随机变量的和的分布。首先我们回顾一下中心极限定理。

中心极限定理:设 X_1,X_2,\cdots,X_n 独立同分布,其共同的均值为 \mu ,方差为 \sigma^2<\infty ,则有

\lim_{n\to\infty}{\rm Pr}\left[\sum_{i=1}^nX_i\leq n\mu+s\sigma\sqrt{n}\right]=\Phi(x),

其中 \Phi(x) 为标准正态分布的分布函数。

基于上述结果,个体风险模型 S_n 的近似分布可以表示为

F_S(s)\approx \Phi\left(s;n\mu,n\sigma^2\right).

然而,中心极限定理并不适用于损失分布的近似。这是因为保险风险往往是尾部较重的风险,用正态分布来近似随机变量的和的分布,特别是对尾部概率的近似,并不能够很好的符合实际情况。

在进行精算分析时,对尾部概率的近似估计往往愿意采用保守的估计,即和精确值比较接近,可以略大于精确值。常用的两种近似分布是平移伽马近似和正态幂阶近似。

二、平移伽马近似

选择平移伽马分布作为损失分布的近似分布,主要原因是大多数非寿险保单的理赔分布近似伽马分布,其特点为右偏态,取值非负,且具有单峰性。

一般伽马分布有 \alpha\beta 两个参数,\Gamma(\alpha,\beta) 的密度函数为

f(x;\alpha,\beta)=\frac{\beta^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x} , \quad x>0.

Z\sim \Gamma(\alpha,\beta) ,则 Z 的均值、方差和偏度分别为

\mathbb{E}(Z)=\frac{\alpha}{\beta},\quad {\rm Var}(Z)=\frac{\alpha}{\beta^2},\quad \gamma_Z=\frac{3}{\sqrt{\alpha}}.

平移伽马分布引入了第三个参数——偏移 x_0 ,即采用 Z+x_0 的分布作为损失分布 S 的近似,

S\stackrel{d}{\approx}Z+x_0, \\ \\ F_S(s)\approx \mathrm{Pr}(Z+x_0\leq s)=G(s-x_0;\alpha,\beta),

其中 G(x;\alpha,\beta)\Gamma(\alpha,\beta) 的分布函数。

平移伽马分布的均值、方差和偏度分别为

\mathbb{E}(Z+x_0)=x_0+\frac\alpha\beta , \quad {\rm Var}(Z+x_0)=\frac\alpha{\beta^2},\quad \gamma_{Z+x_0}=\frac{2}{\sqrt{\alpha}}.

如果已知损失 S 的均值、方差和偏度分别为 \mu_S,\sigma_S^2\gamma_S 。如果我们采用两个分布对应的前三阶矩相同的方式给出近似分布,则 \alpha,\betax_0 的选取需要满足如下的方程:

\begin{aligned} &\mu_S=\mathbb{E}(Z+x_0)=x_0+\frac\alpha\beta, \\ \\ &\sigma_S^2={\rm Var}(Z+x_0)=\frac\alpha{\beta^2}, \\ \\ &\gamma_S=\gamma_{Z+x_0}=\frac{2}{\sqrt{\alpha}}. \end{aligned}

解方程可得

\alpha=\frac{4}{\gamma_S^2}, \quad \beta=\frac{2}{\gamma_S\sigma_S},\quad x_0=\mu_S-\frac{2\sigma_S}{\gamma_S}.

注意:

  • 为使这种近似方法有效,偏度必须严格为正值,即 \gamma_S>0 。若 \gamma_S\to0 ,则与正态近似接近。
  • 如果两个分布函数的前三阶矩相同,则彼此之间的差异不会太大。
  • 虽然没有类似中心极限定理一样精确的理论证明,但实际经验发现,大多数损失分布采用平移伽马分布作为近似有较好的效果。

三、正态幂阶近似

另一种损失分布的近似方法是正态幂阶近似,又称为 NP 近似,它也是一种使用近似随机变量前三阶矩的近似方法,要求损失分布的矩母函数存在。

如果已知 \mathbb{E}(S)=\mu_S,\ {\rm Var}(S)=\sigma_S^2 以及偏度 \gamma_S ,则当 s\geq1 时,

\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\leq s+\frac{\gamma_S}{6}(s^2-1)\right]\approx\Phi(s).

或等价地,当 x\geq1 时,

\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\leq x\right]\approx\Phi\left(\sqrt{\frac{9}{\gamma_S^2}+\frac{6x}{\gamma_S}+1}-\frac{3}{\gamma_S}\right).

一般地,第一个公式可以得到近似 S 的分位数,第二个公式可以得到近似 S 的分布函数。

引理:设 X_i\ (i=1,2,\cdots,n) 是独立同分布的随机变量,其偏度为 \gamma_X ,定义随机变量

S=X_1+X_2+\cdots+X_n,

S 的偏度为

\gamma_S=n^{-1/2}\gamma_X.

首先计算 S 的前三阶矩:

\begin{aligned} &\mathbb{E}(S)=n\mathbb{E}(X), \\ \\ &{\rm Var}(S)=n{\rm Var}(X) , \\ \\ &\mathbb{E}\left[(S-\mathbb{E}(S))^3\right]=\mathbb{E}\left[\sum_{i=1}^n(X_i-\mathbb{E}(X_i))\right]^3=n\mathbb{E}\left[(X-\mathbb{E}(X))^3\right]. \end{aligned}

所以

\gamma_S=\frac{\mathbb{E}\left[(S-\mathbb{E}(S))^3\right]}{(\sqrt{{\rm Var}(S)})^3}=\frac{n\mathbb{E}\left[(X-\mathbb{E}(X))^3\right]}{(\sqrt{n{\rm Var}(X)})^3}=n^{-1/2}\gamma_X.

我们可以用 Edgeworth 展开推导 NP 近似,但这不是严格的数学证明

假设理赔风险 X_i\ (i=1,2,\cdots,n) 独立同分布,其均值为 \mu_X ,方差为 \sigma_X^2 ,偏度为 \gamma_X

于是个体风险模型 S 的均值为 \mu_S=n\mu_X ,方差为 \sigma_S^2=n\sigma_X^2 ,偏度为 \gamma_S=n^{-1/2}\gamma_X

定义 Z 为个体风险模型 S 的标准化随机变量,则有

Z=\frac{S-\mathbb{E}(S)}{\sqrt{{\rm Var}(S)}} , \quad \gamma_Z =\mathbb{E}\left(Z^3\right)=\gamma_S=\frac{\gamma_X}{\sqrt{n}}.

SZ 的偏度相等,并且和理赔风险 X_i\ (i=1,2,\cdots,n) 的偏度 \gamma_X 满足上式关系。

Z 的累积量母函数,有

\begin{aligned} \log\mathbb{E}(e^{tZ})&=\mathbb{E}(Z)t+{\rm Var}(Z)\frac12t^2+\mathbb{E}\left[(Z-\mathbb{E}(Z))^3\right]\frac16t^3+\cdots \\ \\ &=\frac12t^2+\frac16\gamma_Z t^3+\cdots\\ \\ &=\frac12t^2+\frac16n^{-1/2}\gamma_Xt^3+\cdots. \end{aligned}

因此,对 Z 的矩母函数,有

\mathbb{E}(e^{tZ})=\exp\left\{\frac12t^2\right\}\exp\left\{\frac16n^{-1/2}\gamma_Xt^3+\cdots\right\}.

标准正态分布的分布函数 \Phi(x) 与密度函数 \phi(x) 及其导数的关系:

\begin{aligned} &\Phi'(x)=\phi(x), \\ \\ &\Phi''(x)=\phi'(x)=-x\phi(x), \\ \\ &\Phi^{(3)}(x)=\phi''(x)=(x^2-1)\phi(x), \\ \\ &\Phi^{(4)}(x)=\phi^{(3)}(x)=(3x-x^3)\phi(x). \end{aligned}

可以证明如下的关系式:

\begin{aligned} &\int_{-\infty}^\infty e^{tx}\phi^{(3)}(x)\mathrm{d}x=-t^3\exp\left\{\frac12t^2\right\}, \\ \\ &\int_{-\infty}^\infty e^{tx}\phi(x)\mathrm{d}x=\exp\left\{\frac12t^2\right\}. \end{aligned}

随机变量 Z 的分布函数的 Edgeworth 展开

\begin{aligned} F_Z(x)&=\Phi(x)-\frac16\gamma_Z\Phi^{(3)}(x)+\cdots \\ \\ &=\Phi(x)-\frac16n^{-1/2}\gamma_X\Phi^{(3)}(x)+\cdots \\ \\ &\approx\Phi(x)-\frac16n^{-1/2}\gamma_X\Phi^{(3)}(x). \end{aligned}

最后一行称为随机变量 Z 的分布函数的 Edgeworth 近似

注意:当 x>1 时,\Phi^{(3)}(x)=(x^2-1)\phi(x)>0 ,于是

\frac16n^{-1/2}\gamma_X\Phi^{(3)}(x)>0,

由此推出 F_Z(x)<\Phi(x) ,进而有尾部概率 \overline{F}_Z(x)>\overline\Phi(x) ,即采用 Edgeworth 近似所得到的尾部概率比中心极限定理计算出的值要大。

由于不能保证Edgeworth 近似是一个增函数,因此我们试图找到一个修正函数 \delta=\delta(s) ,使得

F_Z(s+\delta)\approx \Phi(s), \quad \delta>0.

这意味着我们需要找到辅助函数 g(\delta) 的零点来估计 \delta ,其中 g(\delta) 的定义为

\begin{aligned} g(\delta)&=\Phi(s)-F(s+\delta) \\ \\ &=\Phi(s)-\left[\Phi(s+\delta)-\frac16n^{-1/2}\gamma_X\Phi^{(3)}(s+\delta)\right]. \end{aligned}

于是有

\begin{aligned} g(0)&=\frac16n^{-1/2}\gamma_X\Phi^{(3)}(s), \\ \\ g'(0)&=-\Phi'(s)+\frac16n^{-1/2}\gamma_X\Phi^{(4)}(s). \end{aligned}

由 Taylor 展开 g(\delta)\approx g(0)+\delta g'(0) ,再令 g(\delta)\approx0 可得

\begin{aligned} \delta&\approx -\frac{g(0)}{g'(0)} \\ \\ &=-\frac{\dfrac16n^{-1/2}\gamma_X\Phi^{(3)}(s)}{-\Phi'(s)+\dfrac16n^{-1/2}\gamma_X\Phi^{(4)}(s)} \\ \\ &=-\frac{\dfrac16n^{-1/2}\gamma_X(s^2-1)\phi(s)}{\left[-1+\dfrac16n^{-1/2}\gamma_X(-s^3+3s)\right]\phi(s)} \\ \\ &\approx\dfrac16n^{-1/2}\gamma_X(s^2-1) \\ \\ &=\frac16\gamma_Z(s^2-1)=\frac16\gamma_S(s^2-1). \end{aligned}

所以当 \delta=\dfrac16\gamma_S(s^2-1) 时,F_Z(s+\delta)\approx\Phi(s) ,代入可得 NP 近似

\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\leq s+\frac{\gamma_S}{6}(s^2-1)\right]=F_Z\left(s+\frac{\gamma_S}6(s^2-1)\right)\approx \Phi(s).

四、案例

例如:假设总理赔支付 S 的均值为 10000 ,标准差为 1000 ,偏度为 1

(1) 计算资本量 13000 不足以弥补损失 S 的概率的近似值。

中心极限定理

\mathrm{Pr}(S>13000)\approx 1-\Phi\left(\frac{13000-10000}{1000}\right)=0.0013.

平移伽马近似

\alpha=4,\quad\beta=0.002,\quad x_0=8000, \\ \\ \begin{aligned} \mathrm{Pr}(S>13000)&\approx1-G(13000-8000;4,0.002) \\ \\ &=1-G(5000;4,0.002) \\ \\ &=1-G(0.5;4,20) \\ \\ &=0.0103. \end{aligned}

NP 近似

\begin{aligned} \mathrm{Pr}(S>13000)&=\mathrm{Pr}\left(\frac{S-10000}{1000}>3\right) \\ \\ &\approx1-\Phi\left(\sqrt{9+6\times3+1}-3\right) \\ \\ &=0.011. \end{aligned}

(2) 计算资本量,使得资本量以 95\% 的概率不小于理赔额 S 。标准正态分布 0.95 分位数为

\Phi(s)=0.95 \quad \iff \quad s=1.645.

中心极限定理

\mathrm{Pr}\left[\frac{S-10000}{1000}\leq s\right]\approx\Phi(s)=0.95,

解得 S95\% 的分位点为

S_{(0.95)}\approx10000+1000\times1.645=11645.

NP 近似

\mathrm{Pr}\left[\frac{S-10000}{1000}\leq s+\frac{1}{6}(s^2-1)\right]\approx\Phi(s)=0.95,

解得 S95\% 的分位点为

S_{(0.95)}\approx10000+1000\times\left(1.645+\frac16\left(1.645^2-1\right)\right)=11929.

例如:假设有 n=1000 个年轻男性购买了保险期限为一年的保单,每个投保人在一年内死亡的概率为 0.001 ,且死亡发生的理赔支付为 1 ,总理赔支付 S 服从二项分布 B(1000,0.001) 。求这批保单总理赔支付至少为 4 的概率。

二项分布(精确值)

\mathrm{Pr}(S\geq4)=0.01893.

泊松分布:由于这里 n=1000 非常大,p=0.001 非常小,根据泊松定理,我们可以用泊松分布 P(np) 来近似所求的概率。如果 S\sim P(1) ,则有

\mathrm{Pr}(S\geq4)=1-e^{-1}-e^{-1}-\frac12e^{-1}-\frac12e^{-1}=0.01899.

中心极限定理:由于正态分布是连续的,所以采用 x=3.5 估计尾部概率。

\mu_S=1000\times0.001=1,\quad \sigma_S=\displaystyle\sqrt{1000\times0.001\times 0.999}=0.9995 , \\ \\ \mathrm{Pr}(S\geq3.5)=\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\geq\frac{3.5-\mu_S}{\sigma_S}\right]\approx1-\Phi(2.5)=0.0062.

可以看出,利用中心极限定理近似尾部概率的效果很差,估计出的尾部概率比精确值小很多。

平移伽马近似:由于平移伽马分布也是连续的,所以同样采用 x=3.5 估计尾部概率。这里我们仍然假设 S\sim P(1) ,则有 \mu_S=1,\ \sigma_S=1, \ \gamma_S=1 ,于是

\alpha=4 , \quad \beta=2,\quad x_0=-1 \\ \\ \mathrm{Pr}(S\geq3.5)\approx1-G(3.5-(-1);4,2)=0.0212.

NP 近似

\begin{aligned} \mathrm{Pr}(S\geq3.5)&=\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\geq\frac{3.5-\mu_S}{\sigma_S}\right]\\ \\ &\approx1-\Phi\left(\sqrt{9+6\times2.5+1}-3\right) \\ \\ &=1-\Phi(2) \\ \\ &=0.0228. \end{aligned}

posted @   这个XD很懒  阅读(1537)  评论(0)    收藏  举报
相关博文:
阅读排行:
· C# 14 新增功能一览,你觉得实用吗?
· C#/.NET/.NET Core优秀项目和框架2025年4月简报
· Java的"伪泛型"变"真泛型"后,会对性能有帮助吗?
· .NET + AI | Semantic Kernel vs Microsoft.Extension
· 用AI开发AI翻译助手:初学者也能轻松做出第一个应用
点击右上角即可分享
微信分享提示

目录导航