亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告：魔扣目錄網為廣大站長提供免費收錄網站服務，提交前請做好本站友鏈：【網站目錄：http://www.430618.com 】，免友鏈快審服務（50元/站），

網站：51998
待審：31
小程序：12
文章：1030137
會員：747

首頁 > 新聞資訊 > IT業界 >正文

概率論和統計學中重要的分布函數引言高斯/正態分布二項分布（Binomial Distribution）伯努利分布對數正態分布冪律/帕累托分布分布函數的使用

發布時間：2023-07-03 12:16:57 作者：網友整理

隨機變量在概率空間中遵循不同類型的分布，這決定了它們的特征并有助于預測。

本文內容列表：

· 引言

· 高斯/正態分布（Gaussian/Normal Distribution）

· 二項分布(Binomial Distribution)

· 伯努利分布(Bernoulli Distribution)

· 對數正態分布(Log Normal Distribution)

· 冪律分布(Power Law Distribution)

· 分布函數的使用

引言

每當我們遇到任何概率實驗，我們談論的是隨機變量，它只不過是獲取實驗預期結果的變量。例如，當我們擲骰子時，我們期望從集合{1,2,3,4,5,6}中得到一個值。所以我們定義了一個隨機變量X，它在每次擲骰時取這些值。

根據實驗的不同，隨機變量可以取離散值，也可以取連續值。骰子的例子是離散隨機變量，因為它取一個離散值。但是假設我們討論的是某個城鎮的房價，那么相關的隨機變量可以取連續的值（例如550000美元，1200523.54美元等等）。

當我們將隨機變量的期望值與實驗中出現頻率的關系圖繪制出來時，我們得到了一個直方圖形式的頻率分布圖。利用核密度估計對這些直方圖進行平滑處理，得到了一條很好的曲線。這條曲線被稱為"分布函數"。

橙色平滑曲線是概率分布曲線

高斯/正態分布

高斯/正態分布是一個連續的概率分布函數，隨機變量在均值（μ）和方差（σ²）周圍對稱分布。

高斯分布函數

平均值（μ）：決定峰值在X軸上的位置。而且，所有數據都對稱地位于X=μ線的兩側。如圖所示，藍色、紅色和黃色曲線分布在X=0的兩側，而綠色曲線的中心位于X=-2。所以通過觀察這些曲線，我們可以很容易地說，藍色，紅色和黃色的平均值是0，而綠色的平均值是-2。

方差（σ²）：決定曲線的寬度和高度。方差只不過是標準差的平方。請注意，圖中給出了所有四條曲線的σ²值。現在不看數值，我們可以很直觀地發現，黃色曲線的高度最低。

如果我們設置μ=0和σ=1，則稱為標準正態分布或標準正態變量，一般表達式變為：

標準正態分布函數

現在我們可以思考，分母意味著什么？這是為了確保正態分布曲線下的面積總是等于1。

我們從正態分布中可以得到很多有用的數據分割信息。以下圖為例：

正態分布的值分割圖

如圖所示，如果我們從平均值右移一個標準差，這個分布存儲了總質量的34.1%；如果我們從平均值右移2個標準偏差，則為49.8%。因為這條曲線是對稱的，所以兩邊都適用。

所以，現在我們知道了，如果任何數據服從正態分布，例如城鎮人口的權重，我們可以很容易地估計出很多值，而不需要進行實際的廣泛分析。這就是正態分布的力量。

二項分布（Binomial Distribution）

正如我們在名字里看到的，有一個"Bi"。這個'Bi'代表一個實驗的2個結果，要么是肯定的，要么是失敗的，要么是1或者0等等。最簡單的說，這個分布是多次重復實驗的分布以及它們的概率，其中預期結果要么是"成功"要么是"失敗"。

二項分布

從圖像上可以看出，它是一個離散的概率分布函數。主要參數為n（試驗次數）和p（成功概率）。

現在假設我們有一個事件成功的概率p，那么失敗的概率是（1-p），假設你重復實驗n次（試驗次數=n）。那么在n個獨立的伯努利試驗中獲得k個成功的概率是：

二項分布函數

其中k屬于范圍[0，n]，并且：

現在我們思考一個簡單的問題。假設印度和澳大利亞之間正在進行板球比賽。Rohit Sharma已經得到了151分，根據你的經驗，你知道150分之后，Rohit有0.3分的概率達到6分。這是最后一節了，你父親問你Rohit有多大的機會能打4個全壘打。那你怎么判斷呢？

這是一個典型的二項試驗的例子。所以，解決辦法是：

注：大括號中的6和4是6C4，它是6個球中4個全壘打的可能組合。

伯努利分布

在二項分布中，我們有一個特殊的例子叫做伯努利分布，其中n=1，這意味著在這個二項實驗中只進行了一次試驗。當我們把n=1放入二項PMF（概率質量函數）中時，nCk等于1，函數變成：

伯努利分布PMF

式中，k={0,1}。

現在我們來看看印度隊對澳大利亞隊的比賽。假設當Rohit達到100分（a ton），那么印度獲勝的幾率是0.7。所以你可以簡單地告訴你父親印度有70%的機會贏了。

對數正態分布

我們已經了解了正態分布的性質，乍一看，許多人會說，對數正態曲線在某種程度上也讓我們看到了正態分布是右偏態的。

假設有一個隨機變量X服從對數正態分布，均值=μ，方差=σ²。X有總共n個可能值（x1，x2，x3…..xn）?，F在取所有X值的自然對數，并創建一個新的隨機變量Y=[Log（x1），Log（x2），Log（x3）…Log（xn）]。這個隨機變量Y是正態分布的。

換句話說，如果存在正態分布Y，并且我們取它的指數函數X=exp（Y），那么X將遵循對數正態分布。

它還具有與高斯函數相同的參數：均值（μ）和方差（σ²）。

冪律/帕累托分布

冪律是兩個量之間的關系，其中一個量的變化將成比例地改變另一個量。它遵循一個80-20法則：在前20%的值中，我們可以找到大約80%的質量密度。如圖所示，稍暗的左側部分為質量的80%，右側亮黃色部分為20%。

當概率分布遵循冪律時，我們稱之為帕累托分布。帕累托分布由兩個參數控制：xm和α。xμm可以看作是控制曲線尺度的均值，α可以看作是控制曲線形狀的σ。（注：xm不是平均值，α不是σ。）現在我們可以在圖像中看到，所有四條曲線的峰值都位于x=1。所以，我們可以說對于圖中的所有曲線，x_m=1。隨著α的增加，峰值也會上升，在α趨于無窮大的極端情況下，曲線僅轉變為一條垂直線。這叫做Diracδ函數。隨著α的減小，曲線變得更加平緩。

帕累托分布PMF

分布函數的使用

如果我們知道一個特定的數據遵循一定的分布特征，那么我們可以采取部分樣本，找到所涉及的參數，然后可以繪制出概率分布函數來解決許多問題。例如：在一個有10萬人口的城鎮，我們必須做身高分析，但我們不能對這么多人口進行調查。因此，我們選取一個隨機樣本，求出樣本均值和樣本標準差?，F在假設一位醫生或專家告訴我們身高服從正態分布。這樣我們就可以輕松地回答許多問題了。

作者: Saurabh Raj

deephub翻譯組：Oliver Lee

分享到：

標簽：函數分布