跳去內容

統計模型

出自維基百科,自由嘅百科全書
線性迴歸模型嘅圖解;藍色點代表數據當中嘅個體,每個個體都喺 上有個值,條紅色線係個迴歸模型,用條線嚟預測 嘅值會俾到大致上啱,但唔完全準嘅預測。

統計模型粵拼tung2 gai3 mou4 jing4)係一大類嘅數學模型,建基於統計學技術。統計模型通常包含一組假設,用嚟解釋數據點點之間嘅規律,並透過參數嚟刻劃呢啲規律。例如迴歸模型可以用嚟分析一組變數點對點之間嘅關聯。統計模型喺好多領域裏便都有用,譬如機械學習經濟學心理學等領域,幫助人理解數據同作出預測。

相關概念

[編輯]
睇埋:推論統計
  • 參數英文parameter):參數係指一個能夠定義一個系統嘅數值;統計參數係指個統計模型裏面用嚟描述個總體嘅特性嘅數值,例如係某個變數喺個總體嗰度嘅平均值或者標準差呀噉。
  • 單變量分析:指個分析模型得一個變數[1]
  • 多變量分析:指個分析模型有多過一個變數[1]
  • 多變量統計:指個分析模型有多過一個應變數
  • 模型標明:指「講明個統計模型要包含邊啲變數喺入面,仲有係啲變數要成點樣嘅函數」嘅過程[2]
  • 適合度:一個統計模型有幾能夠準確噉描述手上嘅數據,一般係愈高愈好[3]
    • 適合度指標:指一啲用嚟衡量一個統計模型嘅適合度嘅指標數值;喺廿一世紀嘅統計學界有好多種適合度指標,用統計技術做研究嘅人會按照自己嘅情況選擇用乜嘢指標衡量手上嘅統計模型[4]
  • 多組分析:泛指「將受試者分做幾組,每組都由佢哋數據嗰度估個統計模型出嚟,並且比較唔同組喺個模型上有乜差異」;例如研究者認為變數 同變數 喺實驗組當中會成正比,而喺對照組當中會冇相關,於是就將數據分做兩份,每份對應其中一組受試者嘅數據,然後同兩組分別建立一個結構上相同嘅迴歸模型),睇吓呢兩組嘅 係咪有預期中嘅差異(即係喺實驗組當中係統計上顯著嘅正數,喺對照組當中統計上唔顯著);如果有,就能夠支持嗰位研究者嘅假說[5]。睇埋調節變數
  • 約束:指喺建立一個統計模型嗰陣,指定個模型一定要滿足某啲條件;例如喺做兩組嘅多組分析嗰陣,指定一個約束,要 呢兩個變數之間嗰段統計關係喺兩組之間一樣,而如果施加呢個約束會搞到個模型嘅適合度明顯變差,噉個研究者就有理由話兩組之間有差異(睇埋下面調節效應[6]
  • 統計模型選擇:泛指「由多個『可能描述到啲數據嘅統計模型』嗰度揀一個」嘅過程;通常係會靠「邊個模型嗰啲適合度指標最靚」嚟做基準揀。
  • 多組分析:泛指「將受試者分做幾組,每組都由佢哋數據嗰度估個統計模型出嚟,並且比較唔同組喺個模型上有乜差異」;例如研究者認為變數 同變數 喺實驗組當中會成正比,而喺對照組當中會冇相關,於是就將數據分做兩份,每份對應其中一組受試者嘅數據,然後同兩組分別建立一個結構上相同嘅迴歸模型),睇吓呢兩組嘅 係咪有預期中嘅差異(即係喺實驗組當中係統計上顯著嘅正數,喺對照組當中統計上唔顯著);如果有,就能夠支持嗰位研究者嘅假說[7]
  • 嵌套模型[8]:如果話「模型 嵌套咗喺模型 裏面」,意思即係話 參數子集;研究者可以透過比較唔同模型嘅適合度指標,睇吓「邊個模型能夠最有效噉描述手上攞住嘅數據」[9]。可以睇埋奧坎剃刀嘅概念。

模型類型

[編輯]
睇埋:最佳化

睇埋

[編輯]

引咗

[編輯]
  1. 1.0 1.1 Similarities of Univariate & Multivariate Statistical Analysis.
  2. Cox, D. R. (2006), Principles of Statistical Inference, Cambridge University Press, p. 197.
  3. Huber-Carol, C.; Balakrishnan, N.; Nikulin, M. S.; Mesbah, M., eds. (2002), Goodness-of-Fit Tests and Model Validity, Springer
  4. Singh, R. (2009). Does my structural model represent the real phenomenon?: a review of the appropriate use of Structural Equation Modelling (SEM) model fit indices. The Marketing Review, 9(3), 199-212.
  5. Sarstedt, M. , Henseler, J. and Ringle, C. (2011), "Multi-group analysis in partial least squares (PLS) path modeling: alternative methods and empirical results", Advances in International Marketing, Vol. 22 No. 1, pp. 195-218.
  6. Takayama, Akira (1985). Mathematical Economics (2nd ed.). New York: Cambridge University Press. p. 61.
  7. Sarstedt, M. , Henseler, J. and Ringle, C. (2011), "Multi-group analysis in partial least squares (PLS) path modeling: alternative methods and empirical results", Advances in International Marketing, Vol. 22 No. 1, pp. 195-218.
  8. 嵌套模型(nested model)
  9. Inness, M., Turner, N., Barling, J., & Stride, C. B. (2010). Transformational leadership and employee safety performance: a within-person, between-jobs design. Journal of occupational health psychology, 15(3), 279,呢份管理學研究用咗嵌套模型,剖析(簡化講)轉工同管理者嘅領導能力點影響打工仔嘅某啲行為。
  10. Everitt, B.S.; Hand, D.J. (1981). Finite mixture distributions. Chapman & Hall.