什麼是標準差?
標準差(Standard Deviation)是統計學中最常用的離散度量指標,用來描述一組數據「有多分散」。它告訴我們每個數據點平均偏離平均值多遠。
核心概念:標準差越大,數據越分散;標準差越小,數據越集中於平均值附近。
例如,兩組考試成績:
- A 班:80, 82, 78, 81, 79(標準差約 1.41)
- B 班:60, 95, 70, 100, 75(標準差約 15.17)
兩班平均分可能相近,但 B 班的成績差異明顯更大。
計算步驟詳解
以數據 88 為例:
- 計算平均值:(85+90+78+92+88) / 5 = 86.6
- 計算各數據與平均值的差:-1.6, 3.4, -8.6, 5.4, 1.4
- 取平方:2.56, 11.56, 73.96, 29.16, 1.96
- 求平方和的平均:119.2 / 5 = 23.84(母體變異數)
- 開根號:sqrt(23.84) = 4.88(母體標準差)
本計算機會自動完成以上所有步驟,並以長條圖呈現各數值與平均值的關係。
母體標準差的特性
本計算機使用的是母體標準差(Population Standard Deviation),以 N 作為除數。這適用於以下情境:
- 你擁有的數據就是完整的母體(例如:全班 5 位同學的成績)
- 你想描述這組數據本身的分散程度
- 你不需要推論到更大的群體
| 統計量 | 公式 | 適用場景 |
|---|---|---|
| 母體變異數 σ² | Σ(xi - μ)² / N | 數據 = 整個母體 |
| 母體標準差 σ | sqrt(σ²) | 數據 = 整個母體 |
其他計算結果解讀
平均值(Mean)
所有數據的算術平均,是數據集中趨勢的代表值。但平均值容易受極端值影響,有時中位數更能代表「典型」水準。
全距(Range)
最大值減最小值,反映數據的最大跨度。全距只看兩個極端值,不像標準差考慮所有數據,因此對離群值(Outlier)非常敏感。
變異數(Variance)
標準差的平方。變異數在數學運算上有更好的性質(例如兩組獨立數據合併時,變異數可以相加),但因為單位是原始數據單位的平方,解讀上不如標準差直觀。
長條圖的解讀
計算結果中的長條圖會用兩種顏色標示:
- 藍色:偏離平均值在一個標準差以內的數值
- 紅色:偏離平均值超過一個標準差的數值
這讓你可以一眼看出哪些數據是「異常」的。
標準差在各領域的應用
品質管控
製造業使用標準差來監控產品品質。「六標準差」(Six Sigma)方法要求製程變異控制在 ±6σ 以內,對應不良率為百萬分之 3.4。
| 範圍 | 含蓋比例 | 不良率 |
|---|---|---|
| ±1σ | 68.27% | 31.73% |
| ±2σ | 95.45% | 4.55% |
| ±3σ | 99.73% | 0.27% |
投資風險評估
在金融領域,標準差被用來衡量投資報酬率的波動性。標準差小的基金報酬穩定,適合保守型投資人;標準差大的基金波動劇烈,風險與報酬都較高。
學術研究
研究論文中常使用「平均值 ± 標準差」來描述數據,例如「參與者年齡為 35.2 ± 8.7 歲」,讓讀者快速掌握數據的集中趨勢和分散程度。
教育評量
老師可以用標準差來了解班級成績的分布情況。如果標準差很大,代表學生程度差異大,可能需要差異化教學。
使用注意事項
- 本計算機會自動過濾數值為 0 的欄位,只計算非零數據
- 至少需要 1 筆非零數據才能計算
- 如果所有非零數值相同,標準差為 0
標準差本身的數值沒有絕對的「好壞」標準,必須根據使用場景和比較對象來解讀。重點是在相同情境下進行比較。