scores = [72, 88, 90, 65, 90, 78, 85]
scores

[72, 88, 90, 65, 90, 78, 85]

scores = [72, 88, 90, 65, 90, 78, 85]
mean_py = sum(scores)/len(scores)
mean_py

81.14285714285714

import sympy as sp
sp.init_printing()

data = sp.Array(scores)
mean_sym = sp.nsimplify(sum(data)/len(data))
mean_sym

import numpy as np
np.mean(scores)

scores_sorted = sorted(scores)
scores_sorted

import numpy as np
import statistics

median_val = np.median(scores)
mode_val = statistics.multimode(scores)

median_val, mode_val

scores = [72, 88, 90, 65, 90, 78, 85]
n = len(scores)
mean_val = sum(scores)/n

deviations = [x - mean_val for x in scores]
squared_dev = [(x - mean_val)**2 for x in scores]

sample_variance = sum(squared_dev)/(n-1)
sample_std = sample_variance**0.5
mean_val, deviations, squared_dev, sample_variance, sample_std

population_var1 = np.var(scores, ddof=0)  # 母體變異數
sample_var1 = np.var(scores, ddof=1)  # 樣本變異數

population_std1 = np.std(scores, ddof=0)        # 母體標準差
sample_std1 = np.std(scores, ddof=1) # 樣本標準差

population_var1, sample_var1, population_std1, sample_std1

data_syms = sp.Array(scores)
n = len(data_syms)
mean_sym = sum(data_syms)/n
sample_var_sym = sum((x - mean_sym)**2 for x in data_syms)/(n-1)
sample_std_sym = sp.sqrt(sample_var_sym)
sp.simplify(mean_sym), sp.simplify(sample_var_sym), sp.nsimplify(sample_std_sym)

sp.simplify(mean_sym).n(), sp.simplify(sample_var_sym).n(), sp.nsimplify(sample_std_sym).n()

A = [70, 70, 70, 70]
B = [40, 60, 80, 100]

def sample_std(data):
    n = len(data)
    mean_val = sum(data)/n
    return (sum((x - mean_val)**2 for x in data)/(n-1))**0.5

mean_A, std_A = sum(A)/len(A), sample_std(A)
mean_B, std_B = sum(B)/len(B), sample_std(B)
mean_A, std_A, mean_B, std_B

salaries = [35, 36, 37, 38, 40]
salaries_extreme = [35, 36, 37, 38, 40, 200]

def mean(data):
    return sum(data)/len(data)

from statistics import median

mean1, median1 = mean(salaries), median(salaries)
mean2, median2 = mean(salaries_extreme), median(salaries_extreme)
mean1, median1, mean2, median2

temps = [25.1, 24.9, 25.0, 25.2, 25.0, 24.8, 25.1, 25.0, 24.9, 25.1]
mean_temp = sum(temps)/len(temps)
std_temp = sample_std(temps)
mean_temp, std_temp

import matplotlib.pyplot as plt

temps = [25.1, 24.9, 25.0, 25.2, 25.0, 24.8, 25.1, 25.0, 24.9, 25.1]

plt.hist(temps, bins=5)
plt.xlabel('Temperature (°C)')
plt.ylabel('Frequency')
plt.title('Temperature Measurements Histogram')
plt.show()

第 15 章　資料分析：平均數、變異數與標準差¶

15.1 資料與數列：從一串數字開始¶

15.2 算術平均數（mean）¶

15.3 中位數（median）與眾數（mode）¶

15.4 變異數與標準差：資料「散不散」¶

15.5 用 Python / SymPy 手工計算變異數與標準差¶

15.6 啟發性例子一：平均一樣，標準差不同¶

15.7 啟發性例子二：極端值對平均與中位數的影響¶

15.8 啟發性例子三：量測誤差與標準差¶

15.9 用 Python 簡單畫圖看資料分布（概念示意）¶

15.10 樣本 vs 母體：符號觀點¶

15.11 本章小結¶

15.12 練習題¶

第 15 章 資料分析：平均數、變異數與標準差¶

15.1 資料與數列：從一串數字開始¶

15.2 算術平均數（mean）¶

15.3 中位數（median）與眾數（mode）¶

15.4 變異數與標準差：資料「散不散」¶

15.5 用 Python / SymPy 手工計算變異數與標準差¶

15.6 啟發性例子一：平均一樣，標準差不同¶

15.7 啟發性例子二：極端值對平均與中位數的影響¶

15.8 啟發性例子三：量測誤差與標準差¶

15.9 用 Python 簡單畫圖看資料分布（概念示意）¶

15.10 樣本 vs 母體：符號觀點¶

15.11 本章小結¶

15.12 練習題¶

第 15 章　資料分析：平均數、變異數與標準差¶