分散は、データが平均値からどれだけ散らばっているかを数値化したものです。データのばらつきを表す重要な指標で、値が大きいほどデータの散らばりが大きいことを意味します。
分散の計算方法は、1. 平均値を求める、2. 各データと平均値の差(偏差)を計算する、3. 偏差を2乗する、4. 2乗した偏差の平均を求める、という4つのステップで行います。
分散は偏差の2乗の平均で単位も2乗になりますが、標準偏差は分散の平方根をとり、元のデータと同じ単位で散らばりを表します。標準偏差の方が直感的に理解しやすいのが特徴です。