分析プロセス
統計データの分析における最初の仕事は、分析を行うべき仮説を考えること。 仮説が構築され、分析したい対象が明らかになれば必要なデータが分かる。
必要なデータが元から存在しない場合には、データ獲得を行う必要がある。 この作業は、自然科学の分野では実験、人文社会科学の分野では調査と呼ばれる。 実験や調査の規則や技術については実験計画法、社会調査法と呼ばれる分野がある。
実験や調査により、生のデータである原データを得ることができるが、大規模な実験・調査は費用面や時間面で誰にでもできるわけではない。 行政機関や研究機関、調査会社、第三者の調査結果を利用することも多いが、その場合は原データを獲得できず、何らかの統計処理を施した後の調査結果である統計資料が分析対象の統計データとなる。
分類
あらかじめ統計資料を作成する目的で調査を行い、その結果を集計したものを第一義統計と呼ぶ。 対して、統計資料の作成が目的ではない資料を集計して得た統計資料を第二義統計、業務統計と呼ぶ。
統計資料を加工して作成された統計資料を二次統計、加工統計と呼ぶ。
データ収集の段階では、原データでなく統計資料の場合には、誰が行ったものか、全数調査か標本調査か、誰を対象としたものか、いつの時点のものか、どの地域を対象としたものか、分類の定義はどうなっているかなどの定義に注意する必要がある。