- Căn cứ vào đặc điểm tính chất của dữ liệu, chúng ta chia dữ liệu thành hai loại: dữ liệu định tính và dữ liệu định lượng.
"Biến định tính thể hiện loại hay tính chất của đơn vị hoặc phần tử được khảo sát, ví dụ như giới tính, trình độ, nghề nghiệp...
Biến định lượng thể hiện bằng con số. Là kết quả của quá trình cân đo đong đếm, ví dụ như trọng lượng, tuổi thọ trung bình, ..."
- Căn cứ vào nguồn gốc của dữ liệu, chúng ta chia dữ liệu thành hai loại dữ liệu sơ cấp và dữ liệu thứ cấp.
Dữ liệu sơ cấp là dữ liệu do người nghiên cứu thu thập được chưa qua xử lý hoặc qua xử lý rồi nhưng vẫn trong trạng thái nguyên thủy của nó. Trong thống kê, còn có khái niệm khác là dữ liệu được công bố bởi chính tổ chức đã thu thập chúng hoặc dữ liệu sơ cấp là dữ liệu do chính bản thân người nghiên cứu thu thập được. Ví dụ, GDP, GNP, lạm phát do Tổng cục thống kê cung cấp được gọi là dữ liệu sơ cấp.
Dữ liệu thứ cấp là dữ liệu được tổng hợp từ các nguồn dữ liệu sơ cấp hoặc dữ liệu đã có sẵn.
- Căn cứ vào hình thức trình bày dữ liệu chúng ta chia dữ liệu thành 3 loại: Dữ liệu chuỗi thời gian (time serial data), dữ liệu chéo (cross data) và dữ liệu bảng (pannel data).
Khi chạy các mô hình định lượng, chúng ta chỉ quan tâm đến dữ liệu được trình bày theo dạng nào để áp dụng các mô hình phù hợp với dữ liệu đó, phần sau đây sẽ trình bày chi tiếp hơn về các lại dữ liệu này