Việc triển khai Chính phủ số, Kinh tế số và Xã hội số trong thời gian qua, đã đang và sẽ hình thành nên các hệ thống thông tin, cơ sở dữ liệu nằm tại các hệ thống tác nghiệp. Các dữ liệu này nằm rải rác, căn cứ ở các phần mềm, phần cứng, hệ thống thông tin khác nhau. Bên cạnh đó, các dữ liệu này cũng ít được chia sẻ để sử dụng.
Với lượng dữ liệu ngày càng tăng nhanh, nếu không được xử lý sẽ dẫn đến một sự lãng phí vô cùng lớn tài nguyên của đơn vị sở hữu. Sự lãng phí này không chỉ ở mặt giá trị của dữ liệu mà còn lãng phí cả về cơ sở vật chất và hạ tầng. (Đến thời điểm hiện tại chỉ có 0,5% toàn bộ dữ liệu trên thế giới được xử lý và sử dụng mỗi năm, theo Technology Review)
Để khai phá sức mạnh của dữ liệu, cần xây dựng những nguyên lý cơ bản, tập trung vào ba nội dung chính: Tạo ra nền tảng dữ liệu có giá trị; Tạo một kho dữ liệu minh bạch và đáng tin cậy thông qua tổ chức, tích hợp, tinh giản và quản trị dữ liệu; Áp dụng những phương pháp, thuật toán, công cụ hỗ trợ trực quan hóa và phân tích dữ liệu nhằm khai phá được tối đa giá trị dữ liệu mang lại.