1. Khái niệm dữ liệu là gì?
“Dữ liệu là ký hiệu, chữ viết, chữ số, hình ảnh, âm thanh hoặc dạng tương tự khác”.
Trên đây là khái niệm được nêu tại khoản 6 Điều 3 Luật Giao dịch điện tử 2023 (có hiệu lực từ ngày 01/7/2024).
Dữ liệu được sử dụng trong quản lý doanh nghiệp, nghiên cứu khoa học, quản lý tài chính, quản trị và hầu như trong mọi hình thức hoạt động tổ chức của con người.
Trong đời sống hàng ngày, chúng ta thường thấy dữ liệu được sắp xếp dưới dạng các bảng biểu. Một tập dữ liệu tồn tại khi có nội dung của một bảng biểu riêng biệt.
2. Phương thức lưu trữ dữ liệu
Máy tính có thể lưu trữ các dữ liệu như hình ảnh, âm thanh, văn bản hay video và được lưu dưới dạng nhị phân bằng cách sử dụng hai mẫu số 1 và 0. Bit là một đơn vị nhỏ được sử dụng trong việc lưu trữ các thông tin. Chính vì thế mà bộ nhớ còn được lưu trữ bằng Megabyte và Gigabyte.
Việc mất dữ liệu là điều hoàn toàn có thể xảy ra trong bất kỳ trường hợp nào. Chính vì vậy, người dùng luôn được khuyến khích nên có các phương thức lưu dữ liệu để dữ liệu của họ luôn được an toàn. Dưới đây là một số phương thức lưu trữ data đơn giản và an toàn:
Lưu trữ tại chỗ: Đây chính là giải pháp dữ liệu tại chỗ thường liên quan đến máy chủ do tổ chức sở hữu và quản lý. Các máy chủ lưu trữ data thường được các công ty lớn đặt trong một trung tâm cơ sở dữ liệu riêng biệt. Tuy nhiên, trong hầu hết các trường hợp thì chúng được xem là các máy trong phòng dữ liệu chuyên dụng được các doanh nghiệp đặt trực tiếp ngay trong văn phòng của họ.
Thuê vị trí lưu trữ: Nhiều tổ chức muốn lưu trữ những dữ liệu quan trọng của họ trên các thiết bị họ sở hữu. Tuy nhiên, các doanh nghiệp có thể gặp khó khăn trong việc giải quyết các vấn đề bao gồm điện năng, tích hợp các dịch vụ hay tự triển khai cơ sở hạ tầng lưu trữ. Vì vậy, cách tối ưu nhất là họ sẽ tìm đến các vị trí lưu trữ ở ngoài trung tâm dữ liệu mà vẫn có thể duy trì toàn quyền kiểm soát đối với dữ liệu của họ. Bên cạnh đó, việc thuê vị trí lưu trữ dữ liệu sẽ có những nhược điểm sau:
Doanh nghiệp phải chi một khoản rất cao để đầu tư cho dịch vụ này.
Luôn phải đảm bảo có nhân sự theo dõi 24/24 để phòng các sự cố server bị lỗi thì báo ngay cho đại lý cung cấp.
Public Cloud: Không phải doanh nghiệp nào cũng có đủ khả năng đầu tư vào các phần cứng lưu trữ data đắt đỏ. Vì thế, họ thường di chuyển tất cả dữ liệu sang một nhà cung cấp Public Cloud để tiết kiệm chi phí. Các giải pháp Public Cloud cho phép bổ sung thêm tài nguyên lưu trữ hoặc tính toán khi cần thiết và có thể dễ dàng mở rộng. Tuy nhiên, những nhược điểm của Public Cloud bao gồm:
Hạn chế về khả năng đọc dữ liệu và truy cập.
Còn thiếu các nhân viên kinh nghiệm.
Tích hợp API không an toàn, thiếu bảo mật.
Chính sách quyền sở hữu dữ liệu.
Do tính chất mở của môi trường Public Cloud nên các dữ liệu riêng tư có thể dễ dàng bị truy cập trái phép.
Private Cloud: Được triển khai thông qua một trung tâm dữ liệu ảo hóa, Private Cloud có khả năng cung cấp mức độ bảo mật cao hơn so với Public Cloud, đặc biệt là khi kết hợp với các giao thức mật mã. Tất nhiên, cũng như Public Cloud, Private Cloud cũng khó mà tránh khỏi những thiếu sót như:
Gánh nặng về tài chính.
Yêu cầu quản lý an ninh mạng có kỹ năng cao.
Thiết lập khá phức tạp.
3. Một số dạng dữ liệu phổ biến
Hiện nay, có khá nhiều dạng data. Tuy nhiên, 2 dạng cơ bản và phổ biến nhất đối với người dùng đó là dữ liệu có cấu trúc (Structured data) và dữ liệu không có cấu trúc (Unstructured data). Quá trình phân tích và khai thác giá trị của chúng thường yêu cầu phải có các công cụ và kỹ thuật phân tích dữ liệu đặc biệt.
3.1. Dữ liệu không có cấu trúc
Dữ liệu không có cấu trúc (Unstructured data) là loại dữ liệu có cấu trúc bên trong nhưng không tuân theo các quy tắc và tiêu chuẩn cụ thể, không được cấu trúc rõ ràng thông qua các lược đồ hoặc mô hình dữ liệu được xác định trước.
Ví dụ: tài liệu HTML, tài liệu PDF, các tài liệu văn bản tự do, email, tệp video và hình ảnh.
Do thiếu hụt về cấu trúc nên đã khiến cho dữ liệu không cấu trúc trở nên khó khăn khi tìm kiếm, quản lý và phân tích. Đây chính là lý do tại sao các doanh nghiệp đều bỏ qua dạng data này.
3.2. Dữ liệu có cấu trúc
Dữ liệu có cấu trúc (Structured data) là loại dữ liệu có tổ chức rõ ràng, được hiển thị trong các hàng và cột có tiêu đề. Data có cấu trúc có thể dễ dàng xử lý bằng các công cụ tìm kiếm dữ liệu.
Ví dụ: các bảng dữ liệu trong các hệ quản trị cơ sở dữ liệu, các tài liệu XML, tập tin Excel, kết quả biểu mẫu web và các thẻ tối ưu hóa công cụ tìm kiếm (SEO).
Lợi ích của dữ liệu cấu trúc:
Dễ sử dụng: bất cứ ai cũng có thể dễ dàng hiểu và truy cập dữ liệu có cấu trúc; các thao tác cập nhật hay sửa đổi data có cấu trúc khá đơn giản; do các đơn vị lưu trữ có độ dài cố định và có thể được phân bổ cho các giá trị dữ liệu nên việc lưu trữ rất hiệu quả.
Khả năng điều chỉnh quy mô: data có cấu trúc chia tỷ lệ theo thuật toán. Người dùng có thể thêm dung lượng lưu trữ và khả năng xử lý khi khối lượng data của họ tăng lên.
Phân tích: Các dữ liệu có cấu trúc và xác định các mẫu chung cho thông tin kinh doanh có thể được thực hiện bởi những thuật toán máy học. Người dùng có thể dùng ngôn ngữ truy vấn cấu trúc (SQL) để tự tạo báo cáo và sửa đổi, duy trì dữ liệu.
4. Giá trị pháp lý của thông điệp dữ liệu
Theo khoản 4 Điều 3 Luật Giao dịch điện tử 2023:
Thông điệp dữ liệu là thông tin được tạo ra, được gửi, được nhận, được lưu trữ bằng phương tiện điện tử
Đồng thời, theo quy định tại Mục 1 Chương II Luật Giao dịch điện tử:
giá trị pháp lý của thông điệp dữ liệu là “Thông tin trong thông điệp dữ liệu không bị phủ nhận giá trị pháp lý chỉ vì thông tin đó được thể hiện dưới dạng thông điệp dữ liệu.
Giá trị của thông điệp dữ liệu được xem như văn bản
Điều 9 của Luật chỉ rõ:
- Nếu thông tin trong thông điệp dữ liệu dùng để truy cập và sử dụng để tham chiếu thì thông điệp đó đáp ứng được yêu cầu thể hiện thông tin bằng văn bản của pháp luật.
- Nếu văn bản được công chứng, chứng thực theo đúng quy định của pháp luật về công chứng, chứng thực thì thông điệp dữ liệu được chấp nhận.
Giá trị của thông điệp dữ liệu được xem như bản gốc
Theo Điều 10 của Luật, nếu đáp ứng đủ các yêu cầu dưới đây thì thông điệp dữ liệu được có giá trị và được sử dụng như văn bản gốc:
Thông tin trong một thông điệp dữ liệu hoàn chỉnh phải được đảm bảo không bị thay đổi tính từ lúc lần đầu tiên được khởi tạo (trừ những trường hợp phát sinh trong khi gửi, lưu trữ hoặc hiển thị thông điệp dữ liệu được thay đổi hình thức);
Khi được truy cập và sử dụng, thông tin trong thông điệp dữ liệu phải hoàn chỉnh.
Giá trị của thông điệp dữ liệu được xem như chứng cứ
Đây là quy định tại Điều 11 của Luật. Cụ thể, thông điệp dữ liệu có thể được dùng làm chứng cứ theo quy định của Luật này và pháp luật về tố tụng.
Chứng cứ của thông điệp dữ liệu có giá trị nếu được xác định căn cứ vào độ tin cậy của cách thức khởi tạo, gửi, nhận hoặc lưu trữ thông điệp dữ liệu, cách thức đảm bảo và duy trì tình trạng nguyên vẹn của thông điệp dữ liệu, cách thức xác định người khởi tạo, gửi, nhận thông điệp dữ liệu và một số yếu tố khác.
Những thông tin trên bài viết có lẽ đã giúp bạn hiểu rõ khái niệm dữ liệu là gì và giá trị pháp lý của thông điệp dữ liệu. Từ đó có thể thấy được tầm quan trọng của dữ liệu trong nhiều lĩnh vực khác nhau như khoa học, kế toán, xây dựng. Đây cũng chính là một trong những yếu tố quan trọng trong việc giúp các doanh nghiệp tiến xa hơn trong thời đại số.