Hầu hết các hệ thống ETL cũng có cơ chế để làm sạch dữ liệu từ hệ thống nguồn<br>trước khi đưa nó vào trong kho. Làm sạch dữ liệu là quá trình xác định và điều chỉnh dữ liệu bẩn. Điều này được thực hiện bằng cách sử dụng các quy tắc chất lượng dữ liệu xác định dữ liệu bẩn là gì.<br>Sau khi dữ liệu được trích xuất từ hệ thống nguồn nhưng trước khi dữ liệu được nạp vào kho, dữ liệu được kiểm tra bằng cách sử dụng các quy tắc này. Nếu quy tắc xác định rằng dữ liệu là chính xác, sau đó nó được tải vào kho. Nếu quy tắc xác định rằng dữ liệu không chính xác, thì có ba tùy chọn: nó có thể bị từ chối, sửa chữa hoặc được phép nạp vào kho.
การแปล กรุณารอสักครู่..
