Kiến trúc xanh ứng dụng AI và tối ưu hóa dữ liệu lớn lai nhằm nâng cao hiệu quả năng lượng cho đô thị thông minh và các ứng dụng 5G-IoT
Hybrid big data optimization based energy-efficient and AI-powered green architecture toward smart cities and 5G-IoT applications
| Tác giả |
Ihab Nassra Juan V. Capella |
| Ngày đăng tải | 28/08/2025 |
| DOI | https://doi.org/10.1016/j.jnlest.2025.100328 |
| Nguồn bài nghiên cứu | Science Direct |
| Từ khóa |
Dữ liệu lớn Tỷ lệ nén Hiệu quả năng lượng Internet vạn vật (IoT) Điện toán đám mây di động Đô thị thông minh |
1 – GIỚI THIỆU
Sự hội tụ giữa Internet vạn vật (IoT) và mạng 5G mang lại tiềm năng lớn trong việc chuyển đổi các ngành công nghiệp nhờ khả năng kết nối quy mô lớn theo thời gian thực và mức độ tự động hóa cao. Tuy nhiên, sự gia tăng mạnh số lượng thiết bị IoT đặt ra yêu cầu về một mạng truyền thông có thể xử lý lượng dữ liệu cực lớn với độ trễ tối thiểu. Những luồng dữ liệu có tính phức tạp, đa chiều, dung lượng lớn và tốc độ cao này làm nảy sinh thách thức về lưu trữ, truyền tải, xử lý và chi phí năng lượng, do giới hạn về năng lực tính toán, dung lượng bộ nhớ và pin của các mạng IoT hiện hữu.
Nghiên cứu này đề xuất một kiến trúc liền mạch kết hợp giữa điện toán di động và điện toán đám mây, cho phép xử lý phân tán giữa thiết bị 5G-IoT, các nút cảm biến và điện toán di động nhằm giảm thiểu chi phí năng lượng, nâng cao khả năng tương tác và tính mở rộng, đồng thời khắc phục giới hạn bộ nhớ. Trên cơ sở đó, một kiến trúc xanh ứng dụng trí tuệ nhân tạo (AI) và tiết kiệm năng lượng cho hệ thống 5G-IoT và đô thị thông minh được đề xuất.
Kết quả thử nghiệm cho thấy phương pháp đề xuất giúp giảm mạnh lượng dữ liệu truyền đi, giảm tiêu thụ năng lượng và đạt hiệu năng cao về khả năng tương tác, tỷ lệ nén và tiết kiệm năng lượng, đặc biệt quan trọng trong việc thúc đẩy triển khai hệ thống 5G và thậm chí 6G cho đô thị thông minh.
2 – MÔ TẢ HỆ THỐNG
Hệ thống được thiết kế với mục tiêu giải quyết đồng thời hai thách thức trọng yếu của hệ sinh thái IoT trong bối cảnh đô thị thông minh: lượng dữ liệu khổng lồ sinh ra theo thời gian thực và tiêu thụ năng lượng cao trong quá trình truyền tải. Để đạt được mục tiêu này, nghiên cứu đề xuất một cấu trúc phân tầng gồm ba khối xử lý chủ đạo: điện toán di động (mobile computing), điện toán biên (edge computing) và điện toán đám mây (cloud computing). Quá trình bắt đầu từ việc thu thập dữ liệu trực tiếp bằng ứng dụng Java chạy trên thiết bị di động, nơi tích hợp nhiều cảm biến khác nhau như nhiệt độ, độ ẩm, ánh sáng, chuyển động, vị trí và áp suất. Dữ liệu được gửi thông qua Bluetooth hoặc kết nối không dây đến nút biên, nơi các thuật toán nén và tối ưu hóa được thực thi.
Ở tầng biên, hệ thống tập trung vào giảm khối lượng dữ liệu mà vẫn giữ được cấu trúc và tính toàn vẹn theo thời gian. Một đặc trưng quan trọng của dữ liệu cảm biến là sự lặp lại liên tục của các giá trị gần giống nhau, đặc biệt trong môi trường đo đạc ổn định. Hệ thống tận dụng điều này bằng cách áp dụng chỉ số RMSSD (Root Mean Square of Successive Differences) – một thông số thường dùng trong phân tích tín hiệu ECG để đo mức độ biến thiên giữa hai giá trị liên tiếp. Giá trị nào có độ lệch không vượt quá RMSSD được xem là gần như tương đương và được gộp vào cùng một cụm, nhờ đó số lượng bản ghi thực sự cần truyền được giảm xuống đáng kể. Điều này đặc biệt hiệu quả đối với những cảm biến có thay đổi liên tục nhưng dao động chỉ nhỏ quanh một ngưỡng, chẳng hạn cảm biến ánh sáng hoặc nhiệt độ trong môi trường ổn định.
Sau quá trình nhóm dữ liệu, thuật toán Adaptive Huffman Encoding (AHE) được áp dụng nhằm tiếp tục giảm dung lượng dữ liệu. Không giống với Huffman truyền thống vốn cần thống kê tần suất trước khi mã hóa, AHE xây dựng cây mã hóa động thay đổi theo thời gian. Cơ chế này phù hợp với dữ liệu IoT, nơi phân phối dữ liệu biến động theo ngữ cảnh, thời tiết, chuyển động hoặc điều kiện môi trường. Việc mã hóa thích ứng theo thời gian giúp duy trì tỷ lệ nén ổn định và linh hoạt hơn so với các phương pháp nén tĩnh. Sau khi nén, toàn bộ dữ liệu được truyền tới đám mây để giải nén và phân tích. Đám mây đóng vai trò trung tâm xử lý, nơi thực hiện các tác vụ đòi hỏi tài nguyên lớn như phân tích dữ liệu lớn, mô phỏng, dự báo bằng máy học và lưu trữ dài hạn. Việc đẩy toàn bộ quá trình giải nén lên đám mây giúp giảm đáng kể gánh nặng tính toán cho tầng biên và thiết bị IoT, vốn luôn bị giới hạn bởi công suất xử lý và pin.
Ở mức độ tổng thể, hệ thống không chỉ chứa thuật toán tối ưu hóa dữ liệu mà còn tích hợp vào một kiến trúc xanh toàn diện, hỗ trợ thành phố thông minh hoạt động hiệu quả. Kiến trúc bao gồm năm lớp: hệ sinh thái IoT xanh, mạng biên 5G tiết kiệm năng lượng, tầng tối ưu hóa dữ liệu, tầng dữ liệu lớn & đám mây xanh, và tầng phân tích quyết định. Các lớp được liên kết chặt chẽ thông qua đường truyền 5G và cơ chế điều phối thông minh vận hành bằng AI. Điều này tạo thành một mô hình tổng thể phản ánh đúng xu hướng phát triển hệ sinh thái 5G-IoT bền vững trong tương lai.
3 – PHƯƠNG PHÁP NGHIÊN CỨU
Phương pháp nghiên cứu được triển khai qua hai hướng: phát triển thuật toán tối ưu hóa dữ liệu lai RMSSD-AHE và đánh giá toàn diện kiến trúc xanh đa tầng thông qua mô phỏng và thử nghiệm thực nghiệm. Về thuật toán tối ưu hóa dữ liệu, đầu vào là chuỗi dữ liệu cảm biến liên tục, vốn thường bị dư thừa do việc lặp lại nhiều giá trị tương tự qua thời gian. Quá trình bắt đầu bằng việc tính toán RMSSD, phản ánh mức biến thiên trung bình giữa hai giá trị liên tiếp, từ đó làm cơ sở xác định các giá trị “thay đổi không đáng kể”. Những giá trị không vượt quá ngưỡng được gộp vào nhóm hiện tại, tạo ra một dạng “đại diện” cho nhiều giá trị lặp lại trước đó. Phương pháp này giúp giảm mạnh số lượng ghi nhận mà không làm mất thông tin về xu hướng.
Tiếp theo, dữ liệu đầu ra được mã hóa bằng Adaptive Huffman Encoding. Thuật toán hoạt động theo nguyên tắc cập nhật liên tục cây mã hóa tại cả bên gửi và bên nhận mà không cần truyền thêm thông tin cấu trúc, đảm bảo tính đồng bộ. Nhà nghiên cứu biểu diễn toàn bộ quy trình trong các thuật toán (Algorithm 1–3), mô tả chi tiết cách cấp phát nút NYT (Not Yet Transmitted), cách tăng trọng số và hoán đổi nút để duy trì tính chất cây Huffman động. Đây là điều quan trọng trong môi trường IoT vì tiết kiệm từng bit thông tin truyền đồng nghĩa tiết kiệm năng lượng.
Ở hướng nghiên cứu thứ hai, mô hình mô phỏng được xây dựng để đánh giá hiệu quả tổng thể của kiến trúc xanh 5G-IoT. Mô hình mô phỏng một khu đô thị 10 km² với mức độ đa dạng cao của thiết bị IoT, từ cảm biến môi trường, thiết bị giám sát giao thông tới các thiết bị hạ tầng đô thị. Mỗi thiết bị tuân theo đặc tính sinh dữ liệu riêng, cho phép đánh giá hiệu quả thuật toán theo nhiều loại dữ liệu khác nhau. Hệ thống bao gồm 15 trạm gốc 5G có hỗ trợ MEC, giúp giảm độ trễ khi xử lý những tác vụ yêu cầu phản hồi nhanh. Ba trung tâm dữ liệu phân tán giúp đánh giá khả năng mở rộng và xử lý song song trong điều kiện triển khai thực tế.
Trong quá trình mô phỏng, năng lượng từ nguồn tái tạo được tích hợp nhằm đánh giá tác động môi trường và xác định mức tiết kiệm CO₂ đạt được nhờ cơ chế tối ưu hóa. Công cụ mô phỏng bao gồm NS-3 để mô phỏng mạng 5G, các mô hình năng lượng tiêu chuẩn cho IoT, và các khung xử lý dữ liệu như Apache Spark hoặc Flink để mô phỏng phân tích dữ liệu lớn. Các chỉ số như lượng năng lượng tiêu hao cho mỗi bit, độ trễ theo từng tầng, mức tiêu thụ của mạng MIMO, hiệu suất TDD động, khả năng mở rộng khi tăng số thiết bị và giảm tải băng thông được đo lường chính xác. Kiến trúc đề xuất được so sánh với hai kiến trúc nền: mô hình truyền thống (điện toán đám mây thuần) và mô hình 5G tiêu chuẩn không có cơ chế xanh. Nhờ đó, mức cải thiện của kiến trúc mới được đánh giá rõ ràng trên nhiều mặt.
4 – KẾT QUẢ NGHIÊN CỨU
Kết quả từ thử nghiệm thuật toán RMSSD-AHE cho thấy mức cải thiện vượt trội so với các phương pháp nén truyền thống. Trong thí nghiệm sử dụng dữ liệu Intel Lab Wireless Sensor Network gồm hơn 2,3 triệu bản ghi, thuật toán giúp giảm kích thước dữ liệu từ 143.92 MB xuống còn 40.51 MB, đạt tỷ lệ nén 3.55 lần. Mức tiết kiệm năng lượng 71.85% được xác định dựa trên chi phí truyền dữ liệu, vốn chiếm phần lớn tổng năng lượng tiêu hao trong mạng cảm biến. Sai số tái tạo PRD chỉ 0.01283% cho thấy việc nén gần như không ảnh hưởng đến tính chính xác của dữ liệu. Khi so sánh với các thuật toán khác như Zstandard, LZW-Huffman, LTC hay LZ4, RMSSD-AHE đạt tỷ lệ nén cao hơn hoặc tương đương nhưng tiêu tốn ít năng lượng hơn và có độ sai lệch thấp hơn, chứng minh ưu thế rõ rệt trong môi trường IoT có tài nguyên bị hạn chế.
Về kiến trúc xanh ứng dụng AI cho hệ thống 5G-IoT, kết quả mô phỏng cho thấy tác động đồng thời trên nhiều tầng hệ thống. Tổng năng lượng tiêu thụ giảm 47.3% so với kiến trúc truyền thống và 26.8% so với kiến trúc 5G tiêu chuẩn. Cơ chế lọc dữ liệu và nén tại biên giúp giảm tới 73.9% băng thông và giảm 61% dữ liệu cần truyền lên đám mây. Độ trễ giảm mạnh trong nhiều ứng dụng quan trọng – ví dụ, xử lý tình huống khẩn cấp giảm từ 87 ms xuống còn 32 ms, điều phối giao thông giảm từ 146 ms xuống 52 ms. Sự cải thiện này đến từ việc MEC xử lý tại chỗ và các cơ chế tối ưu hóa mạng như AI-optimized MIMO và dynamic TDD.
Trong thử nghiệm thực tế với 1000 cảm biến triển khai vật lý, hệ thống đạt nhiều chỉ số nổi bật: tuổi thọ pin kéo dài từ 3.2 tới 4.7 lần; lưu lượng mạng giảm hơn 58%; độ chính xác phát hiện sự kiện vẫn đạt 99.8% ngay cả khi tần suất lấy mẫu giảm. Ở tầng mạng, network slicing giúp tối ưu tài nguyên, giảm năng lượng 28.3%; MIMO được AI tinh chỉnh giúp giảm 31.7% năng lượng; cơ chế TDD động giúp tăng hiệu quả phổ 22.6% và giảm tín hiệu dư thừa tới 43.8%.
Hệ thống cho thấy khả năng mở rộng tốt khi tăng số lượng thiết bị IoT từ 5000 lên 50.000. Độ trễ chỉ tăng dưới 15%, và thêm MEC giúp giữ vững mức khả dụng 99.8%. Cuối cùng, đánh giá vòng đời carbon cho thấy hệ thống giúp giảm 25.430 tấn CO₂ mỗi năm, với thời gian hoàn vốn carbon chỉ 6 tháng. Con số này chứng minh kiến trúc không chỉ hiệu quả về mặt kỹ thuật mà còn có tác động bền vững đối với môi trường đô thị.
5 – KẾT LUẬN
Nghiên cứu đã chứng minh rằng kết hợp RMSSD và Adaptive Huffman Encoding tạo ra một phương pháp tối ưu hóa dữ liệu mạnh mẽ, phù hợp với yêu cầu khắt khe của các hệ thống 5G-IoT và đô thị thông minh. Thuật toán vừa giảm mạnh dung lượng dữ liệu cần truyền, vừa tiết kiệm năng lượng đáng kể, đồng thời vẫn đảm bảo độ trung thực của dữ liệu khi tái tạo. Khả năng thích ứng theo thời gian của AHE giúp duy trì hiệu quả nén trong môi trường dữ liệu biến thiên liên tục, vốn là đặc trưng của IoT. So với các phương pháp truyền thống, RMSSD-AHE chứng minh ưu thế rõ rệt ở nhiều khía cạnh từ tỷ lệ nén, mức tiêu thụ năng lượng đến độ linh hoạt khi triển khai trong môi trường phân tán.
Trên nền tảng thuật toán đó, kiến trúc xanh ứng dụng AI được đề xuất mang tính hệ thống và toàn diện hơn, bao phủ toàn bộ chuỗi xử lý từ cảm biến, biên, mạng 5G, đám mây cho tới phân tích dữ liệu. Kiến trúc không chỉ cải thiện hiệu năng vận hành của hệ sinh thái IoT mà còn giảm đáng kể chi phí năng lượng ở từng tầng thông qua sự kết hợp giữa tối ưu hóa dữ liệu, điện toán biên, cơ chế tiết kiệm năng lượng của 5G và các chiến lược ảo hóa xanh trong đám mây. Các kết quả mô phỏng và thử nghiệm thực tế cho thấy kiến trúc giúp giảm 47.3% năng lượng tiêu thụ, giảm đáng kể độ trễ và giúp tiết kiệm hàng chục nghìn tấn CO₂ mỗi năm. Những lợi ích này làm nổi bật vai trò của kiến trúc trong nâng cao hiệu quả vận hành đô thị, tạo tiền đề vững chắc để triển khai các dịch vụ thông minh dựa trên dữ liệu lớn.
Tổng thể, nghiên cứu mở ra một hướng đi hiệu quả cho việc phát triển những hệ thống 5G-IoT có khả năng vận hành bền vững, tiết kiệm năng lượng, giảm chi phí và thân thiện với môi trường. Đây là bước tiến quan trọng hướng tới các đô thị thông minh thế hệ mới, nơi các thành phần từ cảm biến đến đám mây hoạt động đồng bộ và tối ưu, góp phần hiện thực hóa tầm nhìn đô thị xanh, bền vững trong thời kỳ 5G và chuẩn bị cho sự xuất hiện của 6G trong tương lai.