Tác giả

Nisrine Mokadem

Jan Treur

Peter H.M.P. Roelofsma

Ngày đăng tải 25/03/2026
DOI https://doi.org/10.1016/j.cogsys.2026.101464
Nguồn bài nghiên cứu Research Gate
Từ khóa

Mạng thích nghi

Huấn luyện viên AI

An ninh mạng

Học tập tổ chức

Phân tích giả định

Đánh giá rủi ro

1 – GIỚI THIỆU

Bài báo này trình bày một phương pháp mô hình hóa định hướng mạng thích nghi, tích hợp một huấn luyện viên AI (AI-coach) nhằm hỗ trợ các nhóm an ninh mạng trong các tình huống học tập tổ chức và quản lý rủi ro. Bốn kịch bản riêng biệt trong một công ty năng lượng thông minh giả định đã được mô phỏng, với mức độ phức tạp tăng dần thông qua các yếu tố như căng thẳng, kiến thức không đầy đủ và động lực nhóm. Bằng cách tích hợp các cơ chế thích nghi bậc hai và huấn luyện dựa trên AI, các mô hình đã làm sáng tỏ những hiểu biết quan trọng về cách các yếu tố nhận thức và xã hội ảnh hưởng đến kết quả an ninh mạng. Phân tích giả định (What-If) và đánh giá rủi ro có hệ thống tiếp tục chứng minh tính bền vững và độ nhạy cảm của hiệu suất nhóm dưới các điều kiện thay đổi khác nhau. Các kết quả nhấn mạnh tầm quan trọng của mô hình tư duy chung (shared mental models), lưu giữ kiến thức được tăng cường bởi AI, và động lực hợp tác trong việc giải quyết thành công các mối đe dọa an ninh mạng phức tạp.

2 – MÔ TẢ HỆ THỐNG

Nghiên cứu được triển khai trong bối cảnh một công ty năng lượng thông minh giả định, vận hành song song hai hạ tầng: hệ thống ứng dụng di động (iOS, Android) và nền tảng web cung cấp dữ liệu tiêu thụ năng lượng cho khách hàng, đồng thời quản lý các nhà máy điện thông qua mạng Hệ thống Điều khiển Công nghiệp (ICS) phức tạp. Hạ tầng lai này tạo ra hai lớp lỗ hổng bảo mật đặc thù: lỗ hổng zero-day trên thiết bị iOS (lấy cảm hứng từ chiến dịch Operation Triangulation năm 2023) và các giao thức ICS lỗi thời thiếu xác thực và mã hóa (lấy cảm hứng từ cuộc tấn công Industroyer vào lưới điện Ukraine năm 2016).

Hệ thống được mô hình hóa bao gồm các thành phần tương tác sau:

Các tác nhân con người: Nhân viên (Employee) thực hiện kiểm tra an ninh định kỳ và triển khai giải pháp; Cố vấn (Advisor) đóng vai trò trưởng nhóm, hướng dẫn nhân viên dựa trên kinh nghiệm; Chuyên gia tư vấn (Consultant) từ nhóm khác được huy động khi cố vấn chính không thể hoàn thành nhiệm vụ.

Huấn luyện viên AI (AI-coach): Được trang bị mô hình tư duy hoàn hảo và cơ sở tri thức đầy đủ về quy trình nội bộ của từng nhóm. AI-coach không tương tác trực tiếp với thế giới vật lý mà thực hiện ba chức năng: giám sát (monitoring state MS6), ra quyết định (decision state DS6) và giao tiếp (communication state CS6). Hệ thống này hoạt động như một bộ đệm nhận thức, can thiệp khi phát hiện sai lệch so với quy trình chuẩn.

Kiến trúc mạng ba tầng: Tầng cơ sở (base layer) biểu diễn các trạng thái thế giới thực và mô hình tư duy của các tác nhân; Tầng thích nghi bậc một (first-order adaptation layer) mô hình hóa các quá trình học tập và quên lãng; Tầng thích nghi bậc hai (second-order adaptation layer) điều chỉnh cường độ học tập dựa trên bối cảnh, đặc biệt là tác động của căng thẳng đối với khả năng lưu giữ tri thức.

3 – PHƯƠNG PHÁP NGHIÊN CỨU

3.1. Khung mô hình hóa định hướng mạng thích nghi

Nghiên cứu sử dụng khung mô hình hóa định hướng mạng thích nghi (Adaptive Network-Oriented Modeling) do Treur phát triển (2018, 2020). Hệ thống được khái niệm hóa như một tập hợp các biến trạng thái (state variables) kết nối với nhau thông qua các mối quan hệ nhân quả (causal connections) có trọng số (weights), diễn ra theo thời gian liên tục.

Phương trình sai phân chi phối sự tiến hóa của mỗi biến trạng thái Y theo thời gian:

Y(t + Δt) = Y(t) + ηY [cY(ωX1,Y · X1(t), …, ωXk,Y · Xk(t)) − Y(t)] · Δt

Trong đó: ηY là hệ số tốc độ thay đổi của trạng thái Y; ωXi,Y là trọng số kết nối từ trạng thái Xi đến Y; cY(…) là hàm kết hợp (combination function) tổng hợp các tác động đầu vào; Δt là bước thời gian rời rạc trong mô phỏng.

3.2. Hàm kết hợp được sử dụng

Hàm alogistic (advanced logistic sum) được áp dụng cho hầu hết các trạng thái:

alogisticσ,τ(V1,…,Vk) = [1/(1 + e^(−σ(V1+…+Vk−τ))) − 1/(1 + e^(στ))] · (1 + e^(−στ))

Với tham số độ dốc σ (steepness) và ngưỡng kích hoạt τ (threshold).

Hàm steponce được dùng cho các yếu tố bối cảnh, mô hình hóa khoảng thời gian kích hoạt từ α đến β:

steponceα,β(V1,…,Vk) = 1 nếu α ≤ t ≤ β, ngược lại bằng 0

3.3. Mạng tự mô hình hóa (Self-Modeling Networks / Reified Networks)

Để mô hình hóa khả năng thích nghi nhận thức, nghiên cứu áp dụng khung mạng tự mô hình hóa. Các đặc tính thích nghi như trọng số kết nối WX,Y và hệ số tốc độ HY được biểu diễn bởi các trạng thái tự mô hình (self-model states) ở tầng cao hơn. Khi giá trị kích hoạt của các trạng thái này thay đổi theo thời gian, chúng động thái điều chỉnh cấu trúc của mạng tầng cơ sở phía dưới.

3.4. Bốn kịch bản nghiên cứu

Kịch bản 1 mô phỏng kiểm tra giao thức an ninh định kỳ trong điều kiện lý tưởng (mô hình tư duy hoàn hảo, không có căng thẳng). Kịch bản 2 xử lý sự cố chỉnh sửa tường lửa trái phép và quy trình khắc phục do cố vấn giàu kinh nghiệm hướng dẫn. Kịch bản 3 đưa vào yếu tố phức tạp: cố vấn bị bệnh, chuyên gia tư vấn từ nhóm khác tiếp quản nhưng chịu áp lực căng thẳng và thiếu kiến thức về quy trình của nhóm. Kịch bản 4 tích hợp AI-coach vào kịch bản 3, với huấn luyện viên AI sở hữu tri thức hoàn hảo, hỗ trợ chuyên gia tư vấn vượt qua rào cản nhận thức.

3.5. Phân tích giả định (What-If Analysis) và đánh giá rủi ro

Ba yếu tố If được biến thiên có hệ thống: mức độ chia sẻ tri thức của AI-coach (thấp 0,0–0,3 với xác suất 0,1; trung bình 0,3–0,5 với xác suất 0,2; cao 0,5–1,0 với xác suất 0,7); mức độ chia sẻ tri thức giữa đồng nghiệp (không chia sẻ với xác suất 0,3; có chia sẻ với xác suất 0,7); mức độ chú ý của chuyên gia tư vấn (không chú ý với xác suất 0,2; chú ý đầy đủ với xác suất 0,8).

Bốn biến kết quả (What factors) được đánh giá gồm mức học tập của nhân viên tại t=2 và t=14, cùng mức học tập của chuyên gia tư vấn tại t=2 và t=14. Ngưỡng rủi ro được xác định là dưới 0,25 tại t=2 (giai đoạn đầu) và dưới 0,70 tại t=14 (giai đoạn dài hạn). Điểm tác động được phân bổ trên thang 1–5, trong đó học tập dài hạn của nhân viên nhận điểm cao nhất (5) do vai trò triển khai giải pháp quyết định.

4 – KẾT QUẢ NGHIÊN CỨU

4.1. Kịch bản 1: Điều kiện lý tưởng

Trong điều kiện không có sai sót và mô hình tư duy hoàn hảo, nhân viên tuân thủ đầy đủ quy trình chẩn đoán tuần tự. Hệ thống phát hiện các lỗ hổng ICS (WS3 tăng, WS2 bằng 0), đăng nhập bất thường (WS6 tăng), giao thức lỗi thời IEC 60870-5-101 (WS9 tăng), và hành vi đáng ngờ trên ứng dụng iOS (WS12 tăng). Nhân viên không hành động ngay lập tức theo lời khuyên ban đầu của cố vấn mà hoàn thành toàn bộ chuỗi kiểm tra trước khi triển khai biện pháp khắc phục, thể hiện quy trình làm việc có kỷ luật và có cấu trúc.

4.2. Kịch bản 2: Giải quyết sự cố tường lửa

Cố vấn có kinh nghiệm phong phú dẫn dắt quy trình một cách suôn sẻ. Đánh giá phát hiện cấu hình sai (WS4), giải thích vấn đề và giải pháp (WS6), sau đó nhân viên triển khai điều chỉnh (WS7). Giải pháp thành công được xác nhận khi WS8 đạt giá trị 1 và WS9 giảm về 0. Kết quả cho thấy khi cả hai tác nhân đều có mô hình tư duy hoàn hảo, tình huống được giải quyết hiệu quả và quy trình diễn ra trơn tru.

4.3. Kịch bản 3: Sự thất bại do căng thẳng và khoảng trống nhận thức

Đây là kịch bản then chốt minh họa điểm yếu của hệ thống thuần túy con người. Đường cong học tập của chuyên gia tư vấn (WC4,C6) ban đầu giảm nhẹ do quên lãng gây ra bởi căng thẳng, sau đó tăng dần nhưng đạt ngưỡng bình ổn ở mức 0,51, tức chỉ lưu giữ được khoảng 50% kiến thức cần thiết. Hệ quả trực tiếp là trạng thái tư duy C6 của chuyên gia tư vấn kích hoạt ngắn rồi suy giảm nhanh, WS6 không xảy ra — chuyên gia tư vấn không bao giờ giải thích được vấn đề và giải pháp cho nhân viên. Nhân viên buộc phải tự triển khai giải pháp mà không có hướng dẫn, dẫn đến WS9 đạt giá trị 1 (giải pháp thất bại hoàn toàn).

4.4. Kịch bản 4: Kết quả được cải thiện nhờ AI-coach

Sự hiện diện của AI-coach tạo ra sự khác biệt có tính quyết định. Đường cong học tập của chuyên gia tư vấn (WC4,C6) tăng đều đặn, không có sự sụt giảm ban đầu, và nhanh chóng đạt mức 0,94 — lưu giữ được khoảng 94% kiến thức liên quan. Điều này cho phép trạng thái tư duy C6 đạt giá trị 1, chuyên gia tư vấn tiếp nhận quyền sở hữu nhiệm vụ (COS6), và WS6 diễn ra thành công. Đáng chú ý, khi WS6 tăng (chuyên gia giải thích thành công), nhu cầu phản hồi từ AI-coach (CS6) giảm dần về 0, thể hiện cơ chế can thiệp thông minh, chỉ kích hoạt khi thực sự cần thiết. Kết quả cuối cùng là WS8 tăng lên (giải pháp hoạt động hiệu quả) và WS9 duy trì ở mức 0 trong suốt tiến trình.

4.5. Kết quả phân tích giả định và đánh giá rủi ro

Khi AI-coach chia sẻ tri thức ở mức thấp (giá trị trung bình lấy mẫu: 0,050), tất cả các kết quả học tập đều dưới ngưỡng nguy hiểm, bất kể các yếu tố con người. Khi ở mức trung bình (giá trị 0,400), học tập giai đoạn đầu (t=2) có thể đạt mức đủ nếu kết hợp với chia sẻ đồng nghiệp, nhưng lưu giữ dài hạn (t=14) vẫn không đạt. Khi AI-coach chia sẻ ở mức cao (giá trị trung bình 0,917), không có rủi ro nào được quan sát — AI-coach một mình đảm bảo đủ mức học tập cho cả nhân viên và chuyên gia tư vấn mà không cần các yếu tố hỗ trợ khác. Điểm rủi ro tổng hợp: nhân viên tại t=2 đạt 0,48; nhân viên tại t=14 đạt 1,50 (mức cao nhất, nguy cơ lớn nhất); chuyên gia tư vấn tại t=2 đạt 0,48; chuyên gia tư vấn tại t=14 đạt 1,20. Sự chênh lệch rủi ro dài hạn giữa nhân viên (1,50) và chuyên gia tư vấn (1,20) phản ánh trách nhiệm cuối cùng của nhân viên trong việc triển khai giải pháp thực tế.

5 – KẾT LUẬN

Nghiên cứu này đã chứng minh rằng an ninh mạng hiệu quả đòi hỏi sự tích hợp cả ba chiều: hạ tầng kỹ thuật, năng lực nhận thức của con người, và hỗ trợ thông minh từ AI. Thông qua mô hình hóa bốn kịch bản tiến triển, nghiên cứu xác lập một số phát hiện cốt lõi.

Mô hình tư duy chung (shared mental models) là nền tảng không thể thiếu: khi các thành viên nhóm có nhận thức đồng thuận về vai trò, mối đe dọa và giao thức phản ứng, hiệu suất ứng phó tăng lên đáng kể. Ngược lại, sự không đồng thuận về mặt nhận thức gây ra hậu quả nghiêm trọng tương đương với các lỗi kỹ thuật. Căng thẳng là nhân tố ức chế học tập có thể định lượng được: kết quả Kịch bản 3 cho thấy căng thẳng làm giảm khả năng lưu giữ tri thức xuống còn 50% mức tối ưu, trực tiếp dẫn đến thất bại trong quy trình ứng phó. AI-coach đóng vai trò bù đắp nhận thức, không phải thay thế: mô hình thể hiện AI hiệu quả nhất khi bổ sung cho suy luận của con người trong thời gian thực, đặc biệt trong các tình huống thiếu kinh nghiệm, áp lực cao, hoặc quá tải nhận thức. Phân tích rủi ro khẳng định chia sẻ tri thức ở mức cao từ AI-coach là yếu tố duy nhất đủ để triệt tiêu mọi rủi ro, vượt trội so với các yếu tố con người như cộng tác đồng nghiệp và chú ý của chuyên gia tư vấn.

Những hạn chế cần lưu ý bao gồm việc các kịch bản vẫn là trừu tượng hóa đơn giản hóa của môi trường thực tế phức tạp hơn nhiều; phạm vi mô hình chỉ bao gồm sự cố cấu hình tường lửa và lỗ hổng ICS, chưa bao quát các mối đe dọa như kỹ nghệ xã hội, ransomware hay tấn công nội gián; và kết quả chưa được xác nhận bằng dữ liệu thực nghiệm từ nhóm an ninh mạng thực tế. Hướng nghiên cứu tương lai cần triển khai thực nghiệm có kiểm soát với chuyên gia an ninh mạng, mở rộng mô hình sang các vector tấn công hỗn hợp, tích hợp dữ liệu thực về nhật ký hiệu suất và chỉ số căng thẳng, cùng khám phá tương tác giữa nhiều AI-coach trong các tổ chức đa phòng ban.