Trí tuệ nhân tạo có thể giải thích trong tài chính: Lập bản đồ các vấn đề kinh doanh và các giải pháp công nghệ
Explainable artificial intelligence in finance: Mapping business problems and technological solutions
| Tác giả |
Lorenz Sailer |
| Ngày đăng tải | 5/5/2026 |
| DOI | https://doi.org/10.1016/j.finr.2026.100128 |
| Nguồn bài nghiên cứu | Research Gate |
| Từ khóa |
Trí tuệ nhân tạo có thể giải thích Trí tuệ nhân tạo Khả năng giải thích Đánh giá tài liệu có hệ thống Tài chính |
1 – GIỚI THIỆU
Trong những năm gần đây, trí tuệ nhân tạo (AI) đã được áp dụng rộng rãi trong lĩnh vực tài chính, làm thay đổi sâu sắc các lĩnh vực then chốt như quản lý rủi ro tín dụng, dự báo thị trường vốn và phát hiện gian lận. Khi các hệ thống AI ngày càng trở thành một phần không thể tách rời trong các quy trình ra quyết định vận hành và chiến lược, các tổ chức tài chính ngày càng phụ thuộc nhiều hơn vào các mô hình AI phức tạp và không minh bạch — được gọi là các “hộp đen” (black boxes) — mà ngay cả những nhà phát triển hay chuyên gia cũng không thể hiểu hoàn toàn logic nội tại của chúng.
Một bài báo thường xuyên được trích dẫn của Rudin (2019), “Hãy ngừng giải thích các mô hình học máy hộp đen cho các quyết định quan trọng và thay vào đó hãy sử dụng các mô hình có thể diễn giải được”, đã phê phán việc sử dụng các mô hình AI phức tạp trong các lĩnh vực có rủi ro cao như tài chính và y tế. Bài báo thu hút sự chú ý đến những nguy cơ tiềm tàng của các quyết định không minh bạch, đặc biệt khi chúng có tác động sâu rộng đến cuộc sống con người. Tính liên quan này trở nên đặc biệt rõ ràng khi các quyết định của AI ảnh hưởng đến khả năng tiếp cận các dịch vụ tài chính. Ví dụ, Lu và Calabrese (2023) đã sử dụng các kỹ thuật XAI để phát hiện ra các tác động phân biệt đối xử trong quá trình tài trợ của các doanh nghiệp do người châu Á dẫn đầu tại Vương quốc Anh. Ví dụ này minh họa rằng vấn đề hộp đen không chỉ là một hạn chế kỹ thuật, mà còn có thể tạo ra các rủi ro về đạo đức, pháp lý và kinh doanh trong quá trình ra quyết định tài chính.
Để đối phó với những rủi ro đó, lĩnh vực Trí tuệ nhân tạo có thể giải thích (Explainable Artificial Intelligence — XAI) đã xuất hiện. XAI cung cấp một loạt các phương pháp và kỹ thuật được thiết kế nhằm làm cho quá trình ra quyết định của AI trở nên dễ hiểu, đáng tin cậy và minh bạch hơn đối với con người. Nó cho phép các bên liên quan đánh giá và xác nhận các quyết định hoặc dự đoán của AI dựa trên dữ liệu, từ đó hỗ trợ việc ra quyết định có căn cứ, tuân thủ các khung pháp lý như Đạo luật AI của EU và Đạo luật Cơ hội Tín dụng Bình đẳng của Mỹ, cũng như phù hợp với các tiêu chuẩn đạo đức trong các dịch vụ tài chính. Đặc biệt trong các ứng dụng có rủi ro cao như cho vay, giao dịch và phát hiện gian lận, khả năng giải thích không phải là một điều xa xỉ mà là một yêu cầu thiết yếu về mặt chức năng và pháp lý.
Mặc dù XAI mang lại nhiều lợi ích trong việc nâng cao tính minh bạch và hiểu biết về mô hình, việc triển khai thực tế vẫn còn nhiều thách thức. Các nhà ra quyết định không chỉ cần hiểu các khả năng công nghệ của các phương pháp XAI, mà còn cần biết cách kết nối các khả năng này với các vấn đề kinh doanh cụ thể và các khả năng ứng dụng. Thách thức này đặc biệt liên quan đến các nhà ra quyết định phi kỹ thuật và các tổ chức có nguồn lực tài chính, nhân lực hoặc công nghệ hạn chế, chẳng hạn như các doanh nghiệp vừa và nhỏ, thường xuyên đối mặt với sự không chắc chắn khi triển khai các công nghệ kỹ thuật số mới.
Do đó, cần có một khung cấu trúc để kết nối các vấn đề kinh doanh với các khả năng giải pháp công nghệ. Nhằm giải quyết vấn đề này, Bisswang và Richter (2022) đã phát triển Khung Lập bản đồ Không gian Vấn đề (Problem Space Mapping Framework — PSMF), giúp thu hẹp khoảng cách giữa nhu cầu kinh doanh và các giải pháp công nghệ. PSMF được thiết kế đặc biệt để cho phép các nhà ra quyết định phi kỹ thuật phát triển sự hiểu biết toàn diện về các công nghệ kỹ thuật số.
Bài nghiên cứu này áp dụng PSMF vào bối cảnh XAI trong tài chính (FinXAI) nhằm kết nối một cách có hệ thống các vấn đề kinh doanh tài chính với các giải pháp công nghệ XAI, đồng thời mô tả không gian vấn đề kết quả. Nghiên cứu sử dụng PSMF và một đánh giá tài liệu có hệ thống (Systematic Literature Review — SLR) để xác định và phân tích 35 trường hợp sử dụng FinXAI đại diện. Từ các trường hợp sử dụng này, các vấn đề kinh doanh và phương pháp XAI được trích xuất và phân loại. Kết quả của nghiên cứu bao gồm ba hệ thống phân loại toàn diện (taxonomies) cấu trúc các chiều của nhu cầu kinh doanh, các khả năng công nghệ và sự giao thoa của chúng trong các trường hợp sử dụng thực tế.
Các phát hiện chỉ ra rằng các phương pháp dựa trên học máy như SHAP và LIME được sử dụng chủ yếu trong các lĩnh vực quản lý rủi ro tín dụng, dự báo thị trường vốn và phát hiện gian lận. Các phương pháp này nâng cao tính minh bạch của quy trình, sự tin tưởng của các bên liên quan và việc tuân thủ quy định. Nghiên cứu cung cấp hướng dẫn có thể thực thi được cho các nhà ra quyết định trong ngành tài chính, giúp họ hiểu rõ hơn, lựa chọn và triển khai các công nghệ XAI để đáp ứng nhu cầu cấp bách về khả năng giải thích và sử dụng AI có trách nhiệm trong các ứng dụng tài chính có rủi ro cao.
2 – MÔ TẢ HỆ THỐNG
2.1 Khung Lập bản đồ Không gian Vấn đề (PSMF)
PSMF được phát triển bởi Bisswang và Richter (2022) như một mô hình khái niệm được thiết kế để liên kết một cách có hệ thống các vấn đề kinh doanh — thông qua lăng kính các trường hợp sử dụng — với các giải pháp công nghệ kỹ thuật số. Khung này giúp thu hẹp khoảng cách giữa nhu cầu kinh doanh và các giải pháp công nghệ bằng cách kết nối các vấn đề kinh doanh hiện tại với khả năng giải quyết vấn đề của các công nghệ kỹ thuật số. Newell (1966) đã định nghĩa khái niệm không gian vấn đề là tập hợp tất cả các cách có thể về mặt lý thuyết để giải quyết một vấn đề cụ thể. Bisswang và Richter (2022) mô tả không gian vấn đề là “khả năng giải quyết vấn đề cho một công nghệ kỹ thuật số cụ thể”.
Một đặc điểm quan trọng của PSMF là sự phân biệt giữa hệ thống xã hội và hệ thống kỹ thuật. Hệ thống xã hội đại diện cho nhu cầu thị trường và các vấn đề kinh doanh hiện có, trong khi hệ thống kỹ thuật đại diện cho công nghệ đẩy (technology push) và các khả năng của một công nghệ kỹ thuật số. Sự phân biệt này dựa trên Lubik và cộng sự (2013), người đã mô tả lực kéo thị trường (market pull) là nhu cầu về các giải pháp công nghệ dựa trên các vấn đề hiện có, và công nghệ đẩy là việc tạo ra các trường hợp sử dụng mới được kích hoạt bởi các tiến bộ công nghệ.
Trong nghiên cứu này, hệ thống kỹ thuật được xác định thông qua các phương pháp XAI và các cách tiếp cận giải thích của chúng. Ví dụ, SHAP (Shapley Additive exPlanations) đại diện cho một phương pháp XAI, trong khi mức độ liên quan của đặc trưng (feature relevance) đại diện cho một cách tiếp cận giải thích có thể. Hệ thống xã hội được xác định thông qua các vấn đề kinh doanh tài chính và các chiều vấn đề chi tiết hơn, chẳng hạn như thiếu tính minh bạch của mô hình, tuân thủ quy định, sự tin tưởng, hoặc nhu cầu hiểu các dự đoán của mô hình. Một trường hợp sử dụng FinXAI được hình thành khi một vấn đề kinh doanh tài chính được kết nối với một phương pháp XAI. Không gian vấn đề sau đó được mô tả bằng cách liên kết các trường hợp sử dụng này với các chiều vấn đề cụ thể hơn và các cách tiếp cận giải pháp.
2.2 Các nền tảng của Trí tuệ nhân tạo có thể giải thích
AI đã trở thành một chủ đề nổi bật trong những năm gần đây, được thúc đẩy bởi các tiến bộ công nghệ nhanh chóng và sự đưa tin rộng rãi của truyền thông. Trong tài chính, AI được áp dụng như là hỗ trợ ra quyết định trong các lĩnh vực như quản lý rủi ro tín dụng, dự báo thị trường vốn và phát hiện gian lận.
Học máy (Machine Learning — ML), một lĩnh vực phụ của AI, cho phép các hệ thống máy tính học từ dữ liệu, nhận diện các mẫu và cải thiện dự đoán theo thời gian. Học sâu (Deep Learning — DL), dựa trên mạng nơ-ron nhân tạo (Artificial Neural Networks — ANN), có thể đạt được hiệu suất dự đoán cao nhưng thường làm tăng độ phức tạp của mô hình và giảm khả năng diễn giải. Sự đánh đổi giữa hiệu suất và khả năng diễn giải này là trung tâm của nhu cầu về XAI.
Khả năng giải thích (Explainability), khả năng diễn giải (interpretability), tính minh bạch (transparency) và khả năng hiểu được (understandability) là các khái niệm cơ bản để giải quyết vấn đề hộp đen trong trí tuệ nhân tạo và là những thuật ngữ được thảo luận phổ biến nhất trong nghiên cứu XAI. Trong tài chính, các khái niệm này gắn liền chặt chẽ với trách nhiệm giải trình (accountability), công bằng (fairness), tính vững chắc (robustness) và tuân thủ quy định (regulatory compliance). Đảm bảo các nguyên tắc này là cực kỳ quan trọng để xây dựng sự tin tưởng, đặc biệt trong các lĩnh vực có rủi ro cao như tài chính, nơi mà sự thiếu khả năng giải thích của mô hình có thể làm giảm niềm tin của người dùng và cản trở việc áp dụng.
XAI được định nghĩa bởi Chương trình XAI của Cơ quan Dự án Nghiên cứu Tiên tiến Quốc phòng (DARPA) là tạo ra các kỹ thuật học máy và giải thích cho phép con người “hiểu, tin tưởng một cách phù hợp và quản lý hiệu quả thế hệ AI mới nổi” (Gunning và Aha, 2019, trang 45). Một định nghĩa được công nhận rộng rãi khác của Arrieta và cộng sự (2020) đề cập đến đối tượng mà XAI cung cấp “các chi tiết hoặc lý do để làm cho hoạt động của nó trở nên rõ ràng hoặc dễ hiểu” (Arrieta và cộng sự, 2020, trang 85).
XAI cung cấp hai cách tiếp cận về các phương pháp giải thích. Cách tiếp cận thứ nhất sử dụng các mô hình AI có khả năng diễn giải và minh bạch vốn có, gọi là hộp trắng (white-boxes). Chúng có độ phức tạp và tính không minh bạch của mô hình thấp hơn, đó là lý do tại sao lý luận dễ hiểu là vốn có trong bản chất của nó. Cách tiếp cận thứ hai của các phương pháp giải thích tập trung vào việc tạo ra các giải thích cho các đầu ra đã được tạo ra của các mô hình phức tạp và không minh bạch, gọi là hộp đen (black-boxes). Sự khác biệt chính do đó nằm ở thời điểm, giai đoạn mà tại đó khả năng giải thích đạt được, hoặc là tiền nghiệm (ante-hoc) trong mô hình và trong quá trình tạo đầu ra, hoặc là hậu nghiệm (post-hoc) và sau khi mô hình đã tạo ra đầu ra (Speith, 2022).
Các phương pháp giải thích hậu nghiệm không có ảnh hưởng đến các chỉ số hiệu suất của các mô hình hộp đen vì chúng không ảnh hưởng đến quá trình ra quyết định. Do đó, chúng duy trì cùng mức độ chính xác và bổ sung thêm các giải thích, chẳng hạn như mức độ liên quan của các đặc trưng đầu vào đến đầu ra kết quả.
Các mô hình hộp đen, chẳng hạn như mạng nơ-ron sâu (deep neural networks), mạng đối nghịch tạo sinh (generative adversarial networks), mô hình transformer và các phương pháp tổng hợp như rừng ngẫu nhiên (random forests) hoặc XGBoost, thường cung cấp hiệu suất dự đoán cao nhưng khả năng giải thích hạn chế. Các mô hình hộp trắng, chẳng hạn như cây quyết định (decision trees), hồi quy (regression) và các mô hình dựa trên quy tắc (rule-based models), vốn dĩ có thể diễn giải được do bản chất logic của chúng.
Để giải thích các mô hình hộp đen, cần sử dụng các phương pháp XAI hậu nghiệm. LIME (Local Interpretable Model-Agnostic Explanations — Giải thích Cục bộ Không phụ thuộc Mô hình có thể Diễn giải) là một phương pháp hậu nghiệm phổ biến, giải thích các dự đoán riêng lẻ bằng cách sử dụng nhiễu loạn (perturbation) và các mô hình thay thế (surrogate models), trong khi SHAP (Shapley Additive Explanations — Giải thích Cộng tính Shapley) định lượng tầm quan trọng của đặc trưng dựa trên lý thuyết trò chơi và cung cấp cả giải thích cục bộ và toàn cục. Các phương pháp khác bao gồm Biểu đồ Phụ thuộc Một phần (Partial Dependence Plots — PDP), các biểu đồ Kỳ vọng Có điều kiện Cá nhân (Individual Conditional Expectation — ICE), và các giải thích phản thực (counterfactual explanations), trực quan hóa tác động của các giá trị đầu vào hoặc xác định các thay đổi tối thiểu cần thiết để thay đổi một dự đoán.
2.3 XAI trong tài chính (FinXAI)
Ứng dụng của FinXAI nhận được nhu cầu ngày càng tăng về tầm quan trọng của nó trong việc cải thiện tính minh bạch, tuân thủ quy định và sự tin tưởng trong quá trình ra quyết định dựa trên AI trên toàn bộ các dịch vụ tài chính. Vì sự tin tưởng là trung tâm của việc chấp nhận AI trong các nhà quản lý tài chính và các nhà ra quyết định, Gieselmann và cộng sự (2025) đã tiến hành một nghiên cứu phát hiện rằng sự chấp nhận của người dùng mô hình AI “giảm nếu chức năng vượt qua một ranh giới quan trọng và AI tự động thực hiện các quyết định mà không có sự kiểm soát trước của con người”, nhấn mạnh nhu cầu cấp bách của XAI để củng cố sự hiểu biết, sự tin tưởng và trách nhiệm giải trình trong quá trình ra quyết định của AI.
Các trường hợp sử dụng FinXAI có thể được chia thành một số cụm tùy thuộc vào lĩnh vực ứng dụng. Mặc dù có nhiều lĩnh vực cho các ứng dụng FinXAI, những lĩnh vực phổ biến nhất là quản lý tín dụng, dự đoán giá cổ phiếu và phát hiện gian lận. Nhìn chung, tài liệu cho thấy nghiên cứu FinXAI tập trung vào các lĩnh vực tài chính nơi mà các đầu ra mô hình phức tạp đòi hỏi tính minh bạch, lý giải và sự tin tưởng của các bên liên quan.
Một trong những trường hợp sử dụng FinXAI phổ biến nhất là sự kết hợp của XGBoost như một mô hình AI và SHAP như một phương pháp giải thích, đặc biệt trong quản lý tín dụng. Ngoài quản lý tín dụng, vốn thị trường và phát hiện gian lận, các trường hợp sử dụng tài chính XAI tồn tại cho việc nghiên cứu các yếu tố quyết định tài trợ nợ, xác định các yếu tố quyết định biến đổi theo thời gian của rủi ro có chủ quyền (sovereign risk) và dự đoán phá sản.
2.4 Các hệ thống phân loại phương pháp giải thích
Phân loại đối tượng quan tâm thành các hệ thống phân loại là một thách thức cơ bản trong các lĩnh vực khác nhau. Giá trị của các hệ thống phân loại nằm ở việc cho phép các “thảo luận, nghiên cứu và giảng dạy” có cấu trúc. Để cho phép mô tả chính xác và hiểu biết về các phương pháp XAI khác nhau, khả năng mô tả các ứng dụng theo cách có thể so sánh và dễ hiểu, và định nghĩa các thuộc tính và khả năng công nghệ là thiết yếu.
Một hệ thống phân loại được công nhận rộng rãi và thường xuyên được trích dẫn trong tài liệu đã được trình bày bởi Arrieta và cộng sự (2020) dưới dạng cây quyết định. Nút gốc tách biệt các mô hình minh bạch, hộp trắng, khỏi các mô hình giải thích hậu nghiệm, hộp đen. Speith (2022) đã tiến hành đánh giá về hệ thống phân loại này và nhiều hệ thống phân loại khác, đồng thời tổng hợp và mở rộng chúng để đề xuất một hệ thống phân loại mới và chi tiết hơn về các phương pháp giải thích. Nghiên cứu này áp dụng hệ thống phân loại của Speith (2022) cũng như nguyên tắc của nó về việc cho phép mô tả chi tiết và kỹ thuật nhưng đơn giản và dễ hiểu. Hệ thống phân loại của Speith sử dụng thuật ngữ và thực hành phổ biến như phân chia thành các giai đoạn hậu nghiệm hoặc tiền nghiệm, phạm vi toàn cục hoặc cục bộ, và sự phân tách thành các định dạng đầu ra, hoạt động của mô hình và các kết quả khác nhau.
3 – PHƯƠNG PHÁP NGHIÊN CỨU
3.1 Cấu trúc và triển khai đánh giá tài liệu có hệ thống
Việc tiến hành Đánh giá Tài liệu Có hệ thống (SLR) như một phương pháp nghiên cứu cho phép trả lời các câu hỏi nghiên cứu thông qua việc trích xuất nhiều trường hợp sử dụng hiện có, vì phương pháp này cho phép “làm rõ trạng thái của nghiên cứu hiện có và các hàm ý cần được rút ra từ điều này”. Các hướng dẫn SLR từ Brocke và cộng sự (2009) và Bandara và cộng sự (2015) đã được tuân theo để xác định các trường hợp sử dụng FinXAI từ tài liệu và trích xuất các vấn đề kinh doanh và giải pháp công nghệ từ chúng.
Khung đánh giá tài liệu theo Brocke và cộng sự (2009) cấu trúc quá trình đánh giá thành năm giai đoạn: (I) phạm vi đánh giá, (II) khái niệm hóa chủ đề, (III) tìm kiếm tài liệu, (IV) phân tích và tổng hợp tài liệu, và (V) chương trình nghiên cứu.
(I) Phạm vi đánh giá: Phạm vi đánh giá được xác định bằng cách áp dụng hệ thống phân loại đánh giá tài liệu của Cooper (1988). Nghiên cứu này nhằm mục tiêu phân tích các trường hợp sử dụng được mô tả của FinXAI thông qua hướng dẫn của PSMF để trả lời các câu hỏi nghiên cứu. Do đó, trọng tâm của SLR này là trích xuất các ứng dụng. Mục tiêu của SLR này là tích hợp, nhằm tổng hợp các trường hợp sử dụng FinXAI, giải quyết sự đánh đổi hiệu suất-khả năng giải thích và phát triển các cầu nối ngôn ngữ giữa quan điểm kinh doanh và công nghệ. Phạm vi bao phủ của đánh giá là đại diện, vì 35 bài nghiên cứu liên quan đã được xác định để đại diện và điển hình hóa các ứng dụng phổ biến của FinXAI.
(II) Khái niệm hóa chủ đề: Để có được khái niệm rộng về chủ đề, tài liệu về XAI và FinXAI đã được tham khảo cho một tìm kiếm thí điểm. Trong nỗ lực này, các bài báo đánh giá trung tâm cung cấp cái nhìn tổng quan, đồng thời xuất hiện trong các tạp chí có uy tín và được trích dẫn thường xuyên, đã được xác định. Trong số các bài báo đánh giá trung tâm được xác định, một số tập trung vào XAI nói chung, chẳng hạn như Adadi và Berrada (2018), Gunning và Aha (2019), Arrieta và cộng sự (2020), Linardatos và cộng sự (2020) hoặc Speith (2022), và những bài khác đặc biệt về FinXAI, chẳng hạn như Chen và cộng sự (2023) hoặc Černevičienė và Kabašinskas (2024).
(III) Tìm kiếm tài liệu: Nghiên cứu này áp dụng tìm kiếm từ khóa trong các cơ sở dữ liệu Hệ thống Thông tin (IS) có uy tín với phạm vi bao phủ rộng các ấn phẩm XAI. Các cơ sở dữ liệu được xác định là trung tâm, liên quan và có thể truy cập cho XAI là ACM Digital Library, Elsevier ScienceDirect, IEEE Xplore, SpringerLink và Wiley Online Library. Để đảm bảo rằng các ứng dụng XAI được đánh giá là hiện tại, thời gian đánh giá được giới hạn từ 2020 đến 2025. Từ khóa được sử dụng kết hợp với các toán tử Boolean ‘AND’ và ‘OR’ tạo thành chuỗi tìm kiếm: (“Explainable Artificial Intelligence” OR “Explainable AI” OR “XAI” OR “Interpretable Machine Learning” OR “Explainable Machine Learning”) AND (“Finance” OR “Financial” OR “Banking”). Kết quả là 3.416 bài báo được xác định trên năm cơ sở dữ liệu từ năm 2020 trở đi dựa trên tìm kiếm từ khóa. Sau khi loại bỏ các bài đánh giá và trùng lặp, còn lại 1.639 bài để sàng lọc. Dựa trên sàng lọc tiêu đề, từ khóa và tóm tắt, 1.613 bài đã bị loại thủ công. Đối với 44 bài còn lại, toàn bộ văn bản đã được sàng lọc. 2 bài không thể truy cập và 7 bài bị loại vì không đề cập đủ sâu về XAI hoặc lĩnh vực tài chính. Cuối cùng, SLR bao gồm 35 bài nghiên cứu tập trung vào ứng dụng với các mô tả trường hợp sử dụng FinXAI chi tiết.
(IV) Phân tích và tổng hợp tài liệu: Sau khi xác định phạm vi đánh giá, các bài báo được phân tích và tổng hợp. Theo Bandara và cộng sự (2015) và Webster và Watson (2002), một ma trận khái niệm đã được phát triển để đánh giá có hệ thống các bài báo theo các tiêu chí được xác định. Ma trận khái niệm để tiến hành phân tích và trình bày kết quả là lấy tác giả làm trung tâm, như được mô tả bởi Webster và Watson (2002). Khi mỗi bài báo mô tả một trường hợp sử dụng, thông qua cách tiếp cận lấy tác giả làm trung tâm, các trường hợp sử dụng được đặt ở trung tâm tương tự, điều này cho phép phân tích và trình bày thông tin bằng cách sử dụng ma trận khái niệm cho từng trường hợp sử dụng riêng lẻ.
Mã hóa của ma trận khái niệm được phát triển bằng cách sử dụng kết hợp các phương pháp suy diễn và quy nạp. Đầu tiên, các danh mục được trích xuất suy diễn từ tài liệu hiện có để giúp trả lời câu hỏi nghiên cứu. Các danh mục sau đây được áp dụng từ PSMF của Bisswang và Richter (2022): trường hợp vấn đề (problem instance), chiều vấn đề (problem dimension), phương pháp XAI như thành phần vật lý, cách tiếp cận XAI và trường hợp sử dụng như sự kết hợp của Trường hợp Vấn đề và Phương pháp XAI. Các danh mục và đặc điểm tương ứng của chúng được áp dụng từ hệ thống phân loại các phương pháp XAI của Speith (2022): giai đoạn phương pháp XAI, phạm vi, chức năng, kết quả, định dạng đầu ra và loại vấn đề cần giải quyết. Danh mục được thu thập suy diễn cuối cùng là phân loại thành bốn lý do cho XAI của Adadi và Berrada (2018).
Mã hóa quy nạp được thực hiện bằng cách thu thập các danh mục có thể áp dụng chung từ các quan sát riêng lẻ góp phần trả lời câu hỏi nghiên cứu. Các danh mục được xác định quy nạp và các câu hỏi nghiên cứu, liên quan đến công nghệ XAI, bao gồm: các hạn chế được mô tả, liệu có sự đánh đổi hiệu suất cho khả năng giải thích tồn tại đối với các phương pháp tiền nghiệm hay không và liệu và cách nào các chỉ số thành công về khả năng giải thích được áp dụng. Các danh mục liên quan đến phía hệ thống xã hội là: lĩnh vực tài chính, tác động kinh doanh như giá trị kinh tế gia tăng, các bên liên quan được xử lý và các chiều trường hợp sử dụng.
(V) Chương trình nghiên cứu: Chương trình nghiên cứu cho các nghiên cứu tương lai tạo thành giai đoạn thứ năm và cuối cùng của khung đánh giá tài liệu. Chương trình nghiên cứu được xây dựng dựa trên ma trận khái niệm, tiết lộ các thách thức hiện tại cho việc triển khai FinXAI, cũng như sự thiếu tiêu chuẩn để mô tả chúng trong tài liệu.
3.2 Các nguyên tắc thiết kế cho phát triển hệ thống phân loại
Để đảm bảo tính chặt chẽ về phương pháp trong khi duy trì khả năng đọc và tính ứng dụng thực tế, nghiên cứu này phát triển ba hệ thống phân loại dưới dạng các hộp hình thái học (morphological boxes), giải quyết các chiều trung tâm của PSMF: các vấn đề kinh doanh, các giải pháp công nghệ và sự kết hợp của chúng như các trường hợp sử dụng.
Phương pháp phát triển hệ thống phân loại theo Nickerson và cộng sự (2013) và Berger và cộng sự (2018) được áp dụng, bao gồm bảy bước quy trình. Siêu đặc điểm (meta-characteristic) được xác định là mô tả không gian vấn đề FinXAI bằng cách cấu trúc các vấn đề kinh doanh, các thành phần giải pháp công nghệ và sự giao thoa của chúng như các trường hợp sử dụng theo cách có thể tiếp cận với các nhà ra quyết định phi kỹ thuật.
Phương pháp hộp hình thái học được phát triển ban đầu bởi Zwicky (1969) được sử dụng như một phương pháp đổi mới và giải quyết vấn đề có cấu trúc. Các hộp hình thái học cho phép phân rã các vấn đề phức tạp, đa chiều thành các tham số rời rạc và các biểu hiện có thể có của chúng, cho phép tạo ra và phân tích kết hợp các cấu hình giải pháp.
Quá trình phát triển lặp đi lặp lại sử dụng cả hai cách tiếp cận từ khái niệm đến thực nghiệm và từ thực nghiệm đến khái niệm, dựa trên các hệ thống phân loại hiện có và bằng chứng thực nghiệm từ tài liệu được đánh giá. Các lần lặp được sử dụng để xác nhận và điều chỉnh các chiều và đặc điểm cho đến khi không còn nhận ra thêm các tinh chỉnh liên quan và các điều kiện kết thúc được xác định trước được đáp ứng.
4 – KẾT QUẢ NGHIÊN CỨU
4.1 Thiết kế của Phương pháp Phát triển Không gian Vấn đề
PSMF của Bisswang và Richter (2022) tạo thành cơ sở của Phương pháp Phát triển Không gian Vấn đề, phải được nhà nghiên cứu điều chỉnh đặc biệt cho công nghệ kỹ thuật số. Phương pháp này bao gồm bảy hoạt động chính:
Hoạt động 1 là lựa chọn công nghệ kỹ thuật số — trong trường hợp này là XAI — và mục tiêu mô tả không gian vấn đề. Hoạt động 2 liên quan đến việc xác định phương pháp nghiên cứu từ các câu hỏi nghiên cứu: SLR cho phép xác định toàn diện nhiều trường hợp sử dụng FinXAI khác nhau từ tài liệu. Trong hoạt động 3, các “khối xây dựng của không gian vấn đề” từ PSMF được tích hợp vào phương pháp nghiên cứu, tổ chức các danh mục của ma trận khái niệm thành các siêu chiều của các vấn đề kinh doanh, giải pháp công nghệ và các trường hợp sử dụng. Trong bước 4, việc tích hợp các chiều PSMF tiếp tục lặp đi lặp lại, với các điều chỉnh được thực hiện cho các nhu cầu cụ thể của công nghệ kỹ thuật số XAI và đối tượng mục tiêu. Hoạt động 5 là việc tiến hành nghiên cứu như một SLR, trong khi liên tục cải thiện ma trận khái niệm. Hoạt động 6 diễn ra trong SLR và giải quyết cách các chiều của các vấn đề, công nghệ và trường hợp sử dụng được mô tả rõ ràng trong tài liệu. Cuối cùng, hoạt động 7 trong và sau SLR, đã xác định các tạo phẩm phù hợp để minh họa kết quả: ba hệ thống phân loại cho các chiều và đặc điểm của các vấn đề được xử lý bởi FinXAI, các phương pháp FinXAI và các trường hợp sử dụng FinXAI.
4.2 Các chiều của XAI
Hộp hình thái học của các chiều vấn đề kinh doanh
Năm chiều vấn đề khác nhau đã được trích xuất từ sự đa dạng của các trường hợp sử dụng được mô tả:
Chiều thứ nhất và trung tâm là cụm giải quyết sự thiếu khả năng giải thích, khả năng diễn giải, tính minh bạch hoặc sự tin tưởng đối với các quyết định và dự đoán của AI. Do nhiều sự tương đồng và thường được sử dụng thay thế cho nhau, tất cả bốn thuật ngữ này tạo thành một chiều. Chiều này có thể không được giải quyết (không cần giải thích), được giải quyết một phần thông qua chủ yếu là phương pháp heuristics để hậu nghiệm tăng sự hiểu biết, hoặc được giải quyết hoàn toàn với các giải thích được thực hiện trong lý luận của mô hình và thường cho phép quan hệ nhân quả. Sự thiếu khả năng giải thích đã được giải quyết trong 32 trong số 35 bài nghiên cứu.
Chiều thứ hai được giải quyết nhiều nhất, với 22 trong số 35, là tuân thủ quy định hoặc khả năng kiểm toán (regulatory compliance/auditability). Điều này cho thấy rằng việc đáp ứng các yêu cầu pháp lý và các yêu cầu khác thông qua các quyết định AI minh bạch và dễ hiểu là rất quan trọng. Chiều này có thể không được giải quyết, đáp ứng các yêu cầu tối thiểu, hoặc vượt quá các yêu cầu theo lợi ích của bản thân.
Chiều thứ ba là phát hiện bất thường hoặc gian lận (anomaly/fraud detection), được giải quyết trong 7 trong số 35 bài báo. Con số này có vẻ nhỏ so với các chiều khác, cho thấy đây là một chiều vấn đề cụ thể hơn.
Chiều thứ tư là phát hiện thiên lệch và do đó đo lường tính công bằng trong các quyết định AI, được giải quyết trong 5 trong số 35 bài báo. Cuối cùng, chiều thứ năm là các câu hỏi nghiên cứu mở phức tạp, cũng được giải quyết hoặc không giải quyết.
Hộp hình thái học của các chiều phương pháp XAI
Năm chiều của các phương pháp XAI được xác định là rất liên quan đến việc mô tả và hiểu các trường hợp sử dụng FinXAI:
Về tổng quan của các phương pháp XAI được sử dụng phổ biến nhất: SHAP được sử dụng trong 26 trong số 35 bài báo, tiếp theo là LIME và cây quyết định được sử dụng mỗi loại 5 lần. 4 mô hình hộp trắng được phát triển đã được đề xuất. Các phương pháp khác như hồi quy logistic, hồi quy tuyến tính, giải thích phản thực, máy tăng cường có thể giải thích (explainable boosting machine) và các phương pháp khác được áp dụng mỗi loại trong 1 bài báo.
Về giai đoạn: 25 bài sử dụng phương pháp hậu nghiệm không phụ thuộc mô hình (model agnostic post-hoc) và 5 bài sử dụng phương pháp hậu nghiệm cụ thể (specific post-hoc). Các phương pháp hoặc mô hình tiền nghiệm (ante-hoc), luôn có bản chất cụ thể, được sử dụng trong 14 bài báo.
Về phạm vi: 30 bài áp dụng phương pháp XAI cục bộ (local) và 32 bài áp dụng phương pháp toàn cục (global). Điều này chủ yếu do phương pháp SHAP được sử dụng thường xuyên, nổi tiếng với khả năng giải thích cục bộ và toàn cục.
Về chức năng: nhiễu loạn (perturbation) được sử dụng 27 lần, tận dụng cấu trúc (structure leveraging) 11 lần, sửa đổi kiến trúc (architecture modification) 4 lần.
Về kết quả: mức độ liên quan của đặc trưng (feature relevance) được sử dụng bởi 32 và do đó bởi gần như mọi nghiên cứu. Kết quả của các mô hình thay thế (surrogate models) được sử dụng 5 lần.
Về định dạng đầu ra: số học (numerical) với 34 bài và trực quan (visual) với 32 trong số 35 bài báo, thường được sử dụng cùng nhau. Quy tắc (rules) được sử dụng 7 lần.
Hộp hình thái học của các trường hợp sử dụng FinXAI
Hệ thống phân loại đa lớp phân chia tất cả các chiều thành các siêu chiều, theo PSMF: một số chiều được gán cho hệ thống xã hội và các chiều khác cho hệ thống kỹ thuật.
Đối với hệ thống xã hội, các chiều bổ sung sau đây được thêm vào chiều vấn đề: lĩnh vực tài chính (financial domain — gồm quản lý rủi ro tín dụng, dự báo thị trường vốn, phát hiện gian lận/bất thường và các lĩnh vực khác), các bên liên quan (stakeholders — gồm các nhà ra quyết định trong các tổ chức tài chính, cơ quan quản lý và kiểm toán, và các nhà nghiên cứu), tác động kinh doanh (business impact — gồm tính minh bạch quy trình, sự tin tưởng của bên liên quan, hỗ trợ quyết định vận hành, tuân thủ và kiểm toán, phát hiện gian lận, giảm thiểu rủi ro và tính công bằng), và các lý do cho XAI (reasons for XAI — gồm giải thích để biện minh, kiểm soát, cải thiện và khám phá).
Đối với hệ thống kỹ thuật, ngoài các chiều phương pháp XAI được mô tả trước đó, chỉ một chiều — làm rõ liệu trường hợp sử dụng có dựa trên mô hình hộp đen hay hộp trắng — được thêm vào. Điều này cho phép hiểu sâu hơn về trường hợp sử dụng mà không trở nên quá phức tạp cho những người không phải kỹ thuật.
4.3 Mô tả không gian vấn đề của XAI trong tài chính
Sự giao thoa của các siêu chiều — hệ thống xã hội và hệ thống kỹ thuật — dẫn đến không gian vấn đề của FinXAI bao gồm ánh xạ đa chiều của 12 chiều sau:
Các chiều hệ thống xã hội: lĩnh vực tài chính, các bên liên quan, tác động kinh doanh, chiều vấn đề và các lý do cho XAI. Các chiều hệ thống kỹ thuật: mô hình AI, XAI, giai đoạn, phạm vi, chức năng, kết quả và định dạng đầu ra.
Dựa trên 35 bài nghiên cứu được phân tích, ba cụm trường hợp sử dụng thống trị trong không gian vấn đề đã được xác định. Trong số 35 bài báo, quản lý rủi ro tín dụng được đề cập 17 lần, dự báo thị trường vốn 8 lần và phát hiện gian lận 6 lần.
Quản lý rủi ro tín dụng (Credit Risk Management): Các vấn đề kinh doanh phổ biến là việc từ chối hoặc phê duyệt hồ sơ tín dụng không minh bạch dẫn đến giảm sự tin tưởng của các bên liên quan và rủi ro tuân thủ quy định. Các giải pháp kỹ thuật phổ biến là sử dụng các phương pháp hậu nghiệm, chẳng hạn như SHAP hoặc LIME, để giải thích và biện minh cho quá trình ra quyết định của các mô hình hộp đen trên mức độ dễ hiểu tổng thể cũng như cho một ứng dụng đơn lẻ. Trường hợp sử dụng này cung cấp tính minh bạch quy trình tăng cao, sự tin tưởng của các bên liên quan, hỗ trợ quyết định vận hành cũng như tuân thủ các yêu cầu quy định nghiêm ngặt cho một quy trình chấm điểm tín dụng công bằng.
Dự báo thị trường vốn (Capital Market Forecasting): Vấn đề kinh doanh phổ biến nhất là sự thiếu hiểu biết về các dự đoán giá hoặc hiệu suất và các quyết định giao dịch được điều khiển bởi AI. Các giải pháp kỹ thuật phổ biến hiện nay là sử dụng các phương pháp hậu nghiệm, chẳng hạn như SHAP hoặc LIME, và các hộp trắng tiền nghiệm, chẳng hạn như cây quyết định hoặc các sửa đổi mô hình. Các ứng dụng dự báo thị trường vốn này có thể cung cấp tính minh bạch quy trình tăng cao, sự tin tưởng của các bên liên quan và hỗ trợ quyết định vận hành cho quản lý tài sản và các quyết định đầu tư.
Phát hiện gian lận và bất thường (Fraud and Anomaly Detection): Vấn đề kinh doanh phổ biến nhất là thách thức xác định các mẫu gian lận, và việc không thể cung cấp các lý giải dễ hiểu cho con người đối với các trường hợp gian lận được phát hiện bởi hộp đen. Điều này dẫn đến mức độ nỗ lực thủ công cao để nghiên cứu gian lận tiềm năng, cũng như sự không tin tưởng rằng mô hình có thể bỏ sót một số mẫu. Các giải pháp kỹ thuật hiện tại áp dụng SHAP để hậu nghiệm giải thích và biện minh cho quá trình ra quyết định của các mô hình hộp đen, trên phạm vi toàn cục và cục bộ, cho phát hiện gian lận và bất thường. Trường hợp sử dụng này cung cấp tính minh bạch quy trình, sự tin tưởng của bên liên quan, hỗ trợ quyết định vận hành, cũng như những hiểu biết sâu sắc được nâng cao cho các nhà ra quyết định nội bộ và các kiểm toán viên hoặc cơ quan quản lý bên ngoài.
Ngoài ra, các kết quả bổ sung quan trọng từ phân tích ma trận khái niệm bao gồm: (1) 25 trong số 35 bài báo không đề cập đến các hạn chế cụ thể của XAI; (2) 27 trong số 35 bài báo không đề cập đến vấn đề đo lường thành công của khả năng giải thích; (3) Đối với 14 bài báo sử dụng các phương pháp tiền nghiệm, 3 báo cáo không có ảnh hưởng đến hiệu suất, 5 báo cáo tăng hiệu suất và 6 báo cáo hiệu suất thấp hơn so với các mô hình hộp đen phức tạp hơn. Kết quả hỗn hợp cho thấy rằng sự đánh đổi cho XAI tiền nghiệm có thể được giải quyết và cả hai chiều, khả năng giải thích và hiệu suất, có thể được kết hợp bởi một mô hình XAI được tối ưu hóa.