Tác giả

John Michael Maxel Okochea

Marcia Mkansia

Godfrey Mugurusi

Wellington Chakuzira

Ngày đăng tải 25/02/2025
DOI https://doi.org/10.1016/j.procs.2025.01.311
Nguồn bài nghiên cứu Science Direct
Từ khóa

Trí tuệ nhân tạo

Crowdsourcing

Nền tảng huy động đám đông

Tổng quan tài liệu có hệ thống

1 – GIỚI THIỆU

Mặc dù có nhiều tiến bộ vượt bậc trong lĩnh vực công nghệ, đặc biệt là trí tuệ nhân tạo (Artificial Intelligence – AI), các nền tảng crowdsourcing hiện nay vẫn đang đối mặt với nhiều thách thức nghiêm trọng như quá tải dữ liệu và chất lượng dữ liệu kém, làm hạn chế khả năng khai thác toàn diện tiềm năng của chúng. Nghiên cứu này tập trung giải quyết một khoảng trống quan trọng trong tài liệu học thuật hiện có, đó là làm rõ cách thức tích hợp các công nghệ AI vào crowdsourcing nhằm khắc phục các hạn chế cốt lõi của các nền tảng này.

Thông qua việc thực hiện một tổng quan tài liệu có hệ thống đối với 77 bài báo khoa học đã được bình duyệt, nhóm tác giả xác định những hạn chế chủ yếu của các nền tảng crowdsourcing hiện tại, bao gồm kiểm soát chất lượng, khả năng mở rộng, thiên lệch dữ liệu và vấn đề về quyền riêng tư. Nghiên cứu đồng thời làm rõ vai trò của nhiều nhánh AI khác nhau như học máy (Machine Learning), học sâu (Deep Learning), xử lý ngôn ngữ tự nhiên (Natural Language Processing), nhận dạng giọng nói tự động (Automatic Speech Recognition) và sinh ngôn ngữ tự nhiên (Natural Language Generation) trong việc giải quyết các thách thức này.

2 – MÔ TẢ HỆ THỐNG

Hệ thống nghiên cứu trong bài báo được xây dựng dựa trên mối quan hệ tương tác giữa các loại hình nền tảng crowdsourcingcác công nghệ trí tuệ nhân tạo (AI) được tích hợp nhằm cải thiện hiệu suất vận hành, chất lượng dữ liệu và khả năng mở rộng của các nền tảng này. Thay vì đề xuất một kiến trúc kỹ thuật cụ thể, nghiên cứu tiếp cận hệ thống ở cấp độ khái niệm và chức năng, tập trung vào cách AI được sử dụng như một lớp hỗ trợ thông minh (intelligent layer) trong toàn bộ vòng đời hoạt động của crowdsourcing.

Các nền tảng crowdsourcing được phân loại thành nhiều nhóm chức năng khác nhau, bao gồm nền tảng trí tuệ đám đông, nền tảng truy cập mở, nền tảng dữ liệu mở, nền tảng khoa học mở và khoa học cộng đồng, nền tảng đổi mới mở, nền tảng gọi vốn cộng đồng, nền tảng vi tác vụ và nền tảng mã nguồn mở. Mỗi loại nền tảng có mục tiêu hoạt động, cơ chế vận hành và tập hợp thách thức riêng, song đều gặp các vấn đề chung như kiểm soát chất lượng đầu vào, thiên lệch dữ liệu, khả năng mở rộng, điều phối tác vụ và bảo mật thông tin.

Trong hệ thống này, các công nghệ AI như học máy, học sâu, xử lý ngôn ngữ tự nhiên, nhận dạng giọng nói tự động và sinh ngôn ngữ tự nhiên được tích hợp nhằm thực hiện các chức năng cốt lõi gồm: tự động phân loại và đánh giá dữ liệu, hỗ trợ ra quyết định, cải thiện tương tác người–máy, tối ưu hóa phân bổ tác vụ và tự động hóa quá trình tạo nội dung. AI không thay thế hoàn toàn vai trò của con người mà hoạt động theo mô hình “AI trong vòng lặp” (AI-in-the-loop), trong đó con người và hệ thống thông minh cùng phối hợp để khai thác hiệu quả trí tuệ tập thể của đám đông.

3 – PHƯƠNG PHÁP NGHIÊN CỨU

Nghiên cứu áp dụng phương pháp tổng quan tài liệu có hệ thống (Systematic Literature Review – SLR) nhằm tổng hợp, phân tích và đánh giá có hệ thống các công trình nghiên cứu liên quan đến việc ứng dụng AI trong crowdsourcing. Để đảm bảo tính chặt chẽ về mặt phương pháp luận, nhóm tác giả sử dụng khung PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses), cho phép minh bạch hóa toàn bộ quy trình thu thập, sàng lọc và lựa chọn tài liệu.

Nguồn dữ liệu chính được khai thác từ cơ sở dữ liệu SCOPUS, một trong những kho dữ liệu trích dẫn lớn và được kiểm duyệt nghiêm ngặt trong lĩnh vực khoa học xã hội và công nghệ. Quá trình tìm kiếm được thực hiện bằng các toán tử Boolean, kết hợp từ khóa “crowdsourcing” với “artificial intelligence” và năm nhóm công nghệ AI cốt lõi gồm machine learning, deep learning, natural language processing, automatic speech recognition và natural language generation.

Ban đầu, nghiên cứu thu thập được 1.396 tài liệu liên quan đến crowdsourcing. Qua các bước sàng lọc tự động và thủ công, các tài liệu không liên quan trực tiếp đến AI, không phải bài báo khoa học đã bình duyệt, không viết bằng tiếng Anh hoặc nằm ngoài giai đoạn từ năm 2014 đến tháng 6 năm 2024 đều bị loại bỏ. Sau khi đánh giá chi tiết nội dung tóm tắt và toàn văn, 77 bài báo đáp ứng đầy đủ tiêu chí nghiên cứu được lựa chọn cho phân tích cuối cùng.

4 – KẾT QUẢ NGHIÊN CỨU

Kết quả tổng quan cho thấy việc tích hợp AI mang lại tác động tích cực rõ rệt đối với hầu hết các loại hình nền tảng crowdsourcing. Đối với các nền tảng trí tuệ đám đông và đổi mới mở, học máy và học sâu giúp cải thiện chất lượng ý tưởng thông qua việc phát hiện bất thường, giảm thiên lệch và đánh giá hiệu quả các đóng góp của người tham gia. Các mô hình học từ dữ liệu lớn cho phép hệ thống khai thác hiệu quả trí tuệ tập thể, đồng thời nâng cao độ tin cậy của kết quả đầu ra.

Trong các nền tảng truy cập mở và dữ liệu mở, AI đóng vai trò then chốt trong việc tổ chức, phân loại và phân tích dữ liệu quy mô lớn. Các kỹ thuật xử lý ngôn ngữ tự nhiên giúp tự động gán nhãn, trích xuất ngữ nghĩa và cải thiện khả năng tìm kiếm thông tin, từ đó giảm tình trạng quá tải dữ liệu và nâng cao khả năng tiếp cận tri thức. Sinh ngôn ngữ tự nhiên cho phép chuyển đổi dữ liệu có cấu trúc thành nội dung dễ hiểu đối với con người, hỗ trợ hiệu quả cho công tác phổ biến tri thức.

Đối với các nền tảng khoa học mở và khoa học cộng đồng, AI hỗ trợ phân tích dữ liệu nghiên cứu do cộng đồng tạo ra, tăng cường hợp tác và cải thiện chất lượng nghiên cứu. Nhận dạng giọng nói tự động và sinh ngôn ngữ tự nhiên giúp mở rộng khả năng tiếp cận, đặc biệt thông qua tự động tạo phụ đề, phiên âm và nội dung mô tả, qua đó thúc đẩy sự tham gia rộng rãi hơn của công chúng.

Trong lĩnh vực gọi vốn cộng đồng và vi tác vụ, AI giúp cá nhân hóa gợi ý dự án, tối ưu hóa phân bổ tác vụ và nâng cao trải nghiệm người dùng. Các thuật toán học máy hỗ trợ dự đoán khả năng thành công của dự án, phát hiện gian lận và cải thiện tỷ lệ hoàn thành mục tiêu tài chính. Đồng thời, sinh ngôn ngữ tự nhiên được sử dụng để tự động tạo mô tả dự án, cập nhật tiến độ và tương tác với nhà đầu tư.

5 – KẾT LUẬN

Nghiên cứu kết luận rằng trí tuệ nhân tạo đóng vai trò trung tâm trong việc nâng cao hiệu quả, độ tin cậy và khả năng mở rộng của các nền tảng crowdsourcing hiện đại. Việc tích hợp AI không chỉ giúp giải quyết các hạn chế truyền thống như chất lượng dữ liệu thấp, thiên lệch và quá tải thông tin, mà còn mở ra các mô hình crowdsourcing mới có khả năng thích ứng cao hơn với môi trường số phức tạp.

Bài báo nhấn mạnh rằng AI cần được xem như một công cụ hỗ trợ chiến lược, hoạt động song hành với con người, thay vì là giải pháp thay thế hoàn toàn. Để khai thác tối đa tiềm năng này, nghiên cứu đề xuất tăng cường hợp tác liên ngành giữa các nhà nghiên cứu AI, nhà khoa học xã hội và các nhà quản lý nền tảng nhằm xây dựng các hệ thống crowdsourcing thông minh, minh bạch và bền vững. Những kết quả này có ý nghĩa quan trọng đối với cả nghiên cứu học thuật lẫn thực tiễn triển khai crowdsourcing trong bối cảnh chuyển đổi số và Công nghiệp 4.0.