THÔNG TIN VỀ LUẬN ÁN TIẾN SĨ
Họ và tên nghiên cứu sinh: Nguyễn Thị Tân Tiến
Tên đề tài luận án: Nghiên cứu phát triển một số mô hình học sâu trong hỗ trợ chẩn đoán bệnh bụi phổi silic nghề nghiệp dựa trên ảnh X-quang ngực
Chuyên ngành: Khoa học máy tính Mã số: 9 48 01 01
Cán bộ hướng dẫn khoa học:
1. PGS. TS Phạm Văn Cường, Học viện Công nghệ Bưu chính viễn thông
2. TS. Nguyễn Văn Tảo, Trường Đại học Công nghệ Thông tin và Truyền thông, Đại học Thái Nguyên
Tóm tắt các kết quả mới của luận án:
Mục tiêu nghiên cứu
Mục tiêu tổng quát
Nghiên cứu phát triển các mô hình học sâu nhằm hỗ trợ chẩn đoán bệnh bụi phổi silic nghề nghiệp từ ảnh X-quang ngực, dựa trên bộ dữ liệu đa lớp được xây dựng và chuẩn hóa, kết hợp hai hướng tiếp cận học ít mẫu và học sâu trên đồ thị nhằm nâng cao độ chính xác và khả năng tổng quát của mô hình.
Mục tiêu cụ thể
Nghiên cứu và đánh giá tổng quan: phân tích, hệ thống hóa các phương pháp chẩn đoán bệnh bụi phổi silic từ ảnh X-quang ngực, đặc biệt là các kỹ thuật ứng dụng trí tuệ nhân tạo như học máy, học sâu tiên tiến; xác định hướng nghiên cứu để làm cơ sở đề xuất mô hình mới.
Xây dựng tập dữ liệu: đề xuất, tăng cường và hệ thống hóa bộ dữ liệu ảnh X-quang ngực có gán nhãn gồm bốn nhóm: bụi phổi silic nghề nghiệp, viêm phổi do virus, viêm phổi do vi khuẩn và đối tượng bình thường; đảm bảo dữ liệu được chuẩn hóa, cân bằng và có giá trị phục vụ huấn luyện mô hình học sâu.
Phát triển mô hình: nghiên cứu và đề xuất mô hình học sâu cải tiến cho bài toán phân vùng và phân loại tổn thương phổi, dựa trên hai hướng tiếp cận:
(i) Đề xuất ứng dụng phương pháp học ít mẫu (Few-Shot Learning) cho phép mô hình đồng thời thực hiện phân đoạn và phân loại trong điều kiện dữ liệu hạn chế.
(ii) Phát triển kiến trúc Graph Transformer Post-hoc (GTP) kết hợp hàm mất mát cân bằng (Balanced Loss) và kỹ thuật học tổng hợp (Ensemble Learning) để khai thác mối quan hệ không gian giữa các vùng đặc trưng, nâng cao độ ổn định và hiệu năng phân loại.
Đánh giá và ứng dụng: Đánh giá mô hình theo các chỉ số y sinh (độ nhạy, độ đặc hiệu, AUC, F1-score...), trực quan hóa kết quả và so sánh với chẩn đoán của chuyên gia nhằm xác minh khả năng ứng dụng lâm sàng.
Đối tượng nghiên cứu:
Tập dữ liệu ảnh X-quang ngực có gán nhãn, được xây dựng phục vụ bài toán chẩn đoán bệnh bụi phổi silic nghề nghiệp. Tập dữ liệu bao gồm bốn nhóm: bệnh bụi phổi silic nghề nghiệp, bệnh viêm phổi do vi khuẩn, bệnh viêm phổi do virus và nhóm bình thường.
Các mô hình học sâu ứng dụng trong chẩn đoán hình ảnh y tế, bao gồm mạng nơ-ron tích chập (CNN), mạng học sâu trên đồ thị (Graph Neural Networks GNN) và mạng biến đổi (Transformers). Luận án tập trung triển khai các hướng tiếp cận chính: mô hình học sâu ít mẫu (Few-Shot Learning); mô hình Graph Transformer Post-hoc (GTP); các kỹ thuật học tổng hợp (Ensemble Learning). Đặc biệt, mô hình được tối ưu hóa với hàm mất mát cân bằng BalCE nhằm cải thiện hiệu quả phân loại trong điều kiện dữ liệu mất cân bằng.
Phương pháp nghiên cứu:
Phương pháp nghiên cứu lý thuyết: tổng quan và hệ thống hóa các công trình liên quan đến bệnh bụi phổi silic và các mô hình học sâu nhằm xác định hướng nghiên cứu, định hướng đề xuất mô hình phù hợp với bài toán.
Phương pháp thực nghiệm kỹ thuật: thu thập, xử lý và gán nhãn dữ liệu ảnh X-quang ngực; xây dựng tập dữ liệu; triển khai và huấn luyện các mô hình học sâu với nhiều kiến trúc khác nhau, kết hợp thử nghiệm hàm mất mát cân bằng và kỹ thuật học tổng hợp.
Phương pháp đánh giá và kiểm chứng: sử dụng các chỉ số chuẩn như độ chính xác, độ nhạy, độ đặc hiệu, Macro-F1, AUC-ROC; trực quan hóa với Grad-CAM và kiểm định chéo để đảm bảo độ tin cậy.
Phương pháp tham vấn chuyên gia: Tiếp nhận ý kiến của bác sĩ và chuyên gia trong suốt quá trình gán nhãn, xác thực mô hình và đánh giá khả năng ứng dụng thực tiễn trong chẩn đoán lâm sàng.
Ý nghĩa khoa học và thực tiến
Ý nghĩa khoa học:
Luận án góp phần mở rộng và điều chỉnh một số phương pháp học sâu hiện có, phù hợp với đặc thù của dữ liệu y tế, vốn thường khan hiếm và mất cân bằng. Cụ thể, việc đề xuất mô hình Graph Transformer Post-hoc cho phép khai thác quan hệ liên ảnh dưới dạng đồ thị, mở rộng khả năng ứng dụng của học sâu trên đồ thị trong chẩn đoán hình ảnh. Bên cạnh đó, mô hình học sâu ít mẫu (Few-Shot Learning) tích hợp phân loại và phân đoạn cũng giúp làm rõ phạm vi ứng dụng của các phương pháp meta-learning trong bài toán y học thực tế.
Ý nghĩa thực tiễn:
Các kết quả nghiên cứu của luận án có tiềm năng ứng dụng trong trong lĩnh vực y học nghề nghiệp, với các giá trị ứng dụng cụ thể như sau:
Kết quả nghiên cứu có thể hỗ trợ bước đầu trong việc phát triển hệ thống hỗ trợ chẩn đoán bệnh bụi phổi silic, đặc biệt phù hợp khám sàng lọc đối với cơ sở y tế ở vùng sâu, vùng xa, thiếu nhân lực.
Các mô hình đề xuất có tính khả chuyển, có thể được mở rộng cho các bệnh lý phổi khác có biểu hiện ảnh học tương đồng, góp phần thúc đẩy xu hướng ứng dụng AI trong hỗ trợ chẩn đoán hình ảnh y tế tại Việt Nam.
Luận án đã đạt được các kết quả mới sau:
Đóng góp thứ nhất: Đề xuất, tăng cường và hệ thống hóa được bộ dữ liệu.
Luận án đã kế thừa bộ dữ liệu từ trong nước và bổ sung thêm nguồn dữ liệu công khai quốc tế nhằm hình thành một tập dữ liệu có cấu trúc, được tiền xử lý, gán nhãn và kiểm định chất lượng bởi chuyên gia y tế. Bộ dữ liệu này được chuẩn hóa về định dạng, độ phân giải và thông tin nhãn, đảm bảo tính tin cậy và sẵn sàng phục vụ cho các nghiên cứu học máy và học sâu tiếp theo trong lĩnh vực chẩn đoán hình ảnh.
Đóng góp thứ hai: Đề xuất cải tiến mô hình phân vùng và phân loại tổn thương bệnh bụi phổi silic nghề nghiệp từ ảnh X-quang ngực dựa trên hai hướng tiếp cận:
(1) Điều chỉnh và ứng dụng phương pháp học ít mẫu cho phép đồng thời phân đoạn và phân loại.
(2) Phát triển kiến trúc Graph Transformer Post-hoc (GTP) kết hợp hàm mất mát cân bằng (Balanced Loss), kết hợp kỹ thuật học tổng hợp (Ensemble Learning) nhằm khai thác mối quan hệ không gian giữa các vùng đặc trưng, cải thiện độ ổn định, nâng cao hiệu quả mô hình phân loại.
Các hướng nghiên cứu tiếp theo:
Từ những kết quả đạt được, luận án định hướng một số hướng nghiên cứu và phát triển tiếp theo như sau:
Mở rộng bộ dữ liệu và tích hợp dữ liệu lâm sàng: Tiếp tục mở rộng bộ dữ liệu X-quang ngực hiện có bằng cách kết hợp với các nguồn dữ liệu khác như ảnh CT ngực, dữ liệu lâm sàng và thông tin tiền sử bệnh nhân. Việc tích hợp dữ liệu đa nguồn không chỉ giúp tăng độ chính xác trong chẩn đoán mà còn nâng cao khả năng khái quát của mô hình khi áp dụng trong các tình huống thực tế
Tăng cường khả năng tổng quát của mô hình: Mặc dù các mô hình hiện tại đã đạt được kết quả khả quan trong điều kiện huấn luyện có kiểm soát, song cần tiếp tục nghiên cứu các hướng tiếp cận mới như học sâu đa tầng (multi-level learning), học đa nhiệm (multi-task learning) hoặc học không giám sát (unsupervised learning). Những hướng này có tiềm năng cải thiện độ bền vững và khả năng thích ứng của mô hình với dữ liệu không đồng nhất trong thực tế.
Ứng dụng mô hình trong thực tế lâm sàng: Triển khai các mô hình đã phát triển vào thực tế lâm sàng là một thách thức lớn nhưng cũng là cơ hội để chứng minh sự hiệu quả. Cần tiến hành các thử nghiệm lâm sàng với sự tham gia của bác sĩ và chuyên gia y tế để đánh giá độ tin cậy, hiệu năng và khả năng mở rộng của mô hình trong hỗ trợ chẩn đoán bệnh bụi phổi silic cũng như các bệnh lý phổi, bệnh lý nghề nghiệp khác.
INFORMATION ON DOCTORAL THESIS
Full name: Nguyen Thi Tan Tien
Officical thesis title: RESEARCH AND DEVELOPMENT OF DEEP LEARNING MODELS FOR CHEST X-RAY-BASED DIAGNOSIS OF OCCUPATIONAL SILICOSIS
Major: Computer Science Code: 9 48 01 01
Supervisors:
1: Assoc. Prof. Dr. Pham Van Cuong
2: Dr. Nguyen Van Tao
Summary of the new findings of the thesis
First Contribution – Dataset Development:
The dissertation consolidates and extends existing domestic datasets with publicly available data sources to construct a structured, high-quality chest X-ray dataset. The dataset is preprocessed, labeled, and validated by medical experts, standardized in format, resolution, and annotation schema, ensuring its reliability for future machine learning and deep learning research in medical imaging.
Second Contribution – Model Innovation:
The dissertation proposes an improved model for lesion segmentation and classification in occupational silicosis diagnosis based on two integrated approaches:
(1) Adjustment and application of Few-Shot Learning to enable simultaneous segmentation and classification under limited data conditions.
(2) Development of a Graph Transformer Post-hoc (GTP) architecture incorporating Balanced Loss and Ensemble Learning to exploit spatial relationships among feature regions, thereby enhancing model stability and classification performance.
Futher research directions
Building upon the achieved results, several directions for future research are identified:
- Dataset Expansion and Multimodal Integration:
Extending the dataset by incorporating additional data sources, such as CT scans, clinical records, and patient histories, to improve classification accuracy and model robustness. A more diverse dataset will enhance the model’s generalization capability for real-world clinical applications.
- Improving Model Generalization:
Although the current models perform well in controlled settings, they must be further developed to handle heterogeneous and non-standardized data. Investigating multi-task, multi-level, or unsupervised learning strategies may improve robustness and adaptability across different clinical environments.
- Clinical Implementation:
Deploying the proposed models in real-world clinical workflows is both a challenge and an opportunity to validate their efficacy. Future work should involve clinical trials and collaboration with medical practitioners to assess model reliability in assisting the diagnosis of silicosis and potentially other occupational lung diseases.
Nguồn: Trường Đại học Công nghệ thông tin và Truyền thông- Đại học Thái Nguyên.