Thông tin về luận án tiến sĩ trước bảo vệ cấp Học viện của NCS.Hoàng Minh Quang

logo120
Thông tin về luận án tiến sĩ trước bảo vệ cấp Học viện của NCS. Nguyễn Thị Thu Hằng
03/02/2020
logo120
Thông tin về luận án tiến sĩ trước bảo vệ cấp Học viện của NCS.Đỗ Thị Liên
12/02/2020

Tên đề tài luận án tiến sĩ: NGHIÊN CỨU, PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU TRÊN DỮ LIỆU CÓ CẤU TRÚC

Chuyên ngành:                        Hệ thống thông tin       Mã số:                                    09.48.01.04

Họ và tên nghiên cứu sinh:     Hoàng Minh Quang

Người hướng dẫn khoa học:

      1.  GS. TS. Vũ Đức Thi

  1. TSKH. Nguyễn Ngọc San

Đơn vị đào tạo:                       Học viện Công nghệ Bưu chính Viễn thông

Cơ sở đào tạo:                         Học viện Công nghệ Bưu chính Viễn thông NHỮNG KẾT QUẢ MỚI CỦA LUẬN ÁN

  • Phát hiện thuật toán tìm một rút gọn thuộc tính trong thời gian đa thức không sử dụng heuristic.
  • Phát hiện thuật toán tìm một rút gọn đối tượng trong thời gian đa thức mà vẫn bảo toàn quá trình tìm tất cả các rút gọn thuộc tính.
  • Cải tiến phương pháp sinh cây quyết định thực hiện nhanh hơn quá trình sinh cây quyết định của thuật toán
  • Phát hiện thuật toán PSICFSM giải quyết đẳng cấu đồ thị con trong thời gian đa thức trong khai phá đồ thị con thường xuyên đóng.
  • Xây dựng độ đo trên dàn giao khái niệm khác với độ đo dựa trên vector áp dụng cho phân loại đa nhãn đồ thị theo lý thuyết Dempster-Shafer.

CÁC ỨNG DỤNG, KHẢ NĂNG ỨNG DỤNG TRONG THỰC TIỄN HOẶC NHỮNG VẤN ĐỀ CÒN BỎ NGỎ CẦN TIẾP TỤC NGHIÊN CỨU

  • Thuật toán tìm rút gọn đối tượng, tìm một rút gọn thuộc tính, sinh cây quyết định được ứng dụng để giảm kích thước dữ liệu, tăng tính hiệu quả khai phá dữ liệu trên bảng quyết định nhất quán.
  • Khai phá đồ thị con thường xuyên đóng được ứng dụng trong việc trợ giúp hữu ích trong lĩnh vực y tế như khám phá các thành phần thuốc đặc trị, hoặc hỗ trợ khám phá quy luật biến đổi của tế bào có khả năng gây bệnh chẳng hạn như ung thư.
  • Phân loại đa nhãn đồ thị được ứng dụng hỗ trợ cho dữ liệu sinh trắc học phân loại các mẫu gen đồng thời gây nhiều bệnh, phân loại thuốc mới có thể chữa được nhiều bệnh đồng thời.

Xác nhận của tập thể người hướng dẫn khoa học

TS. VŨ ĐỨC THI  VÀ G S. TSKH. NGUYỄN NGỌC SAN

Nghiên cứu sinh

HOÀNG MINH QUANG

Subject: RESEARCH AND DEVELOP SOME METHODS OF DATA MINING ON STRUCTURED DATA

Specialty:          Information System Code:                         09.48.01.04

Ph.D. student:   Hoang Minh Quang

Supervisor 1:     Vu Duc Thi, Professor, Ph.D

Supervisor 2:     Nguyen Ngoc San,   Professor, Ph.D of Science Academic institute: Posts and Telecommunications Institute of Technology THESIS CONTRIBUTIONS

  • Find an attribute reduction in polynomial time without using heuristic like other methods to find an attribute
  • Finding an object reduction in polynomial time while preserving the process of finding all attribute
  • Improve decision tree generation method to perform faster than decision tree generation of ID3 algorithm.
  • Prove the problem of subgraph isomorphism solved in polynomial time in closed frequent subgraph mining while other algorithms have not solved the problem of subgraph isomorphism in polynomial
  • Building measurement on lattice concept to apply to multi-label graph classification using Dempster-Shafer theory. While other multi-label classification methods  according to Dempster-Shafer theory must build measurements based on vector representations, but graphs cannot be represented in vector

APPLICATIONS,    POSSIBILITIES    OF    APPLICATION    IN    PRACTICE    OR    THE RESEARCH QUESTIONS TO CONTINUE

  • The object reduction algorithm applies to reducing data size while preserving the search for all attribute reduction. The attribute reduction algorithm helps speed up data mining processes on the consistent decision
  • Closed frequent subgraph mining is used to help in medical field, such as discovering drug components, or helping to discover transform rules of potentially pathogenic cells such as
  • The multi-label graph classification is applied to biometrics data to classify gene samples that can simultaneously be involved in metabolism or cause many diseases at the same

Supervisor

Prof. PhD. VU DUC THI    Prof. Sci PhD. NGUYEN NGOC SAN

Ph.D student

HOANG MINH QUANG

 Luận án tiến sĩ

Tóm tắt Luận án tiến sĩ

Trang Thông tin Luận án tiếng việt 

Trang Thông tin Luận án Tiếng Anh