Tóm tắt Luận văn Nghiên cứu và ứng dụng kỹ thuật phân nhóm xây dựng hệ thống dự đoán bệnh tự kỷ ở trẻ em

CHưƠNG 2

CÁC KỸ THUẬT PHÂN NHÓM DỮ LIỆU

2.1. TỔNG QUAN VỀ KỸ THUẬT PHÂN NHÓM

2.1.1. Phân lớp dữ liệu

Phân lớp và dự đoán là hai dạng của phân tích dữ liệu nhằm

trích rút ra một mô hình mô tả các lớp dữ liệu quan trọng hay dự

đoán xu hướng dữ liệu tương lai. Quá trình phân lớp dữ liệu gồm hai

bước :

Bước 1: Học (giai đoạn huấn luyện)

Bước 2: Phân lớp

Phân lớp dữ liệu/đối tượng mới nếu độ chính xác của bộ phân

lớp được đánh giá là có thể chấp nhận được. Cần sử dụng một tập dữ

liệu kiểm tra độc lập với tập dữ liệu đào tạo.

Dưới đây là các kỹ thuật phân lớp đã được sử dụng:

- Phân lớp với cây quyết định

- Phân lớp với mạng Bayesian7

- Phân lớp với mạng Neural

- Phân lớp với k phần tử gần nhất (k-nearest neighbor)

- Phân lớp dựa trên tình huống (case-based reasoning)

- Phân lớp dựa trên tiến hoá gen (genetic algorithms)

- Phân lớp với lý thuyết tập thô (rough sets)

- Phân lớp với lý thuyết tập mờ (fuzzy sets)

2.1.2. Các vấn đề liên quan đến phân lớp dữ liệu

- Chuẩn bị dữ liệu cho việc phân lớp

- Đánh giá các mô hình phân lớp

2.1.3. Các phương pháp đánh giá độ chính xác của mô hình phânlớp

Có 2 phương pháp đánh giá phổ biến là holdout và k-fold

cross-validation. Cả 2 kỹ thuật này đều dựa trên các phân hoạch ngẫu

nhiên tập dữ liệu ban đầu.

TÀI LIỆU LUẬN VĂN CÙNG DANH MỤC

TIN KHUYẾN MÃI

  • Thư viện tài liệu Phong Phú

    Hỗ trợ download nhiều Website

  • Nạp thẻ & Download nhanh

    Hỗ trợ nạp thẻ qua Momo & Zalo Pay

  • Nhận nhiều khuyến mãi

    Khi đăng ký & nạp thẻ ngay Hôm Nay

NẠP THẺ NGAY