MỤC LỤC LỜI CẢM ƠN .iTÓM TẮT .iiMỤC LỤC . iiiMỞ ĐẦU .1Chương 1. KHAI PHÁ DỮLIỆU VĂN BẢN.31.1. Tổng quan vềkhai phá dữliệu.31.1.1. Khái niệm.31.1.2. Các bước của quá trình khai phá dữliệu .31.1.3. Ứng dụng của khai phá dữliệu.51.2. Một sốbài toán trong khai phá dữliệu văn bản.61.2.1. Tìm kiếm văn bản .61.2.2. Phân lớp văn bản.7Chương 2. CÁC PHƯƠNG PHÁP CƠBẢN BIỂU DIỄN VĂN BẢN .102.1. Tiền xửlý văn bản .102.2. Mô hình Logic.122.3. Mô hình phân tích cú pháp .142.4. Mô hình không gian vector .152.4.1. Mô hình Boolean .172.4.2. Mô hình tần suất .172.5. Biểu diễn văn bản trong máy tìm kiếm.202.5.1. Giới thiệu vềmáy tìm kiếm .202.5.2. Mô hình biểu diễn văn bản trong máy tìm kiếm .21Chương 3. BIỂU DIỄN VĂN BẢN SỬDỤNG CÁC KHÁI NIỆM MỜ.23 3.1. Lý thuyết mờ.233.1.1. Tập mờ.233.1.2. Các phép toán trên tập mờ.253.1.3. Quan hệmờ.273.1.4. Các phép toán trên quan hệmờ.273.2. Biểu diễn văn bản sửdụng các khái niệm mờ.293.2.1. Khái niệm mờ.303.2.2. Biểu diễn văn bản .323.2.3. Đềxuất giải pháp cho vấn đề đồng nghĩa.32Chương 4. CÁC PHƯƠNG PHÁP PHÂN LỚP VĂN BẢN .354.1. Tổng quan vềbài toán phân lớp.354.2. Các thuật toán phân lớp .364.2.1. Phân lớp dựa trên thuật toán Naive Bayes.364.2.2. Phân lớp dựa trên thuật toán K - Nearest Neighbor (KNN) .384.2.3. Phân lớp dựa vào thuật toán cây quyết định.394.2.4. Phân lớp sửdụng Support Vector Machines (SVM).41Chương 5. MỘT SỐKẾT QUẢTHỰC NGHIỆM .435.1. Tập dữliệu và tiền xửlý .435.2. Công cụvà phương pháp phân lớp .445.3. Kết quảthực nghiệm .45KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN .53TÀI LIỆU THAM KHẢO .55
MỤC LỤC
LỜI CẢM ƠN .i
TÓM TẮT .ii
MỤC LỤC . iii
MỞ ĐẦU .1
Chương 1. KHAI PHÁ DỮLIỆU VĂN BẢN.3
1.1. Tổng quan vềkhai phá dữliệu.3
1.1.1. Khái niệm.3
1.1.2. Các bước của quá trình khai phá dữliệu .3
1.1.3. Ứng dụng của khai phá dữliệu.5
1.2. Một sốbài toán trong khai phá dữliệu văn bản.6
1.2.1. Tìm kiếm văn bản .6
1.2.2. Phân lớp văn bản.7
Chương 2. CÁC PHƯƠNG PHÁP CƠBẢN BIỂU DIỄN VĂN BẢN .10
2.1. Tiền xửlý văn bản .10
2.2. Mô hình Logic.12
2.3. Mô hình phân tích cú pháp .14
2.4. Mô hình không gian vector .15
2.4.1. Mô hình Boolean .17
2.4.2. Mô hình tần suất .17
2.5. Biểu diễn văn bản trong máy tìm kiếm.20
2.5.1. Giới thiệu vềmáy tìm kiếm .20
2.5.2. Mô hình biểu diễn văn bản trong máy tìm kiếm .21
Chương 3. BIỂU DIỄN VĂN BẢN SỬDỤNG CÁC KHÁI NIỆM MỜ.23
3.1. Lý thuyết mờ.23
3.1.1. Tập mờ.23
3.1.2. Các phép toán trên tập mờ.25
3.1.3. Quan hệmờ.27
3.1.4. Các phép toán trên quan hệmờ.27
3.2. Biểu diễn văn bản sửdụng các khái niệm mờ.29
3.2.1. Khái niệm mờ.30
3.2.2. Biểu diễn văn bản .32
3.2.3. Đềxuất giải pháp cho vấn đề đồng nghĩa.32
Chương 4. CÁC PHƯƠNG PHÁP PHÂN LỚP VĂN BẢN .35
4.1. Tổng quan vềbài toán phân lớp.35
4.2. Các thuật toán phân lớp .36
4.2.1. Phân lớp dựa trên thuật toán Naive Bayes.36
4.2.2. Phân lớp dựa trên thuật toán K - Nearest Neighbor (KNN) .38
4.2.3. Phân lớp dựa vào thuật toán cây quyết định.39
4.2.4. Phân lớp sửdụng Support Vector Machines (SVM).41
Chương 5. MỘT SỐKẾT QUẢTHỰC NGHIỆM .43
5.1. Tập dữliệu và tiền xửlý .43
5.2. Công cụvà phương pháp phân lớp .44
5.3. Kết quảthực nghiệm .45
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN .53
TÀI LIỆU THAM KHẢO .55
<p>Mục Lục</p> <p>LỜI CẢM ƠN . 12</p> <p>Chương 1: GIỚI THIỆU HỆ ĐIỀU HÀNH ANDROID. 13</p> <p>1.1 Giới thiệu hệ điều hành Android . 13</p> <p>1.2. Lịch sử p ...
<p>Mục Lục</p> <p>LỜI CAM ĐOAN.5</p> <p>DANH MỤC CÁC CHỮ CÁI VIẾT TẮT.6</p> <p>DANH MỤC HÌNH VẼ .7</p> <p>DANH MỤC BẢNG BIỂU.8</p> <p>MỞ ĐẦU .1</p> <p>1. ...
<p>MỤC LỤC</p> <p>MỤC LỤC. 2</p> <p>DANH SÁCH CÁC HÌNH . 3</p> <p>DANH SÁCH CÁC BẢNG . 4</p> <p>I. GIỚI THIỆU . 5</p> <p>II. CƠ SỞ LÝ LUẬN THỰC HIỆN ĐỀ TÀI ...
<p>LỜI CẢM ƠN.11</p> <p>CHưƠNG 1: TỔNG QUAN CƠ SỞ LÝ THUYẾT .12</p> <p>1.1 INTERNET, WORLD WIDE WEB VÀ HTML .12</p> <p>1.1.1 Khái niệm cơ bản về Internet.12< ...
<p>MỤC LỤC</p> <p>MỤC LỤC 9</p> <p>DANH MỤC HÌNH.12</p> <p>DANH MỤC BẢNG .13</p> <p>DANH MỤC TỪ VIẾT TẮT.14</p> <p>LỜI NOI ĐẦU .15</p> <p>Chương 1: Giới t ...
Hỗ trợ download nhiều Website
Hỗ trợ nạp thẻ qua Momo & Zalo Pay
Khi đăng ký & nạp thẻ ngay Hôm Nay