Luận văn Bộ công cụ tìm kiếm thông tin trên mạng

MỤC LỤC  LỜI MỞ ĐẦU.4PHẦN I: MỞ ĐẦU.61. Tính cấp thiết của luận văn.62. Mục đích, nhiệm vụ của luận văn.72.1 Mục đích của luận văn.72.2 Nhiệm vụ của luận văn.73. Phạm vi nghiên cứu.74. Nội dung luận văn.8PHẦN II: NỘI DUNG.9CHƯƠNG I: GIỚI THIỆU BỘ CÔNG CỤ TÌM KIẾM THÔNG TIN.91.1 Khái niệm bộ công cụ tìm kiếm thông tin.91.2 Bộ công cụ tìm kiếm thông tin trên mạng.131.3 Mô hình bộ công cụ tìm kiếm thông tin truyền thống.181.4 cấu trúc dữ liệu trong tổ chức và tìm kiếm thông tin.201.4.1 Bảng băm.201.4.1.1 Khái niệm hàm băm.201.4.1.2 Khái niệm bảng băm.221.4.1.3 Giải quyết xung đột.231.4.2 Cây cân bằng nhiều đường B - Tree.271.4.2.1 Định nghĩa cây B - Trees.271.4.2.2 Cây B* - Tree.291.4.2.3 Cây B+ - Tree.291.4.2.4 Cây BLink – Trees.311.4.2.5 Lựa chọn phương pháp dữ liệu tần số.32CHƯƠNG II: CÁC CÔNG CỤ TÌM KIẾM CƠ BẢN.332.1 Thu hồi trang Web.332.1.1 Web Crawler.332.1.2 Chọn lựa các trang.342.2 Lưu trữ.382.2.1 Sự phân tán trang theo các nút.392.2.2 Các phương pháp tổ chức trang vật lý.402.2.3 Các chiến thuật cập nhật.402.3 Lập chỉ mục.432.1.1 Cấu trúc của bảng chỉ mục.452.1.2 Một số thách thức.462.3.3 Chia bảng chỉ mục.462.4 Sắp xếp và phân tích liên kết.482.4.1 Phương pháp PageRank.492.4.2 Phương pháp HIST.54CHƯƠNG III: THIẾT KẾ CÁC CÔNG CỤ TÌM KIẾM THÔNG TIN TRÊN MẠNG.613.1 Mô đun lập chỉ mục.623.1.1 Khái niệm chỉ mục.623.1.1 Các cấu trúc lưu chỉ mục.623.1.2 Các bước xây dựng chỉ mục theo phương pháp Inverted files.683.1.4 Lập chỉ mục với nguồn dữ liệu đầu vào.763.2 Mô đun tìm kiếm.773.2.1 Các dạng truy vấn.803.2.2 Phân tích cú pháp truy vấn.813.2.3 Các phương pháp giải quyết vấn đề.833.3 Mô đun sắp xếp.82Các mô hình sắp xếp và đánh giá.821. Mô hình Boolean.832. Mô hình không gian vector.84PHẦN III: KẾT LUẬN.901. Kết quả đạt được trong luận văn.902. Hướng phát triển trong tương lai.91TÀI LIỆU THAM KHẢO.94PHỤ LỤC.98

MỤC LỤC

LỜI MỞ ĐẦU.4

PHẦN I: MỞ ĐẦU.6

1. Tính cấp thiết của luận văn.6

2. Mục đích, nhiệm vụ của luận văn.7

2.1 Mục đích của luận văn.7

2.2 Nhiệm vụ của luận văn.7

3. Phạm vi nghiên cứu.7

4. Nội dung luận văn.8

PHẦN II: NỘI DUNG.9

CHƯƠNG I: GIỚI THIỆU BỘ CÔNG CỤ TÌM KIẾM THÔNG TIN.9

1.1 Khái niệm bộ công cụ tìm kiếm thông tin.9

1.2 Bộ công cụ tìm kiếm thông tin trên mạng.13

1.3 Mô hình bộ công cụ tìm kiếm thông tin truyền thống.18

1.4 cấu trúc dữ liệu trong tổ chức và tìm kiếm thông tin.20

1.4.1 Bảng băm.20

1.4.1.1 Khái niệm hàm băm.20

1.4.1.2 Khái niệm bảng băm.22

1.4.1.3 Giải quyết xung đột.23

1.4.2 Cây cân bằng nhiều đường B - Tree.27

1.4.2.1 Định nghĩa cây B - Trees.27

1.4.2.2 Cây B* - Tree.29

1.4.2.3 Cây B+ - Tree.29

1.4.2.4 Cây BLink – Trees.31

1.4.2.5 Lựa chọn phương pháp dữ liệu tần số.32

CHƯƠNG II: CÁC CÔNG CỤ TÌM KIẾM CƠ BẢN.33

2.1 Thu hồi trang Web.33

2.1.1 Web Crawler.33

2.1.2 Chọn lựa các trang.34

2.2 Lưu trữ.38

2.2.1 Sự phân tán trang theo các nút.39

2.2.2 Các phương pháp tổ chức trang vật lý.40

2.2.3 Các chiến thuật cập nhật.40

2.3 Lập chỉ mục.43

2.1.1 Cấu trúc của bảng chỉ mục.45

2.1.2 Một số thách thức.46

2.3.3 Chia bảng chỉ mục.46

2.4 Sắp xếp và phân tích liên kết.48

2.4.1 Phương pháp PageRank.49

2.4.2 Phương pháp HIST.54

CHƯƠNG III: THIẾT KẾ CÁC CÔNG CỤ TÌM KIẾM THÔNG TIN TRÊN MẠNG.61

3.1 Mô đun lập chỉ mục.62

3.1.1 Khái niệm chỉ mục.62

3.1.1 Các cấu trúc lưu chỉ mục.62

3.1.2 Các bước xây dựng chỉ mục theo phương pháp Inverted files.68

3.1.4 Lập chỉ mục với nguồn dữ liệu đầu vào.76

3.2 Mô đun tìm kiếm.77

3.2.1 Các dạng truy vấn.80

3.2.2 Phân tích cú pháp truy vấn.81

3.2.3 Các phương pháp giải quyết vấn đề.83

3.3 Mô đun sắp xếp.82

Các mô hình sắp xếp và đánh giá.82

1. Mô hình Boolean.83

2. Mô hình không gian vector.84

PHẦN III: KẾT LUẬN.90

1. Kết quả đạt được trong luận văn.90

2. Hướng phát triển trong tương lai.91

TÀI LIỆU THAM KHẢO.94

PHỤ LỤC.98

TÀI LIỆU LUẬN VĂN CÙNG DANH MỤC

TIN KHUYẾN MÃI

  • Thư viện tài liệu Phong Phú

    Hỗ trợ download nhiều Website

  • Nạp thẻ & Download nhanh

    Hỗ trợ nạp thẻ qua Momo & Zalo Pay

  • Nhận nhiều khuyến mãi

    Khi đăng ký & nạp thẻ ngay Hôm Nay

NẠP THẺ NGAY