Tóm tắt Luận văn Nghiên cứu các giải pháp tạo nguồn tài nguyên dữ liệu lớn phục vụ xử lý ngôn ngữ tự nhiên

CHƯƠNG I: NGHIÊN CỨU TỔNG QUAN

1.1. CƠ SỞ LÝ THUYẾT

1.1.1. Nguồn tài nguyên dữ liệu

Nguồn tài nguyên dữ liệu là một thành phần của cơ sở hạ tầng công nghệ thông

tin, đại diện cho tất cả các dữ liệu có sẵn của một lĩnh vực nào đó.

Để phục vụ cho việc xử lý ngôn ngữ tự nhiên, cần phải có nguồn tài nguyên dữ

liệu về mặt ngôn ngữ. Nguồn tài nguyên đó gồm: Kho ngữ liệu, từ điển, treebank.

1.1.1.1. Kho ngữ liệu

Ngữ liệu (Corpus) là một dữ liệu tập hợp các văn bản, ngôn ngữ đã được số hóa,

thường gọi là kho ngữ liệu. Chúng được sử dụng để phân tích, thống kê và kiểm tra các

quy tắc ngôn ngữ trong một ngôn ngữ cụ thể nào đó.

1.1.1.2. Dữ liệu từ điển

Từ điển là một thiết bị, công cụ cho phép lưu trữ thông tin mà qua đó, dựa vào

một từ, một cụm từ đơn giản, ta có thể tìm được nghĩa giải thích, các thông tin liên quan

một các nhanh chóng.

1.1.1.3. Tree bank

Treebank là một tập hợp các câu ngữ liệu đã được phân tích và chú thích cú pháp,

thường được biểu diễn dưới dạng cấu trúc cây

TÀI LIỆU LUẬN VĂN CÙNG DANH MỤC

TIN KHUYẾN MÃI

  • Thư viện tài liệu Phong Phú

    Hỗ trợ download nhiều Website

  • Nạp thẻ & Download nhanh

    Hỗ trợ nạp thẻ qua Momo & Zalo Pay

  • Nhận nhiều khuyến mãi

    Khi đăng ký & nạp thẻ ngay Hôm Nay

NẠP THẺ NGAY