CHƯƠNG I: NGHIÊN CỨU TỔNG QUAN
1.1. CƠ SỞ LÝ THUYẾT
1.1.1. Nguồn tài nguyên dữ liệu
Nguồn tài nguyên dữ liệu là một thành phần của cơ sở hạ tầng công nghệ thông
tin, đại diện cho tất cả các dữ liệu có sẵn của một lĩnh vực nào đó.
Để phục vụ cho việc xử lý ngôn ngữ tự nhiên, cần phải có nguồn tài nguyên dữ
liệu về mặt ngôn ngữ. Nguồn tài nguyên đó gồm: Kho ngữ liệu, từ điển, treebank.
1.1.1.1. Kho ngữ liệu
Ngữ liệu (Corpus) là một dữ liệu tập hợp các văn bản, ngôn ngữ đã được số hóa,
thường gọi là kho ngữ liệu. Chúng được sử dụng để phân tích, thống kê và kiểm tra các
quy tắc ngôn ngữ trong một ngôn ngữ cụ thể nào đó.
1.1.1.2. Dữ liệu từ điển
Từ điển là một thiết bị, công cụ cho phép lưu trữ thông tin mà qua đó, dựa vào
một từ, một cụm từ đơn giản, ta có thể tìm được nghĩa giải thích, các thông tin liên quan
một các nhanh chóng.
1.1.1.3. Tree bank
Treebank là một tập hợp các câu ngữ liệu đã được phân tích và chú thích cú pháp,
thường được biểu diễn dưới dạng cấu trúc cây
<p>CHƢƠNG 2</p> <p>THỰC TRẠNG THU HÚT VỐN ĐẦU TƢ PHÁT TRIỂN</p> <p>DU LỊCH TRÊN ĐỊA BÀN TỈNH QUẢNG BÌNH</p> <p>THỜI KỲ 2007 -2012</p> <p>2.1. ĐẶC ĐIỂM CỦA T ...
<p>Nói con người mới là những người đại diện cho một xã hội mới và mang bản</p> <p>chất của xã hội mới là vì con người là chủ thể của xã hội và sự phát triển x ...
<p>CHƢƠNG 2</p> <p>THIẾT KẾ NGHIÊN CỨU</p> <p>2.1. TỔNG QUAN VỀ NHÀ KHÁCH CỤC QUẢN TRỊ T.26</p> <p>2.1.1. Giới thiệu về các nhà khách Cục Quản trị T.26</p> ...
<p>MỤC LỤC</p> <p>LỜI CAM ĐOAN . 1</p> <p>LỜI CẢM ƠN . 2</p> <p>MỤC LỤC . 3</p> <p>DANH MỤC CÁC CỤM TỪ VIẾT TẮT . 6</p> <p>MỞ ĐẦU. 7</p> <p>1. Lí do chọn ...
<p>PHẦN I: MỞ ĐẦU</p> <p>1. Tính cấp thiết của đề tài. 1</p> <p>2. Ý nghĩa khoa học của đề tài . 2</p> <p>3. Mục tiêu nghiên cứu. 3</p> <p>4. Nhiệm vụ nghiê ...
Hỗ trợ download nhiều Website
Hỗ trợ nạp thẻ qua Momo & Zalo Pay
Khi đăng ký & nạp thẻ ngay Hôm Nay