Tóm tắt Luận văn Nghiên cứu các phương pháp chuẩn hóa chữ viết tắt trong văn bản Tiếng Việt

Dấu chấm là dấu kết thúc một câu nhưng cũng có thể là một dấu

trong chữ viết tắt như T.S viết tắt của Tiến Sĩ. Do đó, vị trí của dấu

chấm sẽ được xem xét kiểm tra có phải là dấu ngắt câu hay không.

Thuật toán gồm các bước sau:

Bước 1. Ta duyệt từng ký tự trong văn bản, nếu gặp ký tự dấu

chấm “.” thì gọi vị trí này là i và chuyển sang Bước 2.

Bước2. Kiểm tra ký tự i-1, nếu là ký tự viết thường thì chuyển

sang Bước 3, nếu là ký tự số thì chuyển sang Bước 4, nếu là ký tự

viết hoa thì chuyển sang Bước 5.

Bước 3. Kiểm tra ký tự i+1, nếu là ký tự viết thường, số hay

khoảng trắng thì trả về 1, nếu là ký tự viết hoa thì chuyển sang Bước6.

Bước 4. Kiểm tra ký tự i+1, nếu là ký tự thường, hoa hoặc trắng

thì trả về 1, nếu là ký tự số thì trả về 0.

Bước 5. Kiểm tra ký tự i+1, nếu là ký thường, số hoặc trắng thì

trả về 1, nếu là ký tự hoa thì chuyển sang Bước 7.

Bước 6. Kiểm tra ký tự i+2, nếu là ký tự thường, số hoặc trắng thì

trả về 1, nếu là ký tự hoa thì trả về 0.

Bước 7. Kiểm tra ký tự i+2, nếu là ký tự hoa, số hoặc trắng thì trả

về 0, nếu là ký tự thường thì trả về 1.

TÀI LIỆU LUẬN VĂN CÙNG DANH MỤC

TIN KHUYẾN MÃI

  • Thư viện tài liệu Phong Phú

    Hỗ trợ download nhiều Website

  • Nạp thẻ & Download nhanh

    Hỗ trợ nạp thẻ qua Momo & Zalo Pay

  • Nhận nhiều khuyến mãi

    Khi đăng ký & nạp thẻ ngay Hôm Nay

NẠP THẺ NGAY