Hiện nay đang áp dụng Tiêu chuẩn Việt Nam nào về công nghệ thông tin - Bộ mã kí tự tiếng Việt 16-bit? Phạm vi áp dụng và tính phù hợp như thế nào? – Thế Bằng (Quảng Trị).
>> Danh sách văn bản Trung ương cập nhật ngày 22/01/2024
Hiện nay, đang áp dụng Tiêu chuẩn Việt Nam TCVN 6909:2001 công nghệ thông tin - Bộ mã kí tự tiếng Việt 16-bit. Theo đó, Tiêu chuẩn Việt Nam TCVN 6909:2001 có một số nội dung nổi bật như sau:
- Tiêu chuẩn Việt Nam TCVN 6909:2001 quy định bộ mã 16-bit phục vụ việc biểu diễn, lưu trữ và trao đổi các ký tự tiếng Việt trong công nghệ thông tin.
- Tiêu chuẩn Việt Nam TCVN 6909:2001 quy định cấu trúc của bộ mã kí tự tiếng Việt 16-bit thông qua việc mô tả các tập kí tự thành phần và qui ước mã hóa từng kí tự trong bảng mã.
- Tiêu chuẩn Việt Nam TCVN 6909:2001 không quy định hình dạng cố định và kích thước của các kí tự tiếng Việt, kỹ thuật hiển thị và xử lí những kí tự này.
Toàn văn File Word Luật Tiêu chuẩn và Quy chuẩn kỹ thuật cùng các văn bản hướng dẫn (đang có hiệu lực thi hành) |
Ảnh chụp một phần Lược đồ Luật Tiêu chuẩn và Quy chuẩn kỹ thuật 2006
- Các kí tự tiếng Việt trong tiêu chuẩn này phù hợp với ISO/IEC 10646-1:2000 và UNICODE 3.0 về vị trí trong mặt phẳng đa ngữ cơ bản (BMP); các kí tự khác cần được tham chiếu theo hai tiêu chuẩn trên.
- Việc mã hóa kí tự văn bản tiếng Việt trong một hệ thống công nghệ thông tin được coi là phù hợp với tiêu chuẩn này nếu có sử dụng các tập kí tự qui định trong điều 5 và mã của những kí tự được sử dụng tuân theo đúng điều 6 của tiêu chuẩn này.
ISO/IEC 10646-1:2000 Công nghệ Thông tin - Bộ kí tự tổng hợp mã hóa bằng nhiều octet (UCS) - Phần 1: Cấu trúc và mặt phẳng đa ngữ cơ bản (BMP);
TCVN 6695-1:2000 Công nghệ Thông tin - Từ vựng - Phần 1: Các thuật ngữ cơ bản;
UNICODE phiên bản 3.0;
- Kí tự: một thành viên của một tập chứa các phần tử được dùng để biểu diễn, tổ chức hoặc điều khiển dữ liệu. [TCVN 6695-1:2000].
- Chức năng điều khiển: chức năng tác động đến việc ghi lưu, xử lí, truyền phát hoặc diễn đạt dữ liệu và có biểu diễn mã hóa bằng một hoặc một số octet.
- Bit: chữ số 0 hoặc 1 dùng trong hệ đếm nhị phân. [TCVN 6695-1:2000].
- Byte: một xâu bao gồm một số bit được xử lý như một đơn vị và thường biểu diễn cho một kí tự hoặc một bộ phận của kí tự. [TCVN 6695-1: 2000].
- Octet: một byte chứa 8 bit; cụm 8. [TCVN 6695-1:2000].
- Kí tự khả hiện: kí tự có hình dáng đồ họa ở dạng viết tay, dạng in hoặc hiển thị và không có chức năng điều khiển (những hình dáng đồ họa thể hiện trong tiêu chuẩn này là một minh họa ở dạng in).
- Mã kí tự: giá trị số của một xâu các bit sắp xếp có thứ tự trong biểu diễn một kí tự mã hóa (mã kí tự trong tiêu chuẩn này có độ dài 16 bit và giá trị nằm trong khoảng từ 0000 đến FFFF theo cơ số 16).
- Tập kí tự mã hóa: tập hợp những kí tự tuân theo các qui tắc thiết lập cấu trúc và quan hệ giữa từng kí tự trong đó với mã kí tự tương ứng.
- Bộ mã kí tự: một hoặc một số tập kí tự mã hóa được xác định rõ ràng về thành phần cấu trúc và bảng mã của chúng.
- Bảng mã: bảng trình bày các kí tự được sắp xếp trong các ô có tọa độ tương ứng với mã của chúng.
- Kí tự dấu thanh: thành phần của nhóm kí tự dấu thanh điệu, có khả năng tổ hợp với một số kí tự nguyên âm thành những kí tự có thanh điệu khác.
- Kí tự dấu nguyên âm: thành phần của nhóm kí tự dấu nguyên âm, có khả năng tổ hợp với một số kí tự nguyên âm (như A, E, O, U, a, e, o, u) thành những kí tự nguyên âm khác.