TIÊU CHUẨN QUỐC GIA
TCVN 13239-1:2024
ISO/IEC TR 20547-1:2020
CÔNG NGHỆ THÔNG
TIN - KIẾN TRÚC THAM CHIẾU DỮ LIỆU LỚN - PHẦN 1: KHUNG VÀ QUY TRÌNH ỨNG DỤNG
Information technology - Big data reference architecture - Part 1: Framework
and application process
Lời nói đầu
TCVN 13239-1:2024 hoàn toàn tương đương ISO/IEC TR 20547-1:2020.
TCVN 13239-1:2024 do Học viện Công nghệ Bưu chính Viễn thông biên soạn,
Bộ Thông tin và Truyền thông đề nghị, Ủy ban Tiêu chuẩn Đo lường Quốc gia thẩm
định, Bộ Khoa học và Công nghệ công bố.
TCVN 13239 (ISO/IEC 20547) về Công nghệ thông tin - Kiến trúc tham chiếu
dữ liệu lớn gồm:
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
- TCVN 13239-2:2020 (ISO/IEC 20547-2:2018), Phần 2: Các trường hợp sử dụng
và yêu cầu dẫn suất;
- TCVN 13239-3:2023 (ISO/IEC 20547-3:2020), Phần 3: Kiến
trúc tham chiếu;
- TCVN 13239-4:2024 (ISO/IEC 20547-4:2020), Phần 4: Bảo mật và quyền
riêng tư;
- TCVN 13239-5:2020 (ISO/IEC 20547-5:2018), Phần 5: Lộ trình tiêu chuẩn.
CÔNG NGHỆ THÔNG TIN - KIẾN TRÚC THAM CHIẾU DỮ
LIỆU LỚN - PHẦN 1: KHUNG VÀ QUY TRÌNH ỨNG DỤNG
Information technology -
Big data reference
architecture - Part 1: Framework and application process
1. Phạm vi áp dụng
Tiêu chuẩn này đưa ra các yêu cầu cho khung kiến trúc dữ liệu lớn và
quy trình giúp người dùng tiêu chuẩn có thể áp dụng vào một miền vấn đề cụ thể.
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
Tài liệu viện dẫn sau đây là cần thiết để áp dụng tiêu chuẩn này.
Đối với tài liệu viện dẫn ghi năm công bố thì áp dụng phiên bản được nêu. Đối với
tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất (bao gồm
cả các sửa đổi, bổ sung).
ISO/IEC/IEEE 42010, Systems and
software engineering - Architecture description.
3. Thuật ngữ và định nghĩa
Tiêu chuẩn này sử dụng các thuật ngữ và định nghĩa nêu trong
ISO/IEC/IEEE 42010 và các thuật ngữ định nghĩa sau:
3.1.
Dữ liệu lớn (big data)
Các tập dữ liệu mở rộng - chủ yếu theo các đặc tính dữ liệu về dung lượng,
tính đa dạng, tốc độ chuyển đổi và/hoặc tính biến đổi - đòi hỏi một công nghệ có thể mở
rộng để lưu trữ, thao tác, và phân tích hiệu quả.
CHÚ THÍCH: Dữ liệu lớn thường được dùng theo nhiều cách, ví dụ: tên của
công nghệ được sử dụng để xử lý các bộ dữ liệu mở rộng.
[Nguồn: TCVN 13238:2020 (ISO/IEC 20546:2019), 3.1.2]
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
Kiến trúc tham chiếu (reference architecture)
Trong lĩnh vực kiến trúc phần mềm hoặc kiến trúc doanh nghiệp, kiến
trúc tham chiếu cung cấp một giải pháp khuôn mẫu đã được kiểm chứng cho một kiến
trúc trong một miền vấn đề cụ thể, cũng như một bảng từ vựng chung dùng để thảo
luận việc thi hành, thường với mục đích nhấn mạnh tính phổ biến.
[Nguồn: ISO/TR 14639-2:2014, 2.65]
3.3.
Khung (framework)
Tập hợp cụ thể các niềm tin và ý tưởng được để cập để mô tả một kịch bản hoặc giải
quyết một vấn đề.
[Nguồn: ISO 15638-6:2014, 4.30]
3.4.
Bảo mật (security)
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
[Nguồn: ISO/IEC/IEEE 15288:2015, 4.1, 31]
3.5.
Quyền riêng tư (privacy)
Quyền của các cá nhân trong kiểm soát hoặc tác động đến những thông tin
liên quan đến mình. Thông tin này có thể bị thu thập, lưu trữ hoặc tiết lộ bởi
người khác.
[Nguồn: ISO/IEC TR 26927:2011, 3.34]
3.6.
Nguồn gốc (provenance)
Thông tin về thời gian, địa điểm, xuất xứ, quá trình hình thành các tài
nguyên, hồ sơ, bằng chứng xác thực hoặc quyền sở hữu trong quá khứ.
[Nguồn: ISO/IEC 11179-7:2019, 3.1.10]
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
SQL (Structured Query Language)
Ngôn ngữ cơ sở dữ liệu được quy định trong ISO/IEC 9075.
CHÚ THÍCH 1: SQL là từ viết tắt của Structured
Query Language nhưng trong bộ
tiêu chuẩn ISO/IEC 9075 không sử dụng từ viết tắt này.
[Nguồn: TCVN 13238:2020 (ISO/IEC 20546:2019), 3.1.36]
3.8.
Vòng đời (lifecycle)
Quá trình phát triển của hệ thống, sản phẩm, dịch vụ, dự án hoặc thực
thể nhân tạo nào đó từ lúc hình thành khái niệm đến lúc ngừng sử dụng.
[Nguồn: ISO/IEC/IEEE 15288:2015, 4.1.23]
4. Chữ viết tắt
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
BDA
big
data auditor
Nhà kiểm toán dữ liệu lớn
BDAcP
big
data access provider
Nhà cung cấp dịch vụ truy cập dữ liệu lớn
BDAnP
big
data analytics provider
Nhà cung cấp dịch vụ phân tích dữ liệu lớn
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
big
data application provider
Nhà cung cấp ứng dụng dữ liệu lớn
BDCP
big
data collection provider
Nhà cung cấp dịch vụ thu thập dữ liệu lớn
BDFP
big
data framework provider
Nhà cung cấp khung chức năng dữ liệu lớn
BDIP
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
Nhà cung cấp cơ sở hạ tầng dữ liệu lớn
BDPIaP
big
data platform provider
Nhà cung cấp nền tảng dữ liệu lớn
BDPreP
big
data preparation provider
Nhà cung cấp dịch vụ chuẩn bị dữ liệu lớn
BDProP
big
data processing provider
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
BDSD
big
data service developer
Nhà phát triển dịch vụ dữ liệu lớn
BDSO
big
data system orchestrator
Người điều hành hệ thống dữ liệu lớn
BDSP
big
data service partner
Đối tác dịch vụ dữ liệu lớn
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
big
data reference architecture
Kiến trúc tham chiếu dữ liệu lớn
BDVP
big
data visualization provider
Nhà cung cấp dịch vụ trực quan hóa dữ liệu lớn
GDPR
general
data protection regulation
Quy định chung về bảo vệ dữ liệu
JSON
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
Định dạng JSON
RDF
resource
description framework
Khung mô tả tài nguyên
SQuaRE
systems
and software quality requirements and evaluation
Yêu cầu và đánh giá chất lượng hệ thống và phần mềm
XML
extensible
markup language
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
5. Tổng quan về tiêu chuẩn
Tiêu chuẩn này đưa ra các khái niệm nhất định về kiến trúc tham chiếu dữ
liệu lớn nhằm mục đích áp dụng bộ tiêu chuẩn TCVN 13239 (ISO/IEC 20547) cho tập
hệ thống hoặc tập vấn đề cụ thể.
Từ điều 6 đến điều 9:
- Đưa ra động lực và các mục tiêu cho các tiêu chuẩn về dữ liệu lớn;
- Cung cấp lời giới thiệu và mục đích cho các kiến trúc tham chiếu;
- Cung cấp tổng quan về BDRA và giải thích các
khái niệm chính;
- Cung cấp quy trình áp dụng BDRA vào các miền vấn đề.
Tiêu chuẩn này có thể được hiểu theo nhiều cách khác trong việc đọc và
áp dụng bộ tiêu chuẩn TCVN 13239 (ISO/IEC 20547):
a) Nếu người dùng chỉ đọc tiêu chuẩn này nằm mục đích có được một lượng
kiến thức chung về BDRA và khả năng áp dụng vào miền bài toán của mình, người
dùng chỉ cần tập trung vào điều 5, 6 và 7.
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
6. Chuẩn hóa dữ liệu lớn: động lực và các mục tiêu
Trong một báo cáo năm 2019, IDC dự báo doanh thu toàn thế giới của
ngành dữ liệu lớn và phân tích dữ liệu là 189,1 tỉ USD, tăng 12 % so với năm
2018, và dự đoán tỷ lệ tăng trưởng kép hàng năm trong 5 năm là 13,2 % với
doanh thu năm 2022 vượt quá 274,3 tỉ USD.
Ngoài ra, các bên mua và bên thực thi các hệ thống dữ liệu lớn phải đối
phó sự bùng nổ các công nghệ và các tùy chọn - một lượng lớn trong số đó được
các nhà cung cấp gói gọn trong các từ ngữ thông dụng bao gồm cả các thuật ngữ dữ
liệu lớn không xác định. Để các bên liên quan đến các hệ thống dữ liệu lớn
hiểu được những gì họ đang mua và thực thi thì cần có một khung rõ ràng cho việc
giao tiếp với các nhà cung cấp dịch vụ và công nghệ tiềm năng nhằm hỗ trợ cho
việc giao tiếp trở nên mạnh mẽ và chính xác.
CHÚ THÍCH 1: "Hệ thống dữ liệu lớn" là một hệ thống tận dụng
kỹ thuật dữ liệu lớn và sử dụng một mô hình dữ liệu lớn để xử lý dữ liệu
lớn.
CHÚ THÍCH 2: “Kỹ thuật dữ liệu lớn” là các kỹ thuật tiên tiến khai thác
các tài nguyên độc lập để xây dựng các hệ thống dữ liệu có thể mở rộng khi mà
các đặc tính của các tập dữ liệu cần một kiến trúc mới để có thể lưu trữ, thao
tác và phân tích một cách hiệu quả.
CHÚ THÍCH 3: “Mô hình dữ liệu lớn” là sự phân phối các hệ thống dữ liệu
xuyên suốt các tài nguyên độc lập, được kết hợp theo chiều ngang để đạt được khả
năng mở rộng cần thiết cho việc xử lý các tập dữ liệu mở rộng một cách hiệu quả.
Giá trị tiềm năng của việc phân tích dữ liệu lớn là yếu tố thu hút các
tổ chức với việc thực thi các hệ thống dữ liệu lớn, tuy nhiên, họ cần phải hiểu
được các vấn đề và trách nhiệm pháp lý tiềm ẩn liên quan đến việc quản lý và kiểm
soát dữ liệu này. IDC ước tính rằng các doanh nghiệp có trách nhiệm và chịu
trách nhiệm pháp lý với gần 80 % lượng thông tin trong toàn cầu số và chuẩn bị ứng
phó các vấn đề về tuân thủ nguyên tắc, bản quyền và riêng tư. IDC dự đoán thêm
rằng, tới năm 2020, hơn 40 % lượng thông tin trong toàn cầu số cần đến sự bảo vệ
rõ ràng và lượng dữ liệu này đang tăng nhanh hơn so với tổng toàn cầu số. Những
rủi ro này nghĩa là các tổ chức cần phải có khả năng xác định, định nghĩa và
nêu rõ các chính sách cho bảo mật dữ liệu, nguồn gốc và quản trị cũng như là thực
thi và cung cấp tư liệu các kỹ thuật kiểm soát để triển khai các chính sách nhằm
bảo vệ toàn bộ tổ chức khỏi trách nhiệm pháp lý đối với sự dàn xếp hoặc sử dụng
sai dữ liệu do họ kiểm soát.
Cuối cùng, rất ít các tổ chức xử lý dữ liệu lớn chỉ hoạt động dựa trên
dữ liệu nội bộ của họ, nghĩa là các hệ thống thu thập và phân tích dữ liệu lớn
phải có khả năng tương tác và chia sẻ dữ liệu một cách an toàn và tin cậy. Trong thực
tế, dung lượng không giới hạn liên kết với dữ liệu lớn thường làm cho việc
truyền dữ liệu giữa các hệ thống là không khả thi, trong nhiều trường hợp, các
phân tích dựa trên việc truyền dữ liệu này không chỉ đòi hỏi khả năng
tương tác ở mức dữ liệu mà còn đòi hỏi ở mức phần mềm và mức ứng dụng giữa các
hệ thống.
Trong bối cảnh dữ liệu lớn hiện nay, các yêu cầu thị trường cho chuẩn
hóa dữ liệu lớn được kiểm chứng và các ưu tiên chuẩn hóa được xác định như sau:
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
b) các thông số kỹ thuật và chuẩn hóa siêu dữ liệu bao gồm nguồn gốc dữ
liệu;
c) các mô hình ứng dụng (ví dụ: khối, luồng, v.v.);
d) các ngôn ngữ truy vấn bao gồm các truy vấn không ràng buộc hỗ trợ
các kiểu dữ liệu đa dạng (XML, RDF, JSON,
đa phương tiện, v.v.) và các hoạt
động dữ liệu lớn (ví dụ: các hoạt động ma trận);
e) ngôn ngữ cho một miền cụ thể;
f) ngữ nghĩa chính thức cuối cùng;
g) các giao thức mạng tiên tiến cho việc truyền dữ liệu hiệu quả;
h) các bản thể học chung, các bản thể học cho miền cụ thể và các nguyên
tắc phân loại cho việc mô tả ngữ nghĩa dữ liệu bao gồm cả sử tương tác giữa các
bản thể học;
i) các kiểm soát truy cập bảo mật và quyền riêng tư dữ liệu lớn;
j) phân tích từ xa, phân tán và liên kết (đưa các phân tích vào dữ liệu)
bao gồm dữ liệu và xử lý tài nguyên khám phá và khai thác dữ liệu;
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
l) lưu trữ dữ
liệu (ví dụ: hệ thống lưu trữ bộ nhớ, hệ thống tệp phân tán, kho dữ liệu, v.v.);
m) việc sử dụng của con người cho các kết quả của việc phân tích dữ liệu
(ví dụ: sự trực quan hóa);
n) đo năng lượng cho dữ liệu lớn;
o) giao diện giữa các kho dữ liệu quan hệ (SQL) và phi quan hệ (NoSQL);
p) chất lượng, sự mô tả chân thực và quản lý dữ liệu lớn.
Bộ tiêu chuẩn TCVN 13238:2020 (ISO/IEC 20546:2019) và TCVN 13239
(ISO/IEC 20547) được phát triển với mục đích giải quyết các vấn đề này.
Tiêu chuẩn này đề cập cụ thể khung và quy trình ứng dụng, các trường hợp
sử dụng và yêu cầu dữ liệu lớn [điểm a) ở trên], các kiến trúc tham chiếu [điểm
a) ở trên], bảo mật và quyền riêng tư [điểm i) ở trên] và lộ
trình tiêu chuẩn hoá. Ngoài ra, các tổ chức có các yêu cầu phân tích dữ liệu không
thể đợi các tiêu chuẩn dữ liệu lớn cụ thể trước khi họ có thể thực thi các hệ
thống của mình. Bởi vì dữ liệu lớn về bản chất là một tập con của tất cả dữ liệu,
và hầu hết các tiêu chuẩn công nghệ thông tin đều xử lý dữ liệu ở một khía cạnh
nào đó, đang có một số lượng lớn các tiêu chuẩn đang được áp dụng hoặc đang
trong quá trình phát triển nhằm giải quyết một số vấn đề của dữ liệu lớn. Để
giải quyết nhu cầu này, TCVN 13239-5:2020 (ISO/IEC TR 20547-5:2018) là một lộ
trình các tiêu chuẩn nhằm hiệu chỉnh các tiêu chuẩn hiện có tới các vai trò nằm
trong kiến trúc tham chiếu để cung cấp cho các bên liên quan tới hệ thống
dữ liệu lớn các hướng dẫn về cách áp dụng các tiêu chuẩn này như thế nào vào
các vấn đề ngày nay. Điều 7 sẽ miêu tả từng phần trong bộ tiêu chuẩn này.
7. Các cơ sở khái niệm
7.1. Yêu cầu chung
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
- xử lý các tập dữ liệu mở - chủ yếu trong các đặc điểm về dung lượng,
tính đang dạng, tốc độ chuyển đổi, và/hoặc tính biến đổi - đòi hỏi một kiến
trúc có thể mở rộng để lưu trữ, thao tác và phân tích hiệu quả;
- thúc đẩy các kỹ thuật tiên tiến nhằm khai thác các tài nguyên độc lập
để xây dựng các hệ thống dữ liệu có khả năng mở rộng khi các đặc điểm của các tập
dữ liệu cần các kiến trúc mới để lưu trữ, thao tác và phân tích hiệu quả;
- sử dụng một mô hình trong đó phân bố các hệ thống dữ liệu kết hợp
theo trục ngang và các tài nguyên độc lập để đạt được tính mở rộng cần có trong
việc xử lý hiệu quả các tập dữ liệu mở rộng.
Bản chất phổ rộng và không bị giới hạn của các hệ thống dữ liệu lớn đòi
hỏi kiến trúc tham chiếu trong bộ tiêu chuẩn TCVN 13239 (ISO/IEC 20547) phải đầy
đủ đề đại diện cho nhiều trường hợp sử dụng tiềm năng được thực hiện bởi các hệ
thống dữ liệu lớn.
7.2. Các khái niệm kiến trúc tham chiếu
Để có thể hiểu được kiến trúc tham chiếu bao gồm những gì, trước tiên cần
phải xác định rằng kiến trúc tham chiếu nghĩa là gì. Vì nó là một kiến trúc, kiến
trúc tham chiếu nhất thiết phải sở hữu các đặc điểm của một kiến trúc được định
nghĩa trong ISO/IEC/IEEE 42010. Kiến trúc tham chiếu dữ liệu lớn cũng cần được
khái quát hóa đủ để có thể bao gồm nhiều loại kiến trúc hệ thống dữ liệu lớn tiềm
năng.
Nhìn theo quan điểm hướng đối tượng, kiến trúc tham chiếu sẽ được coi
như là một lớp trừu tượng mà từ đó các trường hợp cụ thể của các kiến trúc rút
ra được các cấu trúc và thuộc tính của chúng.
ISO/TR 14639-2 định nghĩa một kiến trúc tham chiếu trong lĩnh vực kiến
trúc phần mềm hoặc kiến trúc doanh nghiệp, cung cấp một giải pháp mẫu đã được
chứng minh cho một kiến trúc đối với một miền cụ thể, cũng như là các từ vựng
chung dùng trong thảo luận việc thực thi, thường với múc định nhấn mạnh tính
chung.
Dựa trên lý luận này, một kiến trúc tham chiếu là một khung kiến trúc
như được định nghĩa bởi ISO/IEC/IEEE 42010, bao gồm cấu trúc, các quy tắc và
ràng buộc chung cho tất cả hệ thống dữ liệu lớn. Do đó, kiến trúc tham chiếu dữ
liệu lớn cung cấp một loạt các quy ước, nguyên tắc và thực tiễn để mô tả các kiến
trúc hệ thống dữ liệu lớn.
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

Hình 1 - Khái
niệm các kiến trúc tham chiếu
7.3. Cấu trúc kiến trúc tham chiếu
Hình 2 kết hợp các khái niệm và cấu trúc từ ISO/IEC/IEEE 42010 để mô tả
phác thảo cho kiến trúc tham chiếu. Một kiến trúc tham chiếu được xác định cho
một lĩnh vực. Đối với kiến trúc tham chiếu này, lĩnh vực là dữ liệu lớn.
Lĩnh vực xác định môi trường, đối với trường hợp dữ liệu lớn thì môi
trường được xác nhận chủ yếu bởi các đặc tính cốt yếu của dữ liệu lớn - dung
lượng, tốc độ chuyển đổi, tính đa dạng, tính biến đổi (xem TCVN 13238:2020
(ISO/IEC 20546:2019)).
Các bên liên quan trong môi trường này bao gồm tất cả các bên liên quan
thường gặp (người dùng, chủ sở hữu, kiến trúc sư, v.v) đối với bất ký hệ thống
nào, cùng với đó là bất kỳ ai có mối quan tâm liên quan đến dữ liệu và
các đặc điểm của nó.
Môi trường hạn chế các mối quan tâm. Vì môi trường được định nghĩa bởi
các đặc tính của dữ liệu lớn, các mối quan tâm bị ràng buộc bởi các đặc tính đó
và mỗi một mối quan tâm phải liên quan đến một hoặc nhiều đặc điểm cùng với
(các) bên liên quan có mối quan tâm đó.
Kiến trúc tham chiếu được mô tả sử dụng một khung kiến trúc. Khung này
được mô tả trong TCVN 13239-3:2023 (ISO/IEC 20547-3:2020)
và được trình bày theo hai góc nhìn:
- các vai trò và hoạt động - góc nhìn người dùng;
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
Mỗi một quan điểm này lần lượt giải quyết một hoặc nhiều mối quan tâm.
Các mối quan tâm đó có thể được giải quyết bằng một hoặc nhiều vai trò,
hoạt động và thành phần chức năng nằm trong các góc nhìn kiến trúc đó.
Ví dụ trong một hệ thống theo dõi tín dụng, tất cả mọi người có hồ sơ
trong hệ thống đó đều là một bên liên quan. Tất cả đều có mối quan tâm rằng quyền
riêng tư của họ cần được duy trì, và sự bảo mật đối với các thông tin cá nhân cần
được bảo vệ.
Nằm trong cả hai góc nhìn người dùng và góc nhìn chức năng của kiến
trúc tham chiếu dữ liệu lớn là một khía cạnh xuyên suốt về tính bảo mật và quyền
riêng tư. Khía cạnh xuyên suốt này có mối quan hệ với hoạt động “thực hiện
thanh tra” và thành phần chức năng “khuôn khổ thanh tra” mà giải quyết mối quan
tâm đó.

Hình 2 - Phác thảo cơ bản kiến trúc tham chiếu
dựa trên ISO/IEC/IEEE 42010
8. Các yếu tố của kiến trúc tham chiếu dữ liệu lớn
8.1. Tổng quan
Trong môi trường hệ thống dữ liệu lớn, tiêu chuẩn này cung cấp cấu trúc
BDRA thông qua phạm vi áp dụng của từng phần trong bộ tiêu chuẩn TCVN 13239
(ISO/IEC 20547), mối quan hệ lô-gíc giữa các phần và quy trình ứng dụng BDRA.
Phạm vi áp dụng của mỗi phần trong bộ tiêu chuẩn TCVN 13239 (ISO/IEC 20547) cụ
thể như sau:
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
- TCVN 13239-2:2020 (ISO/IEC TR 20547-2:2018): Các trường hợp sử dụng
và các yêu cầu dẫn xuất cung cấp các ví dụ về các trường hợp sử dụng dữ liệu lớn
với các miền ứng dụng và các xem xét kỹ thuật được rút ra từ các trường hợp sử
dụng.
- TCVN 13239-3:2023 (ISO/IEC 20547-3:2020): Kiến trúc tham chiếu nêu rõ
kiến trúc tham chiếu dữ liệu lớn. Kiến trúc tham chiếu bao gồm các khái niệm và
các góc nhìn kiến trúc (góc nhìn người dùng và góc nhìn chức năng).
- TCVN 13239-4:2024 (ISO/IEC 20547-4:2020): Tính bảo mật và quyền riêng
tư nêu rõ khía cạnh bảo mật và riêng tư áp dụng cho BDRA bao gồm các vai trò,
hoạt động và các thành phần chức năng dữ liệu lớn; đồng thời cung cấp hướng dẫn
về các hoạt động bảo mật và quyền riêng tư đối với dữ liệu lớn.
- TCVN 13239-5:2020 (ISO/IEC TR 20547-5:2018): Lộ trình các tiêu chuẩn
mô tả các tiêu chuẩn liên quan đến dữ liệu lớn, cả đang tồn tại và đang xây dựng,
cùng với các ưu tiên xây dựng tiêu chuẩn dữ liệu lớn trong tương lai dựa trên
phân tích sự thiếu hụt tiêu chuẩn.
Hình 3 thể hiện các mối quan hệ và chu kỳ lặp lại của từng phần trong bộ
tiêu chuẩn TCVN 13239 (ISO/IEC 20547). Dựa trên các đóng góp từ các doanh nghiệp,
các tổ chức và chuyên gia trong lĩnh vực nghiên cứu và học viện liên quan, TCVN
13239-2:2020 (ISO/IEC TR 20547-2:2018) thu thập các trường hợp sử dụng và rút
ra các cân nhắc kỹ thuật. TCVN 13239-3:2023 (ISO/IEC 20547-3:2020) xác định kiến
trúc tham chiếu cho dữ liệu lớn bằng cách phản ánh các cân nhắc kỹ thuật này. Cụ
thể, TCVN 13239-4:2024 (ISO/IEC 20547-4:2020) quy định khía cạnh bảo mật và
riêng tư để hỗ trợ dữ liệu lớn. TCVN 13239-5:2020 (ISO/IEC TR 20547-5:2018)
cung cấp các danh sách các tiêu chuẩn có thể áp dụng theo quan điểm kiến trúc tham chiếu.
Bộ tiêu chuẩn TCVN 13239 (ISO/IEC 20547) thể hiện góc nhìn theo thời gian về
các hệ thống và kiến trúc dữ liệu lớn. Khi các thực thi dữ liệu lớn được tạo ra
và phát triển dựa trên TCVN 13239-1:2024, TCVN 13239-2:2020 (ISO/IEC TR
20547-2:2018), TCVN 13239-3:2023 (ISO/IEC 20547-3:2020) và TCVN 13239-4:2024
(ISO/IEC 20547-4:2020), chúng sẽ tham chiếu và sử dụng các tiêu chuẩn được ghi
trong TCVN 13239-5:2020 (ISO/IEC TR 20547-5:2018). Các hệ thống mới có này thể
được ghi lại trong TCVN 13239-2:2020 (ISO/IEC TR 20547-2:2018) như là các trường
hợp sử dụng mới và sẽ từ đó dẫn tới các cân nhắc kỹ thuật mới. Các cân nhắc kỹ
thuật được giới thiệu bởi
các trường hợp sử dụng này có thể
dẫn tới các hoạt động tiêu chuẩn hóa mới, từ đó dẫn đến các tiêu chuẩn mới được
ghi lại trong TCVN 13239-5:2020 (ISO/IEC TR 20547-5:2018).

Hình 3 - Các mối quan hệ giữa các phần của bộ
tiêu chuẩn TCVN 13239 (ISO/IEC 20547)
Khi áp dụng khung tham chiếu trong một trường hợp sử dụng cụ thể, người
dùng cần phải hiểu rõ môi trường tổng thể triển khai hệ thống dữ liệu lớn, bên
liên quan đến hệ thống này và các mối quan tâm của bên liên quan. Từ 8.2 đến
8.4 mô tả từng thành phần chính của khung tham chiếu, bao gồm: các bên liên
quan, các mối quan tâm và các góc nhìn.
8.2. Các bên liên quan
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
Đối với trường hợp hệ thống dữ liệu lớn, bên liên quan bao gồm bất kỳ
bên nào có mối quan tâm đến dữ liệu đang được hệ thống xử lý, bao gồm: chủ sở hữu
dữ liệu (bên cung cấp dữ liệu cho hệ thống dữ liệu lớn), người dùng dữ liệu
(bên đưa ra các quyết định dựa trên dữ liệu từ hệ thống dữ liệu lớn) và đối tượng
được dữ liệu mô tả.
Bước đầu tiên trong việc phát triển một kiến trúc dữ liệu lớn là xác định
bên liên quan và các mối quan tâm. Trong TCVN 13239-3:2023 (ISO/IEC
20547-3:2020), bên liên quan là các bên tham gia trong góc nhìn người dùng.
8.3. Các mối quan tâm
Bất kỳ sự chú ý nào đối với một hệ thống liên quan đến một hoặc nhiều
bên liên quan của hệ thống đó là một mối quan tâm. Trong ISO/IEC/IEEE 42010, mối
quan tâm gắn liền với bất kỳ khía cạnh nào của hệ thống dữ liệu lớn bao gồm các
ảnh hưởng kỹ thuật, kinh doanh, vận hành, pháp lý và thậm chí cả xã hội lên một
hệ thống trong môi trường của hệ thống đó. Định nghĩa và giới hạn cho môi trường
của một hệ thống do bên liên quan và mối quan tâm đối với hệ thống đó quy định.
Một số mối quan tâm có thể được hệ thống hóa theo các tiêu chuẩn quốc tế khác.
CHÚ THÍCH 1: ví dụ trong
tính trong suốt được mô tả trong Mô hình tham chiếu xử lý phân tán mở
(ISO/IEC 10746-1) là các mối quan tâm liên quan đến việc vận hành của một hệ thống
dữ liệu lớn vì quy mô phương ngang và xử lý phân tán là khía cạnh cốt lỗi của
hệ thống dữ liệu lớn.
CHÚ THÍCH 2: Các thuộc tính phần mềm được mô tả trong
SQuaRE (ISO/IEC 25010:2011, 4.2) nêu lên các mối quan tâm về chất lượng phần mềm
trong một hệ thống dữ liệu lớn, bao gồm: tính hữu hiệu, tính hiệu quả, độ tin cậy,
độ rủi ro và giảm thiểu rủi ro, tính linh hoạt.
Khi xử lý dữ liệu lớn, còn có các mối quan tâm từ các đặc điểm dữ liệu
lớn như là dung lượng, tốc độ chuyển đổi và sự đa dạng.
CHÚ THÍCH 3: Ví dụ một mối quan tâm có thể liên quan đến khả năng mất dữ
liệu do vận tốc chuyển đổi của dữ liệu.
Ngoài ra, còn có một số mối quan tâm liên qua tới bản thân dữ liệu, bao
gồm: xuất xứ, lý lịch và sự bảo vệ. Các mối quan tâm liên quan tới tính bảo mật
và riêng tư đối với dữ liệu lớn là đủ lớn để cho TCVN 13239-4:2024 (ISO/IEC
20547-4:2020) tập trung trực tiếp vào các khía cạnh của nó. Một ví dụ là khả
năng kết hợp nhiều nguồn dữ liệu bằng cách sử dụng công nghệ dữ liệu lớn để loại
bỏ tính ẩn danh dữ liệu là một mối quan tâm quyền riêng tư cụ thể.
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
8.4. Các góc nhìn
Một kiến trúc hệ thống dữ liệu lớn có thể được định nghĩa dưới dạng các
góc nhìn.
Kiến trúc tham chiếu dữ liệu lớn định nghĩa hai góc nhìn chính:
- góc nhìn người dùng mô tả các vai trò, vai trò phụ, hoạt động và khía
cạnh xuyên suốt cần thiết để đáp ứng mối quan tâm của các bên liên
quan;
- góc chức năng mô tả các lớp chức năng, thành phần chức năng,
và chức năng đa lớp cần thiết để thực thi các hoạt động và khía cạnh xuyên suốt
được định nghĩa trong góc nhìn người dùng.

Hình 4 - Các mối quan hệ giữa các yếu tố
của góc nhìn BDRA
Hình 4 minh họa mối quan hệ của các bên liên quan, và mối quan tâm đến
các góc nhìn và yếu tố của chúng.
8.4.1. Góc nhìn người dùng
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
- các bên tham gia: bên tham gia là một hoặc một nhóm thể nhân hoặc
pháp nhân được hợp thành tổ chức hoặc không. Các bên tham gia trong hệ
sinh thái dữ liệu lớn là các bên liên quan của hệ sinh thái đó;
- các vai trò và vai trò phụ: vai trò là một tập các hoạt động dữ liệu
lớn phục vụ một mục đích chung. Vai trò phụ là tập con của các hoạt động dữ liệu
lớn để thực hiện một vai trò nhất định. Các vai trò phụ khác nhau có thể chia sẻ
các hoạt động dữ liệu lớn liên trong một vai trò nhất định;
- các hoạt động: hoạt động được định nghĩa là việc thực hiện một hoặc một
tập hợp các nhiệm vụ cụ thể. Các hoạt động dữ liệu lớn cần phải có mục đích và
mang lại một hoặc nhiều kết quả và những kết quả này được thực hiện bằng việc sử
dụng các thành phần chức năng;
- các khía cạnh xuyên suốt: các khía cạnh xuyên suốt là các hành vi hoặc
năng lực cần cần được phối hợp giữa các vai trò và thực hiện một cách nhất quán
trong một hệ sinh thái dữ liệu lớn. Các khía cạnh xuyên suốt có thể được chia sẻ
và ảnh hưởng tới nhiều vai trò, hoạt động dữ liệu lớn và thành phần chức năng.
Các khía cạnh xuyên suốt áp dụng cho nhiều vai trò hoặc thành phần chức năng
riêng lẻ.
CHÚ THÍCH 1: Một ví dụ về khía cạnh xuyên suốt là tính bảo mật.
CHÚ THÍCH 2: Một bên tham gia có thể đảm nhận nhiều hơn một vai trò tại
bát kỳ thời điểm nào và có thể tham gia vào một tập hợp
con các hoạt động cụ thể của vai trò đó. Ví dụ về các bên tham gia bao gồm
nhưng không giới hạn: tập đoàn lớn, doanh nghiệp vừa và nhỏ, cơ
quan chính phủ, viện nghiên cứu và công dân.
8.4.2.
Góc nhìn chức năng
Quan điểm chức năng góc nhìn mang tính công nghệ trung lập về các chức
năng cần thiết để tạo nên một hệ thống dữ liệu lớn. Góc nhìn chức năng mô tả sự
phân bố các chức năng cần thiết để hỗ trợ các hoạt động dữ liệu lớn.
Kiến trúc chức năng cũng xác định các phụ thuộc giữa các chức năng. Góc
nhìn chức năng đề cập đến các khái niệm dữ liệu lớn sau:
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
- các lớp chức năng: một lớp chức năng là một tập các thành phần chức
năng cung cấp các khả năng tương tự hoặc phục vụ một mục đích
chung. Kiến trúc chức năng được phân lớp một phần (nghĩa là có các lớp và một tập
hợp các chức năng đa lớp);
- các chức năng đa lớp: các chức năng đa lớp bao gồm các thành phần chức
năng cung cấp các khả năng được sử dụng trên nhiều lớp chức năng và được nhóm lại
thành các tập con.
CHÚ THÍCH: Không phải tất cả các lớp hoặc các thành phần chức năng đều
phải được khởi tạo trong một hệ thống dữ liệu lớn cụ thể.
9. Quy trình áp dụng kiến trúc tham chiếu dữ liệu lớn
9.1. Tổng quan
Phần này cung cấp các bước quy trình để áp dụng kiến trúc tham chiếu
vào việc phát triển một mô tả kiến trúc cho việc triển khai một hệ thống dữ liệu
lớn cụ thể. Mặc dù kiến trúc tham chiếu dữ liệu lớn là rất tổng quan và áp dụng
cho nhiều loại hệ thống khác nhau, và có rất nhiều hệ thống và thành phần dữ
liệu lớn tiềm năng bao gồm các hệ thống đó. Do đó, quy trình áp dụng được thiết
kế để hỗ trợ việc mở rộng kiến trúc tham chiếu dữ liệu lớn nhằm đáp ứng các yêu
cầu cụ thể của một hệ thống. Bản chất chính của các thành phần mở rộng này là
việc xác định các hoạt động bổ sung liên quan đến các vai trò và/hoặc sự phân
công các hoạt động tới các vai trò/vai trò phụ khác nhau. Trong suốt quá trình
này, người dùng tiêu chuẩn nên tận dụng các tiêu chuẩn ISO có liên quan khác
bao gồm ISO/IEC/IEEE 15288 cho các hệ thống kỹ thuật, ISO/IEC/IEEE 12207 cho kỹ
thuật vòng đời phần mềm, và quy trình đo lường chất lượng được xác định trong họ
các tiêu chuẩn ISO 9000, và các tiêu chuẩn liên quan để xác minh rõ việc bao
hàm và giải quyết đầy đủ các mối quan tâm của kiến trúc.
Người dùng tiêu chuẩn cần xác định rõ những công cụ sẽ được dùng để thu
thập và quản lý các dữ liệu trước khi thực hiện quy trình này.
9.2. Xác định các bên liên quan và các mối quan tâm
Bước đầu tiên trong quy trình là xác định các bên liên quan và các mối
quan tâm liên quan đến hệ thống dữ liệu lớn. Đây là phần đầu tiên trong quy
trình phân tích các yêu cầu bên lên quan được mô tả trong ISO/IEC/IEEE
15288. Kết quả đạt được bao gồm:
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
b) định nghĩa được các ràng buộc đối với hệ thống tuân thủ;
c) cần phải đạt được khả năng truy xuất nguồn gốc các yêu cầu bên liên
quan tới các bên liên quan;
d) mô tả được cơ sở để thiết lập các yêu cầu hệ thống;
e) định nghĩa được cơ sở để xác nhận tính phù hợp của
các dịch vụ hệ thống;
f) cung cấp được một cơ sở cho thủ tục đàm phán và đồng ý cung cấp dịch
vụ hệ thống hoặc sản phẩm.
Như đã được mô tả trong ISO/IEC/IEEE 15288, cần phải thể hiện
các mối quan tâm (các yêu cầu) của các bên liên quan dưới dạng
các nhu cầu, mong muốn, kỳ vọng và ràng buộc nhận thức của các bên liên quan đã
được xác định. Các mối quan tâm này được thể hiện dưới dạng các mô hình có tính
chất văn bản hoặc hình thức, tập trung vào mục định và hành vi hệ thống, và được
mô tả trong bối cảnh của môi trường và điều kiện vận hành.
Các mối quan tâm bên liên quan nên bao gồm cả các nhu cầu và yêu cầu do
xã hội đặt ra (ví dụ: kỳ vọng về quyền riêng tư) và xem xét các quy định của
chính phủ (ví dụ: GDPR của Liên minh châu Âu).
Các bên liên quan và mối quan tâm cần được gói gọn trong một mô hình mà
có thể sử dụng để cung cấp tính truy nguyên cho các hoạt động và thành phần hệ
thống nhằm hỗ trợ quy trình xác nhận.
Cụ thể là các bên liên quan và mối quan tâm cần được xác định duy
nhất để hỗ trợ tính truy nguyên ở các bước trong tương lai. Nếu
khả thi thì các mối quan tâm được chia sẻ bởi các bên liên quan cần
được thu gọn lại thành một mối quan tâm duy nhất và ánh xạ tới từng bên liên
quan.
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
Kết quả đầu ra của quy trình này cần được xem xét cùng với các bên liên
quan để xác nhận tính chính xác của nội dung được nắm bắt.
9.3. Ánh xạ các bên liên quan và mối quan tâm tới các vai trò và vai
trò phụ
Mục đích của bước này là sắp xếp các bên liên quan và mối quan tâm vào
trong cùng một khung tham chiếu chung cho hệ thống dữ liệu lớn. Bước này là đặc
biệt quan trọng đối với các hệ thống dữ liệu ở chỗ, trong nhiều trường hợp thì
các mối quan tâm cần được giải quyết thông qua một giải pháp hệ thống- của-hệ
thống (ví dụ: nhiều hệ thống phối hợp với nhau để đáp ứng một yêu cầu).
TCVN 13239-3:2023 (ISO/IEC 20547-3:2020) xác định các vai trò và vai
trò phụ sau:
- nhà cung cấp ứng dụng dữ liệu lớn (BDAP);
- nhà cung cấp dịch vụ thu thập dữ liệu lớn (BDCP);
- nhà cung cấp dịch vụ chuẩn bị dữ liệu lớn (BDPreP);
- nhà cung cấp dịch vụ phân tích dữ liệu lớn
(BDAnP);
- nhà cung cấp dịch vụ trực quan hóa dữ liệu lớn (BDVP);
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
- nhà cung cấp khung chức năng dữ liệu lớn (BDFP);
- nhà cung cấp cơ sở hạ tầng dữ liệu lớn (BDIP);
- nhà cung cấp nền tảng dữ liệu lớn (BDPIaP);
- nhà cung cấp dịch vụ xử lý dữ liệu lớn (BDProP);
- đối tác dịch vụ dữ liệu lớn (BDSP);
- nhà phát triển dịch vụ dữ liệu lớn (BDSD);
- nhà kiểm toán dữ liệu lớn (BDA);
- nhà điều hành hệ thống dữ liệu lớn (BDSO);
- người dùng dữ liệu lớn;
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
Ma trận tham chiếu chéo là một công cụ hữu dụng đối với quy trình này
trong việc thiết lập ánh xạ giữa các mối quan tâm và các vai trò/vai trò phụ mà
đòi hỏi các hoạt động để giải quyết các mối quan tâm đó. Ma trận này
có thể là một sơ đồ meatball đơn giản mà trong đó có một chỉ báo báo hiệu
khi một mối quan tâm được giải quyết bằng một vai trò, hoặc có thể bao gồm một
mệnh đề biện minh/ lý do cụ thể cho lí do tại sao mối quan tâm này cần được giải
quyết bởi một vai trò, và/hoặc bao gồm một mệnh đề định tính về việc khía cạnh
nào của mối quan tâm cần được giải quyết bởi vai trò tùy thuộc vào mức độ
nghiêm ngặt của kiến trúc được yêu cầu. Cần cẩn thận để không mô tả
các hoạt động trong ánh xạ này hoặc mô tả các giải pháp. Bước này chỉ đơn giản
là bước đầu phân bố các yêu cầu (các mối quan tâm) tới các nhóm quy trình cao cấp
(vai trò/vai trò phụ).
9.4. Xây dựng các mô tả hoạt động chi tiết và ánh xạ tới các mối quan
tâm
Bước này định nghĩa việc mà hệ thống hoặc kiến trúc sẽ thực hiện. Kiến
trúc tham chiếu dữ liệu lớn dưới dạng các vai trò và vai trò phụ cung cấp một
khung để nắm bắt và sắp xếp đầu ra của các hệ thống và quy trình phần mềm kỹ
thuật. Người dùng tiêu chuẩn cần tham chiếu tới ISO/IEC/ IEEE 29148 về các hệ
thống và các quy trình kỹ thuật yêu cầu vòng đời phần mềm khi thực hiện bước
này. ISO/IEC/ IEEE 29148 giúp người dùng tiêu chuẩn biến đổi các mối quan tâm
được ghi ở trên thành các yêu cầu cụ thể và có thể kiểm tra được.
Mặc dù không có tiêu chuẩn nào về cách một vai trò yêu cầu
các hoạt động đáp ứng một mối quan tâm ghi lại dưới dạng văn bản, một cách tiếp
cận là lưu lại chúng dưới dạng các mệnh để yêu cầu. Các mệnh đề này thường có dạng
chung là:
<Vai trò/vai
trò phụ> sẽ <Động từ> <Tân ngữ>
Với việc vai trò hoặc vai trò phụ cung cấp chủ ngữ, phần “sẽ” và động tự
cung cấp vị ngữ, và tân ngữ cung cấp phần tử để tác động lên. Kiến trúc tham
chiếu dữ liệu lớn trong TCVN 13239-3:2023 (ISO/IEC 20547-3:2020) mô tả chi tiết
về lớp của các hoạt động được thực hiện bởi hệ thống.
Thông thường đối tượng để cập tới các một số phần dữ liệu mà kiến trúc
cần tác động lên và động từ mô tả hành động đó sẽ được thực hiện. Các mệnh đề
này cũng có thể được coi như là các quy tắc nghiệp vụ mà hệ thống được kiến
trúc cần phải thực hiện. Một số ví dụ về các mệnh đề trong phần này là:
- BDCP sẽ xác nhận dữ liệu XXX tuân theo chuẩn YYY.
- BDVP sẽ hiển thị đầu ra dưới dạng đồ thị có hướng.
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
Nhìn chung những mệnh đề này cần phải đầy đủ và ngắn gọn. Cần cẩn thận ở
bước này để tránh việc khẳng định các một hoạt động sẽ được hoàn thành. Đối với
các hệ thống lớn, việc sắp xếp các hoạt động dựa trên các lớp của các hoạt động
được mô tả trong kiến trúc tham chiếu dữ liệu lớn là rất hữu ích. Đôi khi mức độ
chi tiết thêm này giúp ích trong việc xác định các thành phần chức năng cần để
thực thi các hoạt động.
Giống như với các mối quan tâm và các bên liên quan, cần có một cách
đánh số/danh pháp duy nhất dùng để xác định từng hoạt động. Danh pháp này là cần
thiết trong thực hiện các hoạt động ánh xạ. Một cách tiếp cận là đặt tiền tố
vai trò/vai trò phụ ở trước một số duy nhất cho mỗi hoạt động.
Kết quả của bước này sẽ là các yêu cầu cụ thể và có thể kiểm tra được,
được sắp xếp bởi các vai trò cho phép hệ thống kiến trúc đáp ứng được các mối
quan tâm của bên liên quan. Ở mức độ này, mỗi một mối quan tân cần
được giải quyết bởi một hoặc nhiều các hoạt động và mỗi hoạt động cần ánh xạ tới
một hoặc nhiều mối quan tâm.
Tùy thuộc vào mức độ chi tiết của các hoạt động được định nghĩa, nó có
thể không khả thi để trình bày/ghi lại dưới dạng văn bản các thông tin bằng đồ
thị chính trong góc nhìn. Người dùng tiêu chuẩn nên xem xét việc người đọc kiểm
tra thông tin và xem xét việc định dạng dữ liệu cho việc trình bày. Nếu lựa chọn
phương pháp tiếp cận mệnh đề các yêu cầu như được miêu tả ở trên thì cần phải
phân tách thêm các vai trò phụ vào các lớp hoạt động mà sẽ lần lượt được ánh xạ
tới các mệnh đề hoạt động riêng rẽ. Quá trình này rất hữu ích cho bước tiếp
theo vì nó cho phép việc lựa chọn các thành phần chức năng mà hỗ trợ nhiều hoạt
động trở nên dễ dàng hơn.
9.5. Định nghĩa các thành phần chức năng để thực thi các hoạt động
Nếu bước trước đó được ánh xạ tới phần phân tích các yêu cầu của vòng đời
hệ thống/phần mềm thì bước này sẽ đại diện cho giai đoạn thiết kế cao cấp đối với
hệ thống dữ liệu lớn. Lần nữa nhắc lại các tầng chức năng và các lớp thành phần
chức năng được cung cấp trong góc nhìn thành phần chức năng của kiến trúc tham chiếu dữ liệu lớn cung cấp một bộ
khung để sắp xếp các mục cấu hình (có thể là phần mềm hoặc phần cứng) tạo nên
kiến trúc hệ thống dữ liệu lớn.
Người dùng tiêu chuẩn khi tiếp cận bước này cần chọn các thành phần thực
tế sẽ thực hiện các hoạt động được định nghĩa ở bước trước đó. Các thành phần
này có thể là các công cụ, sản phần hoặc thành phần phần mềm hiện có hoặc là
các thành phần mới cần được phát triển dựa trên các hoạt động cần phải thực hiện.
Mức độ chi tiết muốn đạt được tùy thuộc vào người dùng tiêu chuẩn và dựa trên
các nhu cầu của hệ thống. Đối với các hệ thống rất lớn, việc hoạch định một
cách có phân cấp các thành phần này bằng việc sắp xếp chúng vào các hệ thống
con nằm trong cùng lớp là rất cần thiết.
Trong mọi trường hợp, các thành phần này cần được ánh xạ tới một hoặc
nhiều hoạt động. Chú ý rằng là không có yêu cầu nào cho việc một hoạt động ánh
xạ tới một thành phần. Tùy thuộc vào mức độ chi tiết của các hoạt động được lưu
tài liệu lại thì có khả năng là một số các hoạt động có thể cần nhiều thành phần.
Để tạo điều kiện thuật lợi cho việc theo dõi và quá trình crosswalk bên
dưới thì nên sử dụng một danh pháp tiêu chuẩn cho các thành phần.
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
Dựa trên mức độ chi tiết, việc trình bày thông tin dưới dạng một đồ thị
duy nhất là không khả thi. Trong khi, các đồ thị riêng lẻ có thể được phát triển
cho từng chức năng từng lớp/đa lớp, một số ngữ cảnh có thể bị mất liên quan đến
sự tương tác giữa các lớp.
9.6. Các hoạt động ngang qua/các thành phần chức năng trở lại các mối
quan tâm
Đây là bước cuối cùng của quy trình và liên quan tới việc xác nhận mọi
mối quan tâm đề có thể truy được từ một thành phần chức năng thông qua một hoạt
động, mọi thành phần chức năng có thể truy ngược lại về một mối quan tâm thông
qua một hoạt động, và mọi hoạt động đều liên quan tới các mối liên kết này.
Việc lựa chọn cơ sở dữ liệu hoặc công cụ truy xuất nguồn gốc các yêu cầu
để nắm bắt được toàn bộ thông tin này tại bước này là cần thiết trong việc xác
nhận kiến trúc cấp cao một cách hiệu quả.
Thư mục tài liệu tham khảo
[1] ISO 9000- 2015, Quality
management systems - Fundamentals and vocabulary.
[2]
ISO 9001-2015. Quality management systems - Requirements.
[3]
ISO/TS 9002 2016, Quality management systems - Guidelines for the application
of ISO 9001:2015.
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
[5]
ISO/TR 14639-2:2014, Health informatics - Capacity-based eHealth architecture
roadmap - Part 2: Architcctural components and maturity model.
[6]
ISO/IEC/IEEE 15288-2015, Systems and software engineering - System life cycle
processes.
[7]
TCVN 13238:2020 (ISO/IEC 20546:2019), Công nghệ thông tin - Dữ liệu lớn - Tổng quan và từ vựng.
[8] TCVN 13239-2:2020 (ISO/IEC TR 20547-2:2018), Công nghệ thông tin -
Kiến trúc tham chiếu dữ liệu lớn - Phần 2: Các trường hợp sử dụng và yêu cầu dẫn
xuất.
[9] TCVN 13239-3:2023 (ISO/IEC 20547-3:2020), Công nghệ thông tin - Kiến
trúc tham chiếu dữ liệu lớn - Phần 3: Kiến trúc tham chiếu.
[10] TCVN 13239-4:2024 (ISO/IEC 20547-4:2020), Công nghệ thông tin - Kiến
trúc tham chiếu dữ liệu lớn - Phần 4: Bảo mật và quyền riêng tư.
[11] TCVN 13239-5:2020 (ISO/IEC TR 20547-5:2018), Công nghệ thông tin -
Kiến trúc tham chiếu dữ liệu lớn - Phần 5: Lộ trình tiêu chuẩn.
[12] ISO/IEC /IEEE 29148-2018, Systems and software engineering -
Life cycle processes Requirements
engineering.
[13]
ISO/IEC JTC 1, (2015). Big Data, Preliminary Report 2014.
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
[15]
IDC. (2019). Worldwide Semiannual Big Data and Analytics Spending Guide. IDC.
MỤC LỤC
1. Phạm vi áp dụng
2. Tài liệu viện dẫn
3. Thuật ngữ và định nghĩa
4. Chữ viết tắt
5. Tổng quan về tiêu chuẩn
6. Chuẩn hóa dữ liệu lớn: động lực và mục tiêu
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
7.1. Yêu cầu chung
7.2. Các khái niệm kiến trúc tham chiếu
7.3. Cấu trúc kiến trúc tham chiếu
8. Các yếu tố của kiến trúc tham chiếu dữ liệu lớn
8.1. Tổng quan
8.2. Các bên liên quan
8.3. Các mối quan tâm
8.4. Các quan điểm
8.4.1. Quan điểm người dùng
...
...
...
Bạn phải
đăng nhập hoặc
đăng ký Thành Viên
TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.
Mọi chi tiết xin liên hệ:
ĐT: (028) 3930 3279 DĐ: 0906 22 99 66
9. Quá trình áp dụng kiến trúc tham chiếu dữ liệu lớn
9.1. Tổng quan
9.2. Xác định các bên liên quan và các mối quan tâm
9.3. Ánh xạ các bên liên quan và các mối quan tâm tới các vai trò và
các vai trò phụ
9.4. Xây dựng các mô tả hoạt động chi tiếp và ánh xạ tới các mối quan
tâm
9.5. Xác định các thành phần chức năng để thực hiện các hoạt động
9.6. Các hoạt động ngang qua/các thành phần chức năng trở lại các mối
quan tâm
Thư mục tài liệu tham khảo