Từ khoá: Số Hiệu, Tiêu đề hoặc Nội dung ngắn gọn của Văn Bản...

Đăng nhập

Đang tải văn bản...

Tiêu chuẩn TCVN 13239-1:2024 về Khung và quy trình ứng dụng kiến trúc tham chiếu dữ liệu lớn

Số hiệu: TCVN13239-1:2024 Loại văn bản: Tiêu chuẩn Việt Nam
Nơi ban hành: *** Người ký: ***
Ngày ban hành: Năm 2024 Ngày hiệu lực:
ICS:35.020 Tình trạng: Đã biết

TIÊU CHUẨN QUỐC GIA

TCVN 13239-1:2024

ISO/IEC TR 20547-1:2020

CÔNG NGHỆ THÔNG TIN - KIẾN TRÚC THAM CHIẾU DỮ LIỆU LỚN - PHẦN 1: KHUNG VÀ QUY TRÌNH ỨNG DỤNG

Information technology - Big data reference architecture - Part 1: Framework and application process

Lời nói đầu

TCVN 13239-1:2024 hoàn toàn tương đương ISO/IEC TR 20547-1:2020.

TCVN 13239-1:2024 do Học viện Công nghệ Bưu chính Viễn thông biên soạn, Bộ Thông tin và Truyền thông đề nghị, Ủy ban Tiêu chuẩn Đo lường Quốc gia thẩm định, Bộ Khoa học và Công nghệ công bố.

TCVN 13239 (ISO/IEC 20547) về Công nghệ thông tin - Kiến trúc tham chiếu dữ liệu lớn gồm:

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

- TCVN 13239-2:2020 (ISO/IEC 20547-2:2018), Phần 2: Các trường hợp sử dụng và yêu cầu dẫn suất;

- TCVN 13239-3:2023 (ISO/IEC 20547-3:2020), Phần 3: Kiến trúc tham chiếu;

- TCVN 13239-4:2024 (ISO/IEC 20547-4:2020), Phần 4: Bảo mật và quyền riêng tư;

- TCVN 13239-5:2020 (ISO/IEC 20547-5:2018), Phần 5: Lộ trình tiêu chuẩn.

 

CÔNG NGHỆ THÔNG TIN - KIẾN TRÚC THAM CHIẾU DỮ LIỆU LỚN - PHẦN 1: KHUNG VÀ QUY TRÌNH ỨNG DỤNG

Information technology - Big data reference architecture - Part 1: Framework and application process

1. Phạm vi áp dụng

Tiêu chuẩn này đưa ra các yêu cầu cho khung kiến trúc dữ liệu lớn và quy trình giúp người dùng tiêu chuẩn có thể áp dụng vào một miền vấn đề cụ thể.

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

Tài liệu viện dẫn sau đây là cần thiết đ áp dụng tiêu chuẩn này. Đối với tài liệu viện dẫn ghi năm công bố thì áp dụng phiên bản được nêu. Đối với tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất (bao gồm cả các sửa đổi, bổ sung).

ISO/IEC/IEEE 42010, Systems and software engineering - Architecture description.

3. Thuật ngữ và định nghĩa

Tiêu chuẩn này sử dụng các thuật ngữ và định nghĩa nêu trong ISO/IEC/IEEE 42010 và các thuật ngữ định nghĩa sau:

3.1.

Dữ liệu lớn (big data)

Các tập dữ liệu mở rộng - chủ yếu theo các đặc tính dữ liệu về dung lượng, tính đa dạng, tốc độ chuyển đổi và/hoặc tính biến đổi - đòi hỏi một công nghệ có thể mở rộng để lưu trữ, thao tác, và phân tích hiệu quả.

CHÚ THÍCH: Dữ liệu lớn thường được dùng theo nhiều cách, ví dụ: tên của công nghệ được sử dụng để xử lý các bộ dữ liệu mở rộng.

[Nguồn: TCVN 13238:2020 (ISO/IEC 20546:2019), 3.1.2]

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

Kiến trúc tham chiếu (reference architecture)

Trong lĩnh vực kiến trúc phần mềm hoặc kiến trúc doanh nghiệp, kiến trúc tham chiếu cung cấp một giải pháp khuôn mẫu đã được kiểm chứng cho một kiến trúc trong một miền vấn đề cụ thể, cũng như một bảng từ vựng chung dùng để thảo luận việc thi hành, thường với mục đích nhấn mạnh tính phổ biến.

[Nguồn: ISO/TR 14639-2:2014, 2.65]

3.3.

Khung (framework)

Tập hợp cụ thể các niềm tin và ý tưng được để cập để mô tả một kịch bản hoặc giải quyết một vấn đề.

[Nguồn: ISO 15638-6:2014, 4.30]

3.4.

Bảo mật (security)

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

[Nguồn: ISO/IEC/IEEE 15288:2015, 4.1, 31]

3.5.

Quyền riêng tư (privacy)

Quyền của các cá nhân trong kiểm soát hoặc tác động đến những thông tin liên quan đến mình. Thông tin này có thể bị thu thập, lưu trữ hoặc tiết lộ bởi người khác.

[Nguồn: ISO/IEC TR 26927:2011, 3.34]

3.6.

Nguồn gốc (provenance)

Thông tin về thời gian, địa điểm, xuất xứ, quá trình hình thành các tài nguyên, hồ sơ, bằng chứng xác thực hoặc quyền sở hữu trong quá khứ.

[Nguồn: ISO/IEC 11179-7:2019, 3.1.10]

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

SQL (Structured Query Language)

Ngôn ngữ cơ sở dữ liệu được quy định trong ISO/IEC 9075.

CHÚ THÍCH 1: SQL là từ viết tắt của Structured Query Language nhưng trong bộ tiêu chuẩn ISO/IEC 9075 không sử dụng từ viết tắt này.

[Nguồn: TCVN 13238:2020 (ISO/IEC 20546:2019), 3.1.36]

3.8.

Vòng đời (lifecycle)

Quá trình phát triển của hệ thống, sản phẩm, dịch vụ, dự án hoặc thực thể nhân tạo nào đó từ lúc hình thành khái niệm đến lúc ngừng sử dụng.

[Nguồn: ISO/IEC/IEEE 15288:2015, 4.1.23]

4. Chữ viết tắt

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

BDA

big data auditor

Nhà kiểm toán dữ liệu lớn

BDAcP

big data access provider

Nhà cung cấp dịch vụ truy cập dữ liệu lớn

BDAnP

big data analytics provider

Nhà cung cấp dịch vụ phân tích dữ liệu lớn

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

big data application provider

Nhà cung cấp ứng dụng dữ liệu lớn

BDCP

big data collection provider

Nhà cung cấp dịch vụ thu thập dữ liệu lớn

BDFP

big data framework provider

Nhà cung cấp khung chức năng dữ liệu lớn

BDIP

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

Nhà cung cấp cơ sở hạ tầng dữ liệu lớn

BDPIaP

big data platform provider

Nhà cung cấp nền tảng dữ liệu lớn

BDPreP

big data preparation provider

Nhà cung cấp dịch vụ chuẩn bị dữ liệu lớn

BDProP

big data processing provider

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

BDSD

big data service developer

Nhà phát triển dịch vụ dữ liệu lớn

BDSO

big data system orchestrator

Người điều hành hệ thống dữ liệu lớn

BDSP

big data service partner

Đối tác dịch vụ dữ liệu lớn

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

big data reference architecture

Kiến trúc tham chiếu dữ liệu lớn

BDVP

big data visualization provider

Nhà cung cấp dịch vụ trực quan hóa dữ liệu lớn

GDPR

general data protection regulation

Quy định chung về bảo vệ dữ liệu

JSON

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

Định dạng JSON

RDF

resource description framework

Khung mô tả tài nguyên

SQuaRE

systems and software quality requirements and evaluation

Yêu cầu và đánh giá chất lượng hệ thống và phần mềm

XML

extensible markup language

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

5. Tổng quan về tiêu chuẩn

Tiêu chuẩn này đưa ra các khái niệm nhất định về kiến trúc tham chiếu dữ liệu lớn nhằm mục đích áp dụng bộ tiêu chuẩn TCVN 13239 (ISO/IEC 20547) cho tập hệ thống hoặc tập vấn đề cụ thể.

Từ điều 6 đến điều 9:

- Đưa ra động lực và các mục tiêu cho các tiêu chuẩn về dữ liệu lớn;

- Cung cấp lời giới thiệu và mục đích cho các kiến trúc tham chiếu;

- Cung cấp tổng quan về BDRA và giải thích các khái niệm chính;

- Cung cấp quy trình áp dụng BDRA vào các miền vấn đề.

Tiêu chuẩn này có thể được hiểu theo nhiều cách khác trong việc đọc và áp dụng bộ tiêu chuẩn TCVN 13239 (ISO/IEC 20547):

a) Nếu người dùng chỉ đọc tiêu chuẩn này nằm mục đích có được một lượng kiến thức chung về BDRA và khả năng áp dụng vào miền bài toán của mình, người dùng chỉ cần tập trung vào điều 5, 6 và 7.

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

6. Chuẩn hóa dữ liệu lớn: động lực và các mục tiêu

Trong một báo cáo năm 2019, IDC dự báo doanh thu toàn thế giới của ngành dữ liệu lớn và phân tích dữ liệu là 189,1 tỉ USD, tăng 12 % so với năm 2018, và dự đoán tỷ lệ tăng trưng kép hàng năm trong 5 năm là 13,2 % với doanh thu năm 2022 vượt quá 274,3 tỉ USD.

Ngoài ra, các bên mua và bên thực thi các hệ thống dữ liệu lớn phải đối phó sự bùng nổ các công nghệ và các tùy chọn - một lượng lớn trong số đó được các nhà cung cấp gói gọn trong các từ ngữ thông dụng bao gồm cả các thuật ngữ dữ liệu lớn không xác định. Đ các bên liên quan đến các hệ thống dữ liệu lớn hiểu được những gì họ đang mua và thực thi thì cần có một khung rõ ràng cho việc giao tiếp với các nhà cung cấp dịch vụ và công nghệ tiềm năng nhằm hỗ trợ cho việc giao tiếp trở nên mạnh mẽ và chính xác.

CHÚ THÍCH 1: "Hệ thống dữ liệu lớn" là một hệ thống tận dụng kỹ thuật dữ liệu lớn và sử dụng một mô hình dữ liệu lớn để xử lý dữ liệu lớn.

CHÚ THÍCH 2: “Kỹ thuật dữ liệu lớn” là các kỹ thuật tiên tiến khai thác các tài nguyên độc lập để xây dựng các hệ thống dữ liệu có thể mở rộng khi mà các đặc tính của các tập dữ liệu cần một kiến trúc mới để có thể lưu trữ, thao tác và phân tích một cách hiệu quả.

CHÚ THÍCH 3: “Mô hình dữ liệu lớn” là sự phân phối các hệ thống dữ liệu xuyên suốt các tài nguyên độc lập, được kết hợp theo chiều ngang để đạt được khả năng mở rộng cần thiết cho việc xử lý các tập dữ liệu mở rộng một cách hiệu quả.

Giá trị tiềm năng của việc phân tích dữ liệu lớn là yếu tố thu hút các tổ chức với việc thực thi các hệ thống dữ liệu lớn, tuy nhiên, họ cần phải hiểu được các vấn đề và trách nhiệm pháp lý tiềm ẩn liên quan đến việc quản lý và kiểm soát dữ liệu này. IDC ước tính rằng các doanh nghiệp có trách nhiệm và chịu trách nhiệm pháp lý với gần 80 % lượng thông tin trong toàn cầu số và chuẩn bị ứng phó các vấn đề về tuân thủ nguyên tắc, bản quyền và riêng tư. IDC dự đoán thêm rằng, tới năm 2020, hơn 40 % lượng thông tin trong toàn cầu số cần đến sự bảo vệ rõ ràng và lượng dữ liệu này đang tăng nhanh hơn so với tổng toàn cầu số. Những rủi ro này nghĩa là các tổ chức cần phải có khả năng xác định, định nghĩa và nêu rõ các chính sách cho bảo mật dữ liệu, nguồn gốc và quản trị cũng như là thực thi và cung cấp tư liệu các kỹ thuật kiểm soát để triển khai các chính sách nhằm bảo vệ toàn bộ tổ chức khỏi trách nhiệm pháp lý đối với sự dàn xếp hoặc sử dụng sai dữ liệu do họ kiểm soát.

Cuối cùng, rất ít các tổ chức xử lý dữ liệu lớn chỉ hoạt động dựa trên dữ liệu nội bộ của họ, nghĩa là các hệ thống thu thập và phân tích dữ liệu lớn phải có khả năng tương tác và chia s dữ liệu một cách an toàn và tin cậy. Trong thực tế, dung lượng không giới hạn liên kết với dữ liệu lớn thường làm cho việc truyền dữ liệu giữa các hệ thống là không khả thi, trong nhiều trường hợp, các phân tích dựa trên việc truyền dữ liệu này không chỉ đòi hỏi kh năng tương tác ở mức dữ liệu mà còn đòi hỏi ở mức phần mềm và mức ứng dụng giữa các hệ thống.

Trong bối cảnh dữ liệu lớn hiện nay, các yêu cầu thị trường cho chuẩn hóa dữ liệu lớn được kiểm chứng và các ưu tiên chuẩn hóa được xác định như sau:

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

b) các thông số kỹ thuật và chuẩn hóa siêu dữ liệu bao gồm nguồn gốc dữ liệu;

c) các mô hình ứng dụng (ví dụ: khối, luồng, v.v.);

d) các ngôn ngữ truy vấn bao gồm các truy vấn không ràng buộc hỗ trợ các kiểu dữ liệu đa dạng (XML, RDF, JSON, đa phương tiện, v.v.) và các hoạt động dữ liệu lớn (ví dụ: các hoạt động ma trận);

e) ngôn ngữ cho một miền cụ thể;

f) ngữ nghĩa chính thức cuối cùng;

g) các giao thức mạng tiên tiến cho việc truyền dữ liệu hiệu quả;

h) các bản thể học chung, các bản thể học cho miền cụ thể và các nguyên tắc phân loại cho việc mô tả ngữ nghĩa dữ liệu bao gồm cả sử tương tác giữa các bản thể học;

i) các kiểm soát truy cập bảo mật và quyền riêng tư dữ liệu lớn;

j) phân tích từ xa, phân tán và liên kết (đưa các phân tích vào dữ liệu) bao gồm dữ liệu và xử lý tài nguyên khám phá và khai thác dữ liệu;

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

l) lưu trữ dữ liệu (ví dụ: hệ thống lưu trữ bộ nhớ, hệ thống tệp phân tán, kho dữ liệu, v.v.);

m) việc sử dụng của con người cho các kết quả của việc phân tích dữ liệu (ví dụ: sự trực quan hóa);

n) đo năng lượng cho dữ liệu lớn;

o) giao diện giữa các kho dữ liệu quan hệ (SQL) và phi quan hệ (NoSQL);

p) chất lượng, sự mô tả chân thực và quản lý dữ liệu lớn.

Bộ tiêu chuẩn TCVN 13238:2020 (ISO/IEC 20546:2019) và TCVN 13239 (ISO/IEC 20547) được phát triển với mục đích giải quyết các vấn đề này.

Tiêu chuẩn này đề cập cụ thể khung và quy trình ứng dụng, các trường hợp sử dụng và yêu cầu dữ liệu lớn [điểm a) ở trên], các kiến trúc tham chiếu [điểm a) ở trên], bảo mật và quyền riêng tư [điểm i) ở trên] và lộ trình tiêu chuẩn hoá. Ngoài ra, các t chức có các yêu cầu phân tích dữ liệu không thể đợi các tiêu chuẩn dữ liệu lớn cụ thể trước khi họ có thể thực thi các hệ thống của mình. Bởi vì dữ liệu lớn về bản chất là một tập con của tất cả dữ liệu, và hầu hết các tiêu chuẩn công nghệ thông tin đều xử lý dữ liệu ở một khía cạnh nào đó, đang có một số lượng lớn các tiêu chuẩn đang được áp dụng hoặc đang trong quá trình phát triển nhằm giải quyết một số vấn đề của dữ liệu lớn. Để giải quyết nhu cầu này, TCVN 13239-5:2020 (ISO/IEC TR 20547-5:2018) là một lộ trình các tiêu chuẩn nhằm hiệu chỉnh các tiêu chuẩn hiện có tới các vai trò nằm trong kiến trúc tham chiếu để cung cấp cho các bên liên quan tới hệ thống dữ liệu lớn các hướng dẫn về cách áp dụng các tiêu chuẩn này như thế nào vào các vấn đề ngày nay. Điều 7 sẽ miêu tả từng phần trong bộ tiêu chuẩn này.

7. Các cơ sở khái niệm

7.1. Yêu cầu chung

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

- xử lý các tập dữ liệu mở - chủ yếu trong các đặc điểm về dung lượng, tính đang dạng, tốc độ chuyển đổi, và/hoặc tính biến đổi - đòi hỏi một kiến trúc có thể mở rộng để lưu trữ, thao tác và phân tích hiệu quả;

- thúc đẩy các kỹ thuật tiên tiến nhằm khai thác các tài nguyên độc lập để xây dựng các hệ thống dữ liệu có khả năng mở rộng khi các đặc điểm của các tập dữ liệu cần các kiến trúc mới để lưu trữ, thao tác và phân tích hiệu quả;

- sử dụng một mô hình trong đó phân bố các hệ thống dữ liệu kết hợp theo trục ngang và các tài nguyên độc lập để đạt được tính mở rộng cần có trong việc xử lý hiệu quả các tập dữ liệu mở rộng.

Bản chất phổ rộng và không bị giới hạn của các hệ thống dữ liệu lớn đòi hỏi kiến trúc tham chiếu trong bộ tiêu chuẩn TCVN 13239 (ISO/IEC 20547) phải đầy đủ đề đại diện cho nhiều trường hợp sử dụng tiềm năng được thực hiện bởi các hệ thống dữ liệu lớn.

7.2. Các khái niệm kiến trúc tham chiếu

Để có thể hiểu được kiến trúc tham chiếu bao gồm những gì, trước tiên cần phải xác định rằng kiến trúc tham chiếu nghĩa là gì. Vì nó là một kiến trúc, kiến trúc tham chiếu nhất thiết phải sở hữu các đặc điểm của một kiến trúc được định nghĩa trong ISO/IEC/IEEE 42010. Kiến trúc tham chiếu dữ liệu lớn cũng cần được khái quát hóa đủ để có thể bao gồm nhiu loại kiến trúc hệ thống dữ liệu lớn tiềm năng.

Nhìn theo quan điểm hướng đối tượng, kiến trúc tham chiếu sẽ được coi như là một lớp trừu tượng mà từ đó các trường hợp cụ thể của các kiến trúc rút ra được các cấu trúc và thuộc tính của chúng.

ISO/TR 14639-2 định nghĩa một kiến trúc tham chiếu trong lĩnh vực kiến trúc phần mềm hoặc kiến trúc doanh nghiệp, cung cấp một giải pháp mẫu đã được chứng minh cho một kiến trúc đối với một miền cụ thể, cũng như là các từ vựng chung dùng trong thảo luận việc thực thi, thường với múc định nhấn mạnh tính chung.

Dựa trên lý luận này, một kiến trúc tham chiếu là một khung kiến trúc như được định nghĩa bởi ISO/IEC/IEEE 42010, bao gồm cấu trúc, các quy tắc và ràng buộc chung cho tất cả hệ thống dữ liệu lớn. Do đó, kiến trúc tham chiếu dữ liệu lớn cung cấp một loạt các quy ước, nguyên tắc và thực tiễn để mô tả các kiến trúc hệ thống dữ liệu lớn.

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

Hình 1 - Khái niệm các kiến trúc tham chiếu

7.3. Cấu trúc kiến trúc tham chiếu

Hình 2 kết hợp các khái niệm và cấu trúc từ ISO/IEC/IEEE 42010 để mô tả phác thảo cho kiến trúc tham chiếu. Một kiến trúc tham chiếu được xác định cho một lĩnh vực. Đối với kiến trúc tham chiếu này, lĩnh vực là dữ liệu lớn.

Lĩnh vực xác định môi trường, đối với trường hợp dữ liệu lớn thì môi trường được xác nhận chủ yếu bi các đặc tính cốt yếu của dữ liệu lớn - dung lượng, tốc độ chuyển đổi, tính đa dạng, tính biến đổi (xem TCVN 13238:2020 (ISO/IEC 20546:2019)).

Các bên liên quan trong môi trường này bao gồm tất cả các bên liên quan thường gặp (người dùng, chủ sở hữu, kiến trúc sư, v.v) đối với bất ký hệ thống nào, cùng với đó là bất kỳ ai có mối quan tâm liên quan đến dữ liệu và các đặc điểm của nó.

Môi trường hạn chế các mối quan tâm. Vì môi trường được định nghĩa bởi các đặc tính của dữ liệu lớn, các mối quan tâm bị ràng buộc bởi các đặc tính đó và mỗi một mối quan tâm phải liên quan đến một hoặc nhiều đặc điểm cùng với (các) bên liên quan có mối quan tâm đó.

Kiến trúc tham chiếu được mô tả sử dụng một khung kiến trúc. Khung này được mô tả trong TCVN 13239-3:2023 (ISO/IEC 20547-3:2020) và được trình bày theo hai góc nhìn:

- các vai trò và hoạt động - góc nhìn người dùng;

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

Mỗi một quan điểm này lần lượt giải quyết một hoặc nhiều mối quan tâm.

Các mối quan tâm đó có thể được giải quyết bằng một hoặc nhiều vai trò, hoạt động và thành phần chức năng nằm trong các góc nhìn kiến trúc đó.

Ví dụ trong một hệ thống theo dõi tín dụng, tất cả mọi người có hồ sơ trong hệ thống đó đều là một bên liên quan. Tất cả đều có mối quan tâm rằng quyền riêng tư của họ cần được duy trì, và sự bảo mật đối với các thông tin cá nhân cần được bảo vệ.

Nằm trong cả hai góc nhìn người dùng và góc nhìn chức năng của kiến trúc tham chiếu dữ liệu lớn là một khía cạnh xuyên suốt về tính bảo mật và quyền riêng tư. Khía cạnh xuyên suốt này có mối quan hệ với hoạt động thực hiện thanh tra” và thành phần chức năng “khuôn khổ thanh tra” mà giải quyết mối quan tâm đó.

Hình 2 - Phác thảo cơ bản kiến trúc tham chiếu dựa trên ISO/IEC/IEEE 42010

8. Các yếu tố của kiến trúc tham chiếu dữ liệu lớn

8.1. Tổng quan

Trong môi trường hệ thống dữ liệu lớn, tiêu chuẩn này cung cấp cấu trúc BDRA thông qua phạm vi áp dụng của từng phần trong bộ tiêu chuẩn TCVN 13239 (ISO/IEC 20547), mối quan hệ lô-gíc giữa các phần và quy trình ứng dụng BDRA. Phạm vi áp dụng của mỗi phần trong bộ tiêu chuẩn TCVN 13239 (ISO/IEC 20547) cụ thể như sau:

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

- TCVN 13239-2:2020 (ISO/IEC TR 20547-2:2018): Các trường hợp sử dụng và các yêu cầu dẫn xuất cung cấp các ví dụ về các trường hợp sử dụng dữ liệu lớn với các miền ứng dụng và các xem xét kỹ thuật được rút ra từ các trường hợp sử dụng.

- TCVN 13239-3:2023 (ISO/IEC 20547-3:2020): Kiến trúc tham chiếu nêu rõ kiến trúc tham chiếu dữ liệu lớn. Kiến trúc tham chiếu bao gồm các khái niệm và các góc nhìn kiến trúc (góc nhìn người dùng và góc nhìn chức năng).

- TCVN 13239-4:2024 (ISO/IEC 20547-4:2020): Tính bảo mật và quyền riêng tư nêu rõ khía cạnh bảo mật và riêng tư áp dụng cho BDRA bao gồm các vai trò, hoạt động và các thành phần chức năng dữ liệu lớn; đồng thời cung cấp hướng dẫn về các hoạt động bảo mật và quyền riêng tư đối với dữ liệu lớn.

- TCVN 13239-5:2020 (ISO/IEC TR 20547-5:2018): Lộ trình các tiêu chuẩn mô tả các tiêu chuẩn liên quan đến dữ liệu lớn, cả đang tồn tại và đang xây dựng, cùng với các ưu tiên xây dựng tiêu chuẩn dữ liệu lớn trong tương lai dựa trên phân tích sự thiếu hụt tiêu chuẩn.

Hình 3 thể hiện các mối quan hệ và chu kỳ lặp lại của từng phần trong bộ tiêu chuẩn TCVN 13239 (ISO/IEC 20547). Dựa trên các đóng góp từ các doanh nghiệp, các tổ chức và chuyên gia trong lĩnh vực nghiên cứu và học viện liên quan, TCVN 13239-2:2020 (ISO/IEC TR 20547-2:2018) thu thập các trường hợp sử dụng và rút ra các cân nhắc kỹ thuật. TCVN 13239-3:2023 (ISO/IEC 20547-3:2020) xác định kiến trúc tham chiếu cho dữ liệu lớn bằng cách phản ánh các cân nhắc kỹ thuật này. Cụ thể, TCVN 13239-4:2024 (ISO/IEC 20547-4:2020) quy định khía cạnh bảo mật và riêng tư để hỗ trợ dữ liệu lớn. TCVN 13239-5:2020 (ISO/IEC TR 20547-5:2018) cung cấp các danh sách các tiêu chuẩn có thể áp dụng theo quan điểm kiến trúc tham chiếu. Bộ tiêu chuẩn TCVN 13239 (ISO/IEC 20547) thể hiện góc nhìn theo thời gian về các hệ thống và kiến trúc dữ liệu lớn. Khi các thực thi dữ liệu lớn được tạo ra và phát triển dựa trên TCVN 13239-1:2024, TCVN 13239-2:2020 (ISO/IEC TR 20547-2:2018), TCVN 13239-3:2023 (ISO/IEC 20547-3:2020) và TCVN 13239-4:2024 (ISO/IEC 20547-4:2020), chúng sẽ tham chiếu và sử dụng các tiêu chuẩn được ghi trong TCVN 13239-5:2020 (ISO/IEC TR 20547-5:2018). Các hệ thống mới có này thể được ghi lại trong TCVN 13239-2:2020 (ISO/IEC TR 20547-2:2018) như là các trường hợp sử dụng mới và sẽ từ đó dẫn tới các cân nhắc kỹ thuật mới. Các cân nhắc kỹ thuật được gii thiệu bởi các trường hợp sử dụng này có thể dẫn tới các hoạt động tiêu chuẩn hóa mới, từ đó dẫn đến các tiêu chuẩn mới được ghi lại trong TCVN 13239-5:2020 (ISO/IEC TR 20547-5:2018).

Hình 3 - Các mối quan hệ giữa các phần của bộ tiêu chuẩn TCVN 13239 (ISO/IEC 20547)

Khi áp dụng khung tham chiếu trong một trường hợp sử dụng cụ thể, người dùng cần phải hiểu rõ môi trường tổng thể triển khai hệ thống dữ liệu lớn, bên liên quan đến hệ thống này và các mối quan tâm của bên liên quan. Từ 8.2 đến 8.4 mô tả từng thành phần chính của khung tham chiếu, bao gồm: các bên liên quan, các mối quan tâm và các góc nhìn.

8.2. Các bên liên quan

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

Đối với trường hợp hệ thống dữ liệu lớn, bên liên quan bao gồm bất kỳ bên nào có mối quan tâm đến dữ liệu đang được hệ thống xử lý, bao gồm: chủ sở hữu dữ liệu (bên cung cấp dữ liệu cho hệ thống dữ liệu lớn), người dùng dữ liệu (bên đưa ra các quyết định dựa trên dữ liệu từ hệ thống dữ liệu lớn) và đối tượng được dữ liệu mô tả.

Bước đầu tiên trong việc phát triển một kiến trúc dữ liệu lớn là xác định bên liên quan và các mối quan tâm. Trong TCVN 13239-3:2023 (ISO/IEC 20547-3:2020), bên liên quan là các bên tham gia trong góc nhìn người dùng.

8.3. Các mối quan tâm

Bất kỳ sự chú ý nào đối với một hệ thống liên quan đến một hoặc nhiều bên liên quan của hệ thống đó là một mối quan tâm. Trong ISO/IEC/IEEE 42010, mối quan tâm gắn liền với bất kỳ khía cạnh nào của hệ thống dữ liệu lớn bao gồm các ảnh hưởng kỹ thuật, kinh doanh, vận hành, pháp lý và thậm chí cả xã hội lên một hệ thống trong môi trường của hệ thống đó. Định nghĩa và giới hạn cho môi trường của một hệ thống do bên liên quan và mối quan tâm đối với hệ thống đó quy định. Một số mối quan tâm có thể được hệ thống hóa theo các tiêu chuẩn quốc tế khác.

CHÚ THÍCH 1: dụ trong tính trong suốt được mô tả trong Mô hình tham chiếu xử lý phân tán m (ISO/IEC 10746-1) là các mối quan tâm liên quan đến việc vận hành của một hệ thống dữ liệu lớn vì quy mô phương ngang và xử lý phân tán là khía cạnh ct lỗi của hệ thống dữ liệu lớn.

CHÚ THÍCH 2: Các thuộc tính phần mềm được mô tả trong SQuaRE (ISO/IEC 25010:2011, 4.2) nêu lên các mối quan tâm về chất lượng phần mềm trong một hệ thống dữ liệu lớn, bao gồm: tính hữu hiệu, tính hiệu quả, độ tin cậy, độ ri ro và giảm thiểu rủi ro, tính linh hoạt.

Khi xử lý dữ liệu lớn, còn có các mối quan tâm từ các đặc điểm dữ liệu lớn như là dung lượng, tốc độ chuyn đổi và sự đa dạng.

CHÚ THÍCH 3: Ví dụ một mối quan tâm có thể liên quan đến khả năng mất dữ liệu do vận tốc chuyển đi của dữ liệu.

Ngoài ra, còn có một số mối quan tâm liên qua tới bản thân dữ liệu, bao gồm: xuất xứ, lý lịch và sự bảo vệ. Các mối quan tâm liên quan tới tính bảo mật và riêng tư đối với dữ liệu lớn là đủ lớn để cho TCVN 13239-4:2024 (ISO/IEC 20547-4:2020) tập trung trực tiếp vào các khía cạnh của nó. Một ví dụ là khả năng kết hợp nhiều nguồn dữ liệu bằng cách sử dụng công nghệ dữ liệu lớn để loại bỏ tính ẩn danh dữ liệu là một mối quan tâm quyền riêng tư cụ thể.

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

8.4. Các góc nhìn

Một kiến trúc hệ thống dữ liệu lớn có thể được định nghĩa dưới dạng các góc nhìn.

Kiến trúc tham chiếu dữ liệu lớn định nghĩa hai góc nhìn chính:

- góc nhìn người dùng mô tả các vai trò, vai trò phụ, hoạt động và khía cạnh xuyên sut cần thiết để đáp ứng mối quan tâm của các bên liên quan;

- góc chức năng mô tả các lớp chức năng, thành phần chức năng, và chức năng đa lớp cần thiết để thực thi các hoạt động và khía cạnh xuyên suốt được định nghĩa trong góc nhìn người dùng.

Hình 4 - Các mối quan hệ giữa các yếu t của góc nhìn BDRA

Hình 4 minh họa mối quan hệ của các bên liên quan, và mối quan tâm đến các góc nhìn và yếu tố của chúng.

8.4.1. Góc nhìn người dùng

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

- các bên tham gia: bên tham gia là một hoặc một nhóm thể nhân hoặc pháp nhân được hợp thành t chức hoặc không. Các bên tham gia trong hệ sinh thái dữ liệu lớn là các bên liên quan của hệ sinh thái đó;

- các vai trò và vai trò phụ: vai trò là một tập các hoạt động dữ liệu lớn phục vụ một mục đích chung. Vai trò phụ là tập con của các hoạt động dữ liệu lớn để thực hiện một vai trò nhất định. Các vai trò phụ khác nhau có thể chia sẻ các hoạt động dữ liệu lớn liên trong một vai trò nhất định;

- các hoạt động: hoạt động được định nghĩa là việc thực hiện một hoặc một tập hợp các nhiệm vụ cụ thể. Các hoạt động dữ liệu lớn cần phải có mục đích và mang lại một hoặc nhiều kết quả và những kết quả này được thực hiện bằng việc sử dụng các thành phần chức năng;

- các khía cạnh xuyên suốt: các khía cạnh xuyên suốt là các hành vi hoặc năng lực cần cần được phối hợp giữa các vai trò và thực hiện một cách nhất quán trong một hệ sinh thái dữ liệu lớn. Các khía cạnh xuyên suốt có thể được chia sẻ và ảnh hưởng tới nhiều vai trò, hoạt động dữ liệu lớn và thành phần chức năng. Các khía cạnh xuyên suốt áp dụng cho nhiều vai trò hoặc thành phần chức năng riêng lẻ.

CHÚ THÍCH 1: Một ví dụ về khía cạnh xuyên suốt là tính bảo mật.

CHÚ THÍCH 2: Một bên tham gia có thể đảm nhận nhiều hơn một vai trò tại bát kỳ thời điểm nào và có thể tham gia vào một tập hợp con các hoạt động cụ thể của vai trò đó. Ví dụ về các bên tham gia bao gồm nhưng không giới hạn: tập đoàn lớn, doanh nghiệp vừa và nh, cơ quan chính phủ, viện nghiên cứu và công dân.

8.4.2. Góc nhìn chức năng

Quan điểm chức năng góc nhìn mang tính công nghệ trung lập về các chức năng cần thiết để tạo nên một hệ thống dữ liệu lớn. Góc nhìn chức năng mô tả sự phân bố các chức năng cần thiết để hỗ trợ các hoạt động dữ liệu lớn.

Kiến trúc chức năng cũng xác định các phụ thuộc giữa các chức năng. Góc nhìn chức năng đề cập đến các khái niệm dữ liệu lớn sau:

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

- các lớp chức năng: một lớp chức năng là một tập các thành phần chức năng cung cp các khả năng tương tự hoặc phục vụ một mục đích chung. Kiến trúc chức năng được phân lớp một phần (nghĩa là có các lớp và một tập hợp các chức năng đa lớp);

- các chức năng đa lớp: các chức năng đa lớp bao gồm các thành phần chức năng cung cấp các khả năng được sử dụng trên nhiều lớp chức năng và được nhóm lại thành các tập con.

CHÚ THÍCH: Không phải tất cả các lớp hoặc các thành phần chức năng đều phải được khởi tạo trong một hệ thống dữ liệu lớn cụ thể.

9. Quy trình áp dụng kiến trúc tham chiếu dữ liệu lớn

9.1. Tổng quan

Phần này cung cấp các bước quy trình để áp dụng kiến trúc tham chiếu vào việc phát triển một mô tả kiến trúc cho việc triển khai một hệ thống dữ liệu lớn cụ thể. Mặc dù kiến trúc tham chiếu dữ liệu lớn là rất tổng quan và áp dụng cho nhiều loại hệ thống khác nhau, và có rất nhiều hệ thống và thành phần dữ liệu lớn tiềm năng bao gồm các hệ thống đó. Do đó, quy trình áp dụng được thiết kế để hỗ trợ việc mở rộng kiến trúc tham chiếu dữ liệu lớn nhằm đáp ứng các yêu cầu cụ thể của một hệ thống. Bản chất chính của các thành phần mở rộng này là việc xác định các hoạt động bổ sung liên quan đến các vai trò và/hoặc sự phân công các hoạt động tới các vai trò/vai trò phụ khác nhau. Trong suốt quá trình này, người dùng tiêu chuẩn nên tận dụng các tiêu chuẩn ISO có liên quan khác bao gồm ISO/IEC/IEEE 15288 cho các hệ thống kỹ thuật, ISO/IEC/IEEE 12207 cho kỹ thuật vòng đời phần mềm, và quy trình đo lường chất lượng được xác định trong họ các tiêu chuẩn ISO 9000, và các tiêu chuẩn liên quan để xác minh rõ việc bao hàm và giải quyết đầy đủ các mối quan tâm của kiến trúc.

Người dùng tiêu chuẩn cần xác định rõ những công cụ sẽ được dùng để thu thập và quản lý các dữ liệu trước khi thực hiện quy trình này.

9.2. Xác định các bên liên quan và các mối quan tâm

Bước đầu tiên trong quy trình là xác định các bên liên quan và các mối quan tâm liên quan đến hệ thống dữ liệu lớn. Đây là phần đầu tiên trong quy trình phân tích các yêu cầu bên lên quan được mô tả trong ISO/IEC/IEEE 15288. Kết quả đạt được bao gồm:

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

b) định nghĩa được các ràng buộc đối với hệ thống tuân thủ;

c) cần phải đạt được khả năng truy xuất nguồn gốc các yêu cầu bên liên quan tới các bên liên quan;

d) mô t được cơ sở để thiết lập các yêu cầu hệ thống;

e) định nghĩa được cơ sở để xác nhận tính phù hợp của các dịch vụ hệ thống;

f) cung cấp được một cơ sở cho thủ tục đàm phán và đồng ý cung cấp dịch vụ hệ thống hoặc sản phẩm.

Như đã được mô t trong ISO/IEC/IEEE 15288, cn phải th hiện các mi quan tâm (các yêu cầu) của các bên liên quan dưới dạng các nhu cầu, mong muốn, kỳ vọng và ràng buộc nhận thức của các bên liên quan đã được xác định. Các mối quan tâm này được thể hiện dưới dạng các mô hình có tính chất văn bản hoặc hình thức, tập trung vào mục định và hành vi hệ thống, và được mô tả trong bối cảnh của môi trường và điều kiện vận hành.

Các mối quan tâm bên liên quan nên bao gồm cả các nhu cầu và yêu cầu do xã hội đặt ra (ví dụ: kỳ vọng về quyền riêng tư) và xem xét các quy định của chính phủ (ví dụ: GDPR của Liên minh châu Âu).

Các bên liên quan và mối quan tâm cần được gói gọn trong một mô hình mà có thể sử dụng để cung cấp tính truy nguyên cho các hoạt động và thành phần hệ thống nhằm hỗ trợ quy trình xác nhận.

Cụ thể là các bên liên quan và mối quan tâm cần được xác định duy nhất đ hỗ trợ tính truy nguyên ở các bước trong tương lai. Nếu khả thi thì các mối quan tâm được chia sẻ bởi các bên liên quan cần được thu gọn lại thành một mối quan tâm duy nhất và ánh xạ tới từng bên liên quan.

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

Kết quả đầu ra của quy trình này cần được xem xét cùng với các bên liên quan để xác nhận tính chính xác của nội dung được nắm bắt.

9.3. Ánh xạ các bên liên quan và mối quan tâm tới các vai trò và vai trò phụ

Mục đích của bước này là sắp xếp các bên liên quan và mối quan tâm vào trong cùng một khung tham chiếu chung cho hệ thống dữ liệu lớn. Bước này là đặc biệt quan trọng đối với các hệ thống dữ liệu ở chỗ, trong nhiều trường hợp thì các mối quan tâm cần được giải quyết thông qua một giải pháp hệ thống- của-hệ thống (ví dụ: nhiều hệ thống phối hợp với nhau để đáp ứng một yêu cầu).

TCVN 13239-3:2023 (ISO/IEC 20547-3:2020) xác định các vai trò và vai trò phụ sau:

- nhà cung cấp ứng dụng dữ liệu lớn (BDAP);

- nhà cung cấp dịch vụ thu thập dữ liệu lớn (BDCP);

- nhà cung cấp dịch vụ chuẩn bị dữ liệu lớn (BDPreP);

- nhà cung cấp dịch vụ phân tích dữ liệu lớn (BDAnP);

- nhà cung cấp dịch vụ trực quan hóa dữ liệu lớn (BDVP);

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

- nhà cung cấp khung chức năng dữ liệu lớn (BDFP);

- nhà cung cấp cơ sở hạ tầng dữ liệu lớn (BDIP);

- nhà cung cấp nền tảng dữ liệu lớn (BDPIaP);

- nhà cung cấp dịch vụ xử lý dữ liệu lớn (BDProP);

- đối tác dịch vụ dữ liệu lớn (BDSP);

- nhà phát trin dịch vụ dữ liu lớn (BDSD);

- nhà kiểm toán dữ liệu lớn (BDA);

- nhà điều hành hệ thống dữ liệu lớn (BDSO);

- người dùng dữ liệu lớn;

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

Ma trận tham chiếu chéo là một công cụ hữu dụng đối với quy trình này trong việc thiết lập ánh xạ giữa các mối quan tâm và các vai trò/vai trò phụ mà đòi hỏi các hoạt động đ giải quyết các mối quan tâm đó. Ma trận này có thể là một sơ đồ meatball đơn giản mà trong đó có một chỉ báo báo hiệu khi một mối quan tâm được giải quyết bằng một vai trò, hoặc có thể bao gồm một mệnh đề biện minh/ lý do cụ thể cho lí do tại sao mối quan tâm này cần được giải quyết bởi một vai trò, và/hoặc bao gồm một mệnh đề định tính về việc khía cạnh nào của mối quan tâm cần được giải quyết bởi vai trò tùy thuộc vào mức độ nghiêm ngặt của kiến trúc được yêu cầu. Cần cn thận để không mô tả các hoạt động trong ánh xạ này hoặc mô tả các giải pháp. Bước này chỉ đơn giản là bước đầu phân bố các yêu cầu (các mối quan tâm) tới các nhóm quy trình cao cấp (vai trò/vai trò phụ).

9.4. Xây dựng các mô tả hoạt động chi tiết và ánh xạ tới các mối quan tâm

Bước này định nghĩa việc mà hệ thống hoặc kiến trúc sẽ thực hiện. Kiến trúc tham chiếu dữ liệu lớn dưới dạng các vai trò và vai trò phụ cung cấp một khung để nắm bắt và sắp xếp đầu ra của các hệ thống và quy trình phần mềm kỹ thuật. Người dùng tiêu chuẩn cần tham chiếu tới ISO/IEC/ IEEE 29148 về các hệ thống và các quy trình kỹ thuật yêu cầu vòng đời phần mềm khi thực hiện bước này. ISO/IEC/ IEEE 29148 giúp người dùng tiêu chuẩn biến đổi các mối quan tâm được ghi ở trên thành các yêu cầu cụ thể và có thể kiểm tra được.

Mặc dù không có tiêu chuẩn nào về cách một vai trò yêu cầu các hoạt động đáp ứng một mối quan tâm ghi lại dưới dạng văn bản, một cách tiếp cận là lưu lại chúng dưới dạng các mệnh để yêu cầu. Các mệnh đề này thường có dạng chung là:

<Vai trò/vai trò phụ> sẽ <Động từ> <Tân ngữ>

Với việc vai trò hoặc vai trò phụ cung cấp chủ ngữ, phần “sẽ” và động tự cung cấp vị ngữ, và tân ngữ cung cấp phần tử để tác động lên. Kiến trúc tham chiếu dữ liệu lớn trong TCVN 13239-3:2023 (ISO/IEC 20547-3:2020) mô tả chi tiết về lớp của các hoạt động được thực hiện bởi hệ thống.

Thông thường đối tượng để cập tới các một số phần dữ liệu mà kiến trúc cần tác động lên và động từ mô tả hành động đó sẽ được thực hiện. Các mệnh đề này cũng có thể được coi như là các quy tắc nghiệp vụ mà hệ thống được kiến trúc cần phải thực hiện. Một số ví dụ về các mệnh đề trong phần này là:

- BDCP sẽ xác nhận dữ liệu XXX tuân theo chuẩn YYY.

- BDVP sẽ hiển thị đầu ra dưới dạng đồ thị có hướng.

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

Nhìn chung những mệnh đề này cần phải đầy đủ và ngắn gọn. Cần cn thận ở bước này để tránh việc khẳng định các một hoạt động sẽ được hoàn thành. Đối với các hệ thống lớn, việc sắp xếp các hoạt động dựa trên các lớp của các hoạt động được mô tả trong kiến trúc tham chiếu dữ liệu lớn là rất hữu ích. Đôi khi mức độ chi tiết thêm này giúp ích trong việc xác định các thành phần chức năng cần để thực thi các hoạt động.

Giống như với các mối quan tâm và các bên liên quan, cần có một cách đánh số/danh pháp duy nhất dùng để xác định từng hoạt động. Danh pháp này là cần thiết trong thực hiện các hoạt động ánh xạ. Một cách tiếp cận là đặt tiền tố vai trò/vai trò phụ ở trước một số duy nhất cho mỗi hoạt động.

Kết quả của bước này sẽ là các yêu cầu cụ thể và có thể kiểm tra được, được sắp xếp bởi các vai trò cho phép hệ thống kiến trúc đáp ứng được các mối quan tâm của bên liên quan. Ở mức độ này, mỗi một mối quan tân cần được giải quyết bởi một hoặc nhiều các hoạt động và mỗi hoạt động cần ánh xạ tới một hoặc nhiều mối quan tâm.

Tùy thuộc vào mức độ chi tiết của các hoạt động được định nghĩa, nó có thể không khả thi để trình bày/ghi lại dưới dạng văn bản các thông tin bằng đồ thị chính trong góc nhìn. Người dùng tiêu chuẩn nên xem xét việc người đọc kiểm tra thông tin và xem xét việc định dạng dữ liệu cho việc trình bày. Nếu lựa chọn phương pháp tiếp cận mệnh đề các yêu cầu như được miêu tả ở trên thì cần phải phân tách thêm các vai trò phụ vào các lớp hoạt động mà sẽ lần lượt được ánh xạ tới các mệnh đề hoạt động riêng rẽ. Quá trình này rất hữu ích cho bước tiếp theo vì nó cho phép việc lựa chọn các thành phần chức năng mà hỗ trợ nhiều hoạt động trở nên dễ dàng hơn.

9.5. Định nghĩa các thành phần chức năng để thực thi các hoạt động

Nếu bước trước đó được ánh xạ tới phần phân tích các yêu cầu của vòng đời hệ thống/phần mềm thì bước này sẽ đại diện cho giai đoạn thiết kế cao cấp đối với hệ thống dữ liệu lớn. Lần nữa nhắc lại các tầng chức năng và các lớp thành phần chức năng được cung cấp trong góc nhìn thành phần chức năng của kiến trúc tham chiếu dữ liệu lớn cung cấp một bộ khung để sắp xếp các mục cấu hình (có thể là phần mềm hoặc phần cứng) tạo nên kiến trúc hệ thống dữ liệu lớn.

Người dùng tiêu chuẩn khi tiếp cận bước này cần chọn các thành phần thực tế sẽ thực hiện các hoạt động được định nghĩa ở bước trước đó. Các thành phần này có thể là các công cụ, sản phần hoặc thành phần phần mềm hiện có hoặc là các thành phần mới cần được phát triển dựa trên các hoạt động cần phải thực hiện. Mức độ chi tiết muốn đạt được tùy thuộc vào người dùng tiêu chuẩn và dựa trên các nhu cầu của hệ thống. Đối với các hệ thống rất lớn, việc hoạch định một cách có phân cấp các thành phần này bằng việc sắp xếp chúng vào các hệ thống con nằm trong cùng lớp là rất cần thiết.

Trong mọi trường hợp, các thành phần này cần được ánh xạ tới một hoặc nhiều hoạt động. Chú ý rằng là không có yêu cầu nào cho việc một hoạt động ánh xạ tới một thành phần. Tùy thuộc vào mức độ chi tiết của các hoạt động được lưu tài liệu lại thì có khả năng là một số các hoạt động có thể cần nhiều thành phần.

Để tạo điều kiện thuật lợi cho việc theo dõi và quá trình crosswalk bên dưới thì nên sử dụng một danh pháp tiêu chuẩn cho các thành phần.

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

Dựa trên mức độ chi tiết, việc trình bày thông tin dưới dạng một đồ thị duy nhất là không khả thi. Trong khi, các đồ thị riêng lẻ có thể được phát triển cho từng chức năng từng lớp/đa lớp, một số ngữ cảnh có thể bị mất liên quan đến sự tương tác giữa các lớp.

9.6. Các hoạt động ngang qua/các thành phần chức năng trở lại các mối quan tâm

Đây là bước cuối cùng của quy trình và liên quan tới việc xác nhận mọi mối quan tâm đề có thể truy được từ một thành phần chức năng thông qua một hoạt động, mọi thành phần chức năng có thể truy ngược lại về một mối quan tâm thông qua một hoạt động, và mọi hoạt động đều liên quan tới các mối liên kết này.

Việc lựa chọn cơ sở dữ liệu hoặc công cụ truy xuất nguồn gốc các yêu cầu để nắm bắt được toàn bộ thông tin này tại bước này là cần thiết trong việc xác nhận kiến trúc cấp cao một cách hiệu quả.

 

Thư mục tài liệu tham khảo

[1] ISO 9000- 2015, Quality management systems - Fundamentals and vocabulary.

[2] ISO 9001-2015. Quality management systems - Requirements.

[3] ISO/TS 9002 2016, Quality management systems - Guidelines for the application of ISO 9001:2015.

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

[5] ISO/TR 14639-2:2014, Health informatics - Capacity-based eHealth architecture roadmap - Part 2: Architcctural components and maturity model.

[6] ISO/IEC/IEEE 15288-2015, Systems and software engineering - System life cycle processes.

[7] TCVN 13238:2020 (ISO/IEC 20546:2019), Công nghệ thông tin - Dữ liệu lớn - Tổng quan và từ vựng.

[8] TCVN 13239-2:2020 (ISO/IEC TR 20547-2:2018), Công nghệ thông tin - Kiến trúc tham chiếu dữ liệu lớn - Phần 2: Các trường hợp sử dụng và yêu cầu dẫn xuất.

[9] TCVN 13239-3:2023 (ISO/IEC 20547-3:2020), Công nghệ thông tin - Kiến trúc tham chiếu dữ liệu lớn - Phần 3: Kiến trúc tham chiếu.

[10] TCVN 13239-4:2024 (ISO/IEC 20547-4:2020), Công nghệ thông tin - Kiến trúc tham chiếu dữ liệu lớn - Phần 4: Bảo mật và quyền riêng tư.

[11] TCVN 13239-5:2020 (ISO/IEC TR 20547-5:2018), Công nghệ thông tin - Kiến trúc tham chiếu dữ liệu lớn - Phần 5: Lộ trình tiêu chuẩn.

[12] ISO/IEC /IEEE 29148-2018, Systems and software engineering - Life cycle processes Requirements engineering.

[13] ISO/IEC JTC 1, (2015). Big Data, Preliminary Report 2014.

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

[15] IDC. (2019). Worldwide Semiannual Big Data and Analytics Spending Guide. IDC.

 

MỤC LỤC

1. Phạm vi áp dụng

2. Tài liệu viện dẫn

3. Thuật ngữ và định nghĩa

4. Chữ viết tắt

5. Tổng quan về tiêu chuẩn

6. Chuẩn hóa dữ liệu lớn: động lực và mục tiêu

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

7.1. Yêu cầu chung

7.2. Các khái niệm kiến trúc tham chiếu

7.3. Cấu trúc kiến trúc tham chiếu

8. Các yếu tố của kiến trúc tham chiếu dữ liệu lớn

8.1. Tổng quan

8.2. Các bên liên quan

8.3. Các mối quan tâm

8.4. Các quan điểm

8.4.1. Quan điểm người dùng

...

...

...

Bạn phải đăng nhập hoặc đăng ký Thành Viên TVPL Pro để sử dụng được đầy đủ các tiện ích gia tăng liên quan đến nội dung TCVN.

Mọi chi tiết xin liên hệ: ĐT: (028) 3930 3279 DĐ: 0906 22 99 66

9. Quá trình áp dụng kiến trúc tham chiếu dữ liệu lớn

9.1. Tổng quan

9.2. Xác định các bên liên quan và các mối quan tâm

9.3. Ánh xạ các bên liên quan và các mối quan tâm tới các vai trò và các vai trò phụ

9.4. Xây dựng các mô tả hoạt động chi tiếp và ánh xạ tới các mối quan tâm

9.5. Xác định các thành phần chức năng để thực hiện các hoạt động

9.6. Các hoạt động ngang qua/các thành phần chức năng trở lại các mối quan tâm

Thư mục tài liệu tham khảo

Văn bản này chưa cập nhật nội dung Tiếng Anh

Bạn Chưa Đăng Nhập Thành Viên!


Vì chưa Đăng Nhập nên Bạn chỉ xem được Thuộc tính của văn bản.
Bạn chưa xem được Hiệu lực của Văn bản, Văn bản liên quan, Văn bản thay thế, Văn bản gốc, Văn bản tiếng Anh,...


Nếu chưa là Thành Viên, mời Bạn Đăng ký Thành viên tại đây


Bạn Chưa Đăng Nhập Thành Viên!


Vì chưa Đăng Nhập nên Bạn chỉ xem được Thuộc tính của văn bản.
Bạn chưa xem được Hiệu lực của Văn bản, Văn bản liên quan, Văn bản thay thế, Văn bản gốc, Văn bản tiếng Anh,...


Nếu chưa là Thành Viên, mời Bạn Đăng ký Thành viên tại đây


Bạn Chưa Đăng Nhập Thành Viên!


Vì chưa Đăng Nhập nên Bạn chỉ xem được Thuộc tính của văn bản.
Bạn chưa xem được Hiệu lực của Văn bản, Văn bản liên quan, Văn bản thay thế, Văn bản gốc, Văn bản tiếng Anh,...


Nếu chưa là Thành Viên, mời Bạn Đăng ký Thành viên tại đây


Bạn Chưa Đăng Nhập Thành Viên!


Vì chưa Đăng Nhập nên Bạn chỉ xem được Thuộc tính của văn bản.
Bạn chưa xem được Hiệu lực của Văn bản, Văn bản liên quan, Văn bản thay thế, Văn bản gốc, Văn bản tiếng Anh,...


Nếu chưa là Thành Viên, mời Bạn Đăng ký Thành viên tại đây


Tiêu chuẩn quốc gia TCVN 13239-1:2024 (ISO/IEC TR 20547-1:2020) về Công nghệ thông tin - Kiến trúc tham chiếu dữ liệu lớn - Phần 1: Khung và quy trình ứng dụng

Bạn Chưa Đăng Nhập Thành Viên!


Vì chưa Đăng Nhập nên Bạn chỉ xem được Thuộc tính của văn bản.
Bạn chưa xem được Hiệu lực của Văn bản, Văn bản liên quan, Văn bản thay thế, Văn bản gốc, Văn bản tiếng Anh,...


Nếu chưa là Thành Viên, mời Bạn Đăng ký Thành viên tại đây


19

DMCA.com Protection Status
IP: 69.176.91.100
Hãy để chúng tôi hỗ trợ bạn!