Tiêu chuẩn quốc gia TCVN 11777-6:2018 (hoàn toàn tương đương với tiêu chuẩn quốc tế ISO/IEC 15444-6:2013) về Công nghệ thông tin - Hệ thống mã hóa hình ảnh JPEG 2000 - Định dạng tệp hình ảnh phức hợp quy định chi tiết về cấu trúc định dạng tệp JPM, các phương pháp nén, lưu trữ hình ảnh phức hợp, văn bản ẩn và chú thích đi kèm.
Phạm vi và đối tượng áp dụng
Tiêu chuẩn này áp dụng đối với các nhà phát triển phần mềm, hệ thống lưu trữ, thiết bị quét tài liệu tốc độ cao, các ứng dụng duyệt web tương tác và các hệ thống phân phối nội dung số theo mô hình khách/chủ (client/server). Định dạng JPM cho phép tối ưu hóa việc nén và hiển thị các tài liệu quét đa lớp (Mixed Raster Content - MRC) chứa cả văn bản, hình ảnh màu và các thành phần đồ họa phức tạp.
Mô hình tạo dựng Mặt nạ M và Ảnh I của đối tượng trình bày
Mô hình ảnh phức hợp JPM hoạt động dựa trên việc kết hợp các đối tượng trình bày bao gồm một ảnh (I) và một mặt nạ (M) tùy chọn để tạo ra ảnh trang hoàn chỉnh (PageImage). Quy trình xử lý bao gồm các giai đoạn kỹ thuật cụ thể:
- Tạo dựng mặt nạ M: Nếu không có khung đối tượng mặt nạ, mặt nạ M mặc định có độ sâu bít bằng 1 và giá trị bằng 1 ở mọi vị trí. Khi có dòng mã liên kết, quy trình tạo mặt nạ trải qua 5 giai đoạn: Giải mã mặt nạ (chuyển đổi sang độ sâu bít phù hợp, đảm bảo thể hiện "min in white"); Chia tỷ lệ mặt nạ (sử dụng kỹ thuật lân cận gần nhất hoặc nội suy song tuyến tính); Cắt mặt nạ (áp dụng độ lệch đường viền dọc m_OVoff và ngang m_OHoff); Định vị mặt nạ trên trang (dựa trên độ lệch LVoff và LHoff); Cắt mặt nạ theo cửa sổ trình bày (giới hạn bởi LWidth và LHeight).
- Tạo dựng ảnh I: Quy trình tạo ảnh I cũng trải qua 5 giai đoạn tương tự: Giải mã ảnh và chuyển đổi sang không gian màu đích (spc); Chia tỷ lệ ảnh (sử dụng nội suy song tuyến, lấy mẫu phụ hoặc tính năng giải nén giảm độ phân giải của JPEG 2000); Cắt ảnh; Định vị ảnh trên trang; Cắt ảnh theo cửa sổ lớp trình bày.
- Trường hợp gắn thẻ màu JBIG2: Khi khung đối tượng trình bày chứa ảnh nén theo chuẩn ITU-T T.45 Run Length và mặt nạ nén theo ITU-T T.88 (JBIG2), cả hai phải thiết lập trường NoCodestream trong tiêu đề bằng 0 và đồng nhất các thông số kích thước, tỷ lệ và độ lệch.
Cấu trúc tổ chức phân cấp của tệp tin JPM
Tệp tin JPM sử dụng cấu trúc định dạng tệp quy định trong ISO/IEC 15444-1, được tổ chức dưới dạng một chuỗi liên tiếp các khung (boxes) nhị phân. Cấu trúc phân cấp từ cấp độ tệp tin đến cấp độ đối tượng bao gồm:
- Khung ký số JPEG 2000 (JPEG 2000 Signature Box): Xác định tệp tin thuộc dòng chuẩn JPEG 2000, bắt buộc nằm ở đầu tệp tin.
- Khung loại tệp tin (File Type Box - 'ftyp'): Quy định loại tệp, phiên bản và tính tương thích. Trường BR phải ký hiệu là 'jpm\040'.
- Khung tiêu đề ảnh phức hợp (Compound Image Header Box - 'mhdr'): Chứa thông tin tổng quát của tệp bao gồm số lượng trang (NP), cấu hình hỗ trợ (P), cờ tệp tự chứa (SC), độ lệch và chiều dài tập trang chính (MPCOff, MPCLen), các bộ mã hóa mặt nạ và ảnh được sử dụng (MC, IC), và thông tin quyền sở hữu trí tuệ (IPR).
- Khung tham chiếu dữ liệu (Data Reference Box - 'dtbl'): Chứa danh sách các URL/URI trỏ đến các tệp tin hoặc tài nguyên bên ngoài khi tệp JPM không tự chứa hoàn toàn.
- Khung tập trang (Page Collection Box - 'pcol'): Nhóm các trang có liên quan lại với nhau, chứa khung bộ định vị tập trang cơ sở (PPCLoc), khung nhãn tùy chọn, dữ liệu đặc tả và khung bảng trang (PTable) để hỗ trợ truy cập ngẫu nhiên.
- Khung trang (Page Box - 'page'): Siêu khung chứa toàn bộ thông tin của một trang đơn, bao gồm tiêu đề trang (PHdr), bộ định vị tập trang cơ sở, khung phân giải, khung màu gốc (BCLR), dữ liệu đặc tả và các khung đối tượng trình bày (Lobj).
- Khung đối tượng trình bày (Layout Object Box - 'lobj'): Định vị và tổng hợp cặp đối tượng ảnh/mặt nạ lên trang, chứa tiêu đề đối tượng trình bày (LHdr) và các khung đối tượng thành phần (OBJ0, OBJ1).
- Khung đối tượng (Object Box - 'objc'): Chứa dữ liệu ảnh hoặc mặt nạ thực tế, tiêu đề đối tượng (OHdr), khung chia tỷ lệ (Scale) và khung tiêu đề JP2 (JP2HDR).
Cơ chế phân mảnh dòng mã và chia sẻ dữ liệu
Để tối ưu hóa hiệu suất truyền tải qua mạng Internet và giảm dung lượng tệp tin, JPM cung cấp các cơ chế kỹ thuật tiên tiến:
- Bảng phân mảnh (Fragment Table): Cho phép bẻ dòng mã nén thành nhiều phân mảnh nhỏ nằm rải rác trong tệp tin hiện thời hoặc ở các tệp tin từ xa trên mạng (thông qua URI). Dữ liệu được truy cập thông qua khung bảng phân mảnh ('ftbl') và khung danh sách phân mảnh ('flst'). Các phân mảnh có thể bắt đầu hoặc dừng lại ở bất kỳ ranh giới byte nào; bộ giải mã sẽ lưu trữ dữ liệu tạm thời cho đến khi nhận đủ phân mảnh tiếp theo để tiếp tục giải mã.
- Chia sẻ dữ liệu (Shared Data): Tránh việc lặp lại các khung dữ liệu giống nhau (như tiêu đề JP2 hoặc dữ liệu đặc tả) bằng cách sử dụng khung nhập dữ liệu chia sẻ ('sdat') kết hợp với khung tham chiếu dữ liệu chia sẻ ('sref') hoặc khung tham chiếu chéo ('cref'). Khung 'sref' sử dụng ID để tham chiếu nội bộ trong cùng một tệp, trong khi 'cref' sử dụng độ lệch và chiều dài để tham chiếu liên tệp.
- Ảnh thu nhỏ (Thumbnails): Hỗ trợ hai loại ảnh thu nhỏ để tăng tốc độ duyệt tài liệu. Ảnh thu nhỏ tài liệu (Document Thumbnail) nằm ở đầu tệp ngay sau khung loại tệp tin, tương thích với bộ đọc JP2 tiêu chuẩn. Ảnh thu nhỏ trang (Page Thumbnail) là đối tượng trình bày đầu tiên của một trang (có ID đối tượng bằng 0), cho phép hiển thị nhanh giao diện trang trong khi chờ tải dữ liệu chất lượng cao.
Hệ thống văn bản ẩn (HTX) và chú thích (Annotations)
Văn bản ẩn trong JPM được sử dụng cho các mục đích tìm kiếm, đánh dấu, cắt dán và chuyển đổi văn bản thành giọng nói (text-to-speech) mà không làm ảnh hưởng đến chất lượng hiển thị của ảnh gốc.
- Lưu trữ và nén HTX: Dữ liệu văn bản ẩn được định nghĩa bằng ngôn ngữ XML 1.0 (phù hợp với lược đồ HTX). Để tiết kiệm dung lượng, HTX có thể được nén bằng thuật toán DEFLATE (zlib) và lưu trữ trong khung UUID với ID định danh hệ thập lục phân cố định là:
c2 f3 66 a4 27 ec 40 c4 a0 9a 7e 65 2f 36 eb 59. Khung tham chiếu HTX ('phtx') trong khung trang sẽ trỏ đến dữ liệu HTX ở cấp độ tệp tin. - Các phần tử cấu trúc HTX: Tài liệu HTX được tổ chức theo cấu trúc phân cấp chặt chẽ bao gồm: htx (phần tử gốc), annotations (chứa các vùng chú thích), hiddentext (chứa văn bản ẩn của trang), region (vùng trang), paragraph (đoạn văn), line (dòng văn bản), word (từ), altword (từ thay thế khi kết quả OCR không chắc chắn), char (ký tự), altchar (ký tự thay thế) và snippet (phần ảnh không nhận dạng được).
- Thuộc tính chung: Nhóm thuộc tính lõi (Coreattrs) bao gồm id, class, lang, xml:lang, dir, và iref (URI của ảnh tương ứng). Nhóm thuộc tính vị trí (Posattrs) bao gồm shape (hình dạng 'rect' hoặc 'poly'), coords (tọa độ pixel thực tế trên trang), angle (góc hướng văn bản) và baseline (đường cơ sở của ký tự).
- Chú giải và vùng tương tác (Annotations & Area): Phần tử annotations chứa các phần tử area để xác định các vùng có thể nhấp chuột (clickable) hoặc tô sáng (highlight). Thuộc tính href xác định liên kết đích, alt cung cấp mô tả văn bản và target xác định khung hiển thị liên kết.
Hồ sơ ứng dụng và giải nén (Profiles)
Tiêu chuẩn định nghĩa các hồ sơ kỹ thuật để đảm bảo tính tương thích giữa các bộ tạo dựng và bộ đọc tệp JPM:
- Hồ sơ Web (Web Profile - P = 1): Quy định các giới hạn kỹ thuật cho ứng dụng web. Đối tượng mặt nạ chỉ được phép sử dụng các chuẩn nén ITU-T T.6 (MMR), ITU-T T.88 (JBIG2) hoặc JPEG 2000 (chỉ dùng JPEG 2000 khi mặt nạ có nhiều hơn 1 bít/thành phần). Đối tượng ảnh sử dụng chuẩn nén ITU-T T.81 (JPEG), JPEG 2000 hoặc ITU-T T.45. Tất cả các thành phần của đối tượng ảnh phải có cùng độ sâu bít và cùng đặc tính màu trong một trang. Không gian màu được hỗ trợ bao gồm sRGB, Greyscale, CIELab, YCbCr(2) và sRGBsYCC.
- Hồ sơ giải nén (Decompression Profiles): Đối với JPEG 2000, yêu cầu tuân thủ Profile JPEG 2000 Class 1 với kích thước ảnh tối đa là 16.384 x 16.384 pixel. Đối với JPEG, yêu cầu tuân thủ đường cơ sở (Baseline) JPEG. Đối với JBIG2, hỗ trợ các hồ sơ từ F3 đến F7 hoặc tất cả các hồ sơ của ITU-T T.89.
Hướng dẫn cấu trúc nguồn URL truy cập thành phần phụ JPM
Để hỗ trợ truy cập từ xa hiệu quả qua giao thức HTTP, tiêu chuẩn hướng dẫn cách xây dựng các tham số truy vấn (query parameters) sau dấu chấm hỏi ("?") trong URL của tệp JPM:
- Truy cập trang và đối tượng trình bày: Sử dụng cú pháp
foo.jpm?page=[số_trang]&obj=[ID_đối_tượng](ví dụ:foo.jpm?page=3&obj=32để truy cập đối tượng trình bày số 32 trên trang 3). - Truy cập dữ liệu đặc tả: Sử dụng tham số
type=metakết hợp vớiindexvàmtype(ví dụ:foo.jpm?page=77&obj=19&type=meta&index=1để lấy khung dữ liệu đặc tả đầu tiên của đối tượng). - Truy cập theo nhãn: Sử dụng tham số
label(ví dụ:foo.jpm?label=IPR-info). - Truy cập tập trang: Sử dụng tham số
coll(ví dụ:foo.jpm?coll=tocđể truy cập mục lục hoặcfoo.jpm?coll=mainđể truy cập tập trang chính). - Truy cập ảnh thu nhỏ: Sử dụng tham số
type=thumb(ví dụ:foo.jpm?page=3&type=thumb) hoặc nhãn dành riêngpage=thumbđể lấy ảnh thu nhỏ của toàn bộ tài liệu. - Truy cập dải byte trực tiếp: Sử dụng tham số
off(độ lệch byte) vàlen(chiều dài byte) để yêu cầu một phân đoạn dữ liệu cụ thể (ví dụ:foo.jpm?off=12384&len=1024).
Để sử dụng toàn bộ tiện ích nâng cao của Hệ Thống Pháp Luật vui lòng lựa chọn và đăng ký gói cước.
ISO/IEC 15444-6:2013
CÔNG NGHỆ THÔNG TIN - HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG2000 - ĐỊNH DẠNG TỆP HÌNH ẢNH PHỨC HỢP
Information technology - JPEG 2000 image coding system - Compound image file format
Mục lục
1 Phạm vi áp dụng
2 Tài liệu viện dẫn
3 Thuật ngữ và định nghĩa
4 Ký hiệu và thuật ngữ viết tắt
5 Sắp xếp chung
5.1 Mô hình quét nội dung kết hợp
5.2 Cấu trúc và các thành phần tệp tin
5.2.1 Tập trang
5.2.2 Các trang
5.2.3 Đối tượng trình bày
5.2.4 Các ảnh thu nhỏ
5.2.5 Dòng mã liên tục và dòng mã đã phân mảnh
5.2.6 Dữ liệu chia sẻ
5.2.7 Dữ liệu đặc tả
5.3 Dữ liệu đặc tả văn bản ẩn
5.4 Kịch bản sử dụng JPM
5.4.1 Tệp tin tự chứa và các tệp tin tham chiếu bên ngoài
5.4.2 Tệp tin chuẩn bị để sử dụng trên Internet
5.4.3 Ví dụ tập trang
5.4.4 Tập trang trong một ngữ cảnh máy khách/máy chủ
5.4.5 Ví dụ về tương tác máy khách/máy chủ
5.4.6 Ví dụ về thu hình máy quét (scanner capture)
Phụ lục A (Quy định) Cấu trúc tệp tin ảnh phức hợp
A.1 Nhận dạng tệp tin
A.2 Tổ chức tệp tin
A.3 Định nghĩa khung
A.4 Các khung được sử dụng trong tệp tin ảnh phức hợp
Phụ lục B (Quy định) Định nghĩa khung
B.1 Các khung cấp độ tệp tin
B.2 Khung cấp độ trang
B.3 Khung cấp độ đối tượng trình bày
B.4 Khung cấp độ đối tượng
B.5 Khung phần tử dòng mã JP2
B.6 Khung tổng quát
Phụ lục C (Quy định) Dữ liệu đặc tả (Metadata)
C.1 Bổ sung thông tin sở hữu trí tuệ vào tệp tin JPM
C.2 Bổ sung thông tin nhà cung cấp cụ thể vào định dạng tệp tin JPM
Phụ lục D (Quy định) Hồ sơ
D.1 Hồ sơ JPM
D.2 Hồ sơ giải nén
Phụ lục E (Quy định) (Dự kiến xây dựng)
Phụ lục F (Quy định) Lưu trữ văn bản ẩn và các chú thích
F.1 Lưu trữ của HTX trong JPM
F.2 Nén HTX
Phụ lục G (Quy định) Văn bản ẩn và các loại chú thích và các phần tử
G.1 Tổng quan
G.2 Loại
G.3 Thuộc tính chung
G.4 Phần tử
Phụ lục H (Quy định) Lược đồ văn bản ẩn và các chú giải
H.1 Lược đồ XML
H.1.1 Phiên bản và mã hóa
H.1.2 Lược đồ
Phụ lục I (Tham khảo) Các ví dụ về văn bản ẩn và các chú giải
I.1 Ví dụ 1
I.2 Ví dụ 2
I.3 Ví dụ 3
Phụ lục J (Tham khảo) Hướng dẫn cấu trúc các nguồn URL cho các tệp tin JPM
J.1 Các trang và các đối tượng trình bày (Pages and layout objects)
J.2 Khung dữ liệu đặc tả (Metadata boxes)
J.3 Nhãn
J.4 Tập trang (Page collections)
J.5 Hình thu nhỏ của trang (Page thumbnails)
J.6 Hình thu nhỏ tài liệu (Document thumbnail)
J.
Để xem đầy đủ nội dung và sử dụng toàn bộ tiện ích của Hệ Thống Pháp Luật vui lòng lựa chọn và đăng ký gói cước.
Nếu bạn đã là thành viên, hãy bấm:
- 1Tiêu chuẩn quốc gia TCVN 12214-3:2018 (ISO/IEC 14888-3:2016) về Công nghệ thông tin - Các kỹ thuật an toàn - Chữ ký số kèm phụ lục - Phần 3: Các cơ chế dựa trên logarit rời rạc
- 2Tiêu chuẩn quốc gia TCVN 12201:2018 về Công nghệ thông tin - Quy trình số hóa và tạo lập dữ liệu đặc tả cho đối tượng 3D
- 3Tiêu chuẩn quốc gia TCVN 12197:2018 (ISO/IEC 19772:2009) về Công nghệ thông tin - Các kỹ thuật an toàn - Mã hóa có sử dụng xác thực
- 4Tiêu chuẩn quốc gia TCVN 10176-8-15:2018 (ISO/IEC 29341-8-15:2008) về Công nghệ thông tin - Kiến trúc thiết bị UPnP - Phần 8-15: Giao thức điều khiển thiết bị Internet gateway - Dịch vụ cấu hình giao diện chung mạng diện rộng
- 5Tiêu chuẩn quốc gia TCVN 7825:2019 (ISO/IEC 15420:2009) về Công nghệ thông tin - Kỹ thuật phân định và thu thập dữ liệu tự động - Yêu cầu kỹ thuật mã vạch EAN/UPC
- 6Tiêu chuẩn quốc gia TCVN 8020:2019 (ISO/IEC 15418:2016) về Công nghệ thông tin - Kỹ thuật phân định và thu nhận dữ liệu tự động - Số phân định ứng dụng GS1 và mã phân định dữ liệu ASC MH10 và việc duy trì
- 7Tiêu chuẩn quốc gia TCVN 11777-13:2018 (ISO/IEC 15444-13:2008) về Công nghệ thông tin - Hệ thống mã hóa hình ảnh JPEG 2000 - Bộ mã hóa JPEG 2000 mức đầu vào
- 8Tiêu chuẩn quốc gia TCVN 12855-3:2020 (ISO/IEC 9796-3:2013) về Công nghệ thông tin - Các kỹ thuật an toàn - Lược đồ chữ ký số cho khôi phục thông điệp - Phần 3: Các cơ chế dựa trên logarit rời rạc
- 1Tiêu chuẩn quốc gia TCVN 12214-3:2018 (ISO/IEC 14888-3:2016) về Công nghệ thông tin - Các kỹ thuật an toàn - Chữ ký số kèm phụ lục - Phần 3: Các cơ chế dựa trên logarit rời rạc
- 2Tiêu chuẩn quốc gia TCVN 12201:2018 về Công nghệ thông tin - Quy trình số hóa và tạo lập dữ liệu đặc tả cho đối tượng 3D
- 3Tiêu chuẩn quốc gia TCVN 12197:2018 (ISO/IEC 19772:2009) về Công nghệ thông tin - Các kỹ thuật an toàn - Mã hóa có sử dụng xác thực
- 4Tiêu chuẩn quốc gia TCVN 10176-8-15:2018 (ISO/IEC 29341-8-15:2008) về Công nghệ thông tin - Kiến trúc thiết bị UPnP - Phần 8-15: Giao thức điều khiển thiết bị Internet gateway - Dịch vụ cấu hình giao diện chung mạng diện rộng
- 5Tiêu chuẩn quốc gia TCVN 7825:2019 (ISO/IEC 15420:2009) về Công nghệ thông tin - Kỹ thuật phân định và thu thập dữ liệu tự động - Yêu cầu kỹ thuật mã vạch EAN/UPC
- 6Tiêu chuẩn quốc gia TCVN 8020:2019 (ISO/IEC 15418:2016) về Công nghệ thông tin - Kỹ thuật phân định và thu nhận dữ liệu tự động - Số phân định ứng dụng GS1 và mã phân định dữ liệu ASC MH10 và việc duy trì
- 7Tiêu chuẩn quốc gia TCVN 11777-13:2018 (ISO/IEC 15444-13:2008) về Công nghệ thông tin - Hệ thống mã hóa hình ảnh JPEG 2000 - Bộ mã hóa JPEG 2000 mức đầu vào
- 8Tiêu chuẩn quốc gia TCVN 12855-3:2020 (ISO/IEC 9796-3:2013) về Công nghệ thông tin - Các kỹ thuật an toàn - Lược đồ chữ ký số cho khôi phục thông điệp - Phần 3: Các cơ chế dựa trên logarit rời rạc
Tiêu chuẩn quốc gia TCVN 11777-6:2018 (ISO/IEC 15444-6:2013) về Công nghệ thông tin - Hệ thống mã hóa hình ảnh JPEG 2000 - Định dạng tệp hình ảnh phức hợp
- Số hiệu: TCVN11777-6:2018
- Loại văn bản: Tiêu chuẩn Việt Nam
- Ngày ban hành: 01/01/2018
- Nơi ban hành: ***
- Người ký: ***
- Ngày công báo: Đang cập nhật
- Số công báo: Đang cập nhật
- Ngày hiệu lực: 10/06/2026
- Tình trạng hiệu lực: Kiểm tra
