【云计算】PDF格式分析之如何判断PDF/VT
小标 2018-12-24 来源 : 阅读 1121 评论 0

摘要:本文主要向大家介绍了【云计算】PDF格式分析之如何判断PDF/VT,通过具体的内容向大家展现,希望对大家学习云计算有所帮助。

本文主要向大家介绍了【云计算】PDF格式分析之如何判断PDF/VT,通过具体的内容向大家展现,希望对大家学习云计算有所帮助。

 PDF / VT是ISO于2010年8月以ISO 16612-2 发布的国际标准。它定义了PDF作为针对可变和事务打印优化的交换格式的使用。
“ISO 16612-2图形技术 - 可变数据交换 - 第2部分:使用PDF / X-4和PDF / X-5(PDF / VT)”定义PDF / VT文档格式和方法,以便为可变数据进行可靠的文件交换和交易印刷。交易文档包括将账单信息与营销信息(TransPromo)集成在一起的发票,报表和文档。

文件格式旨在使那些参与可变数据打印的人能够利用已经使用的工具,惯例和技术。PDF / VT将简化从桌面打印机到数字生产印刷机等各种环境的VDP打印。此外,它将支持PDF 1.6的完整图形模型。

PDF / VT使用基于现有ISO PDF / X-4和PDF / X-5标准的可移植文档格式(PDF)。它提供了支持实时透明度,图层和完整的基于ICC的颜色管理的成像模型中图形对象的文档结构和布局,内容和交互的规范。提供完全独立的PDF / VT文件(盲目交换以获得最大可靠性),以及引用外部图形对象和配置文件的PDF / VT文件。PDF / VT丰富的元数据模型支持强大,精细和动态的生产控制。

在PDF / VT工作流程中,VDP应用程序以数据格式生成输出,并且能够解释PDF / VT格式的RIP或数字前端(DFE)呈现作业以进行打印生成。基于PDF / VT的工作流程将为VDP作业提供PDF打印生产的所有众所周知的好处。通过无缝折叠到现有的基于PDF的印前操作,它为所有作业类型提供了单一的通用PDF打印生产工作流程。

PDF / VT将通过缓存重复的文本和图形,实现图形丰富内容的高性能渲染,以便在高速数字印刷机上进行打印。目前正在积极开发大量将创建或使用数据格式的产品,预计将在不久的将来推出。

负责开发ISO PDF / VT标准的ISO TC 130工作组文件编辑兼主席伊士曼柯达的Tim Donahue表示,“PDF / VT标准是基于严格检查可变数据和交易打印工作流程的结果,关于可变印刷从业者直接提出的要求。创建该标准的工作组成员包括可变数据和交易印刷工作流程,数字印刷,PDF,JDF,色彩管理和高性能RIP技术的国际专家组。

参与该标准开发的委员会成员包括广泛的行业领先的打印机,RIP和软件供应商,商业打印机和其他行业利益相关者。NPES印刷,出版和转换技术供应商协会负责协调美国代表的活动。

“我很高兴看到该标准的发布允许在各种各样的印刷设备上可预测地生成可变数据输出。可以在办公室或复印中心到各种生产的各种设备上生产作业。设备,具有一致的创意和验证工作流程“,技术战略家Dave Prouty说。“这应该使可变数据输出的创建和生产更容易,更可预测,并且更广泛地利用。”

PDF / VT标准
PDF / VT标准已于2010年作为ISO 16612:2010发布。它旨在实现各种环境下的可变文档打印(VDP)。(请注意,缩写VDP有时会扩展为“可变数据印刷”,以替代“可变文档打印”)。PDF / VT文档包含最终内容元素和关联的元数据,但不包含任何变量或模板。前身标准ISO 16612-1:2005指定了基于PDF 1.4的PPML / VDX格式。但是,这个较旧的标准缺少多个PDF功能,并依赖于PDF外部的结构。现代PDF / VT标准基于PDF / X-4和PDF / X-5,并支持PDF 1.6功能,包括透明度,图层和基于ICC的色彩管理。除PDF / X的要求外,PDF / VT标准还为PDF添加了补充功能,以满足大批量个性化打印的要求。PDF / VT通过为PDF添加有效的资源管理,实现数字打印文件的高性能渲染。

由于PDF / X包含色彩管理功能和对ICC颜色配置文件的支持,因此PDF / VT继承了相同的功能。虽然色彩管理可能为目前仅限于黑白打印的组织提供了学习曲线,但它为彩色印刷产品打开了舞台,并且色彩还原一致。

PDF / VT的范围包括以下定义的重要部分“可变文档打印”和“事务打印”。

可变数据印刷
可变数据打印(可变文档打印,VDP) - 也称为个性化或一对一营销 - 生成个性化页面,即一些或所有打印页面是不同的。可变内容取自数据库,用于自定义每个文档。VDP主要用于营销目的,因为个性化文档比非个性化群发邮件更快地吸引收件人的注意力。一些例子:
- 与变量名称和地址信息的业务对应。
- 具有可变文本和图形元素的定制小册子,其中基于一组合成规则选择可变元素。因此,创建了图形丰富且独特的文档。
- 真正个性化的产品,其中实际内容根据位置,性别,年龄,购买历史或其他有关收件人的已知信息而有所不同。

事务印刷
事务打印产生购买,账户或其他交易的记录,例如账单,报表和政策。如果促销或营销信息包含在交易文档中,则该组合称为交易促销或transpromo。常见的行业特定示例:

    金融服务部门:财务报表包括为个人收件人量身定制的定制服务。
    公用事业部门:电费或燃气费账单包含基于客户实际消费的定制服务。
    电信部门:电话帐单包括基于客户上个月的特定类型和电话连接数量的自定义折扣优惠。

一致性级别:PDF / VT-1,PDF / VT-2和PDF / VT-2s

ISO 16612-2规定了三个PDF / VT一致性级别,所有这些都基于PDF 1.6:

    PDF / VT-1专为单文件交换而设计,基于PDF / X-4。呈现PDF文档所需的所有资源都包含在自包含的PDF / VT-1文件中。因此,不允许使用带外部输出意图的PDF / X-4p。
    PDF / VT-2专为多文件交换而设计,基于PDF / X-4p,PDF / X-5g或PDF / X-5pg标准之一。PDF / VT-2文档可以引用外部输出意图,外部页面内容或两者。PDF / VT文档及其所有引用的PDF文件和外部输出意图统称为PDF / VT-2文件集。
    PDF / VT-2s设计用于流式传输,其中文档生成和渲染可以交错。PDF / VT-2s流是一个MIME包,包含一个或多个PDF / VT-1文件或PDF / VT-2文件集(或两种风格)以及所有引用的文件。

如何判断 PDF / VT版本:
1、文书情报字典(Info):/GTS_PDFXVersion,/Trapped需存在
2、OutputIntent字典:/S/GTS_PDFX
3、xmpmeta:

PDF/VT-1

<?xpacket begin="" id="W5M0MpCehiHzreSzNTczkc9d"?>
<x:xmpmeta xmlns:x="adobe:ns:meta/" x:xmptk="Adobe XMP Core 5.6-c015 81.157285, 2014/12/12-00:43:15        ">
   <rdf:RDF xmlns:rdf="//www.w3.org/1999/02/22-rdf-syntax-ns#">
      <rdf:Description rdf:about=""
            xmlns:xmpMM="//ns.adobe.com/xap/1.0/mm/"
            xmlns:pdf="//ns.adobe.com/pdf/1.3/"
            xmlns:pdfxid="//www.npes.org/pdfx/ns/id/"
            xmlns:xmp="//ns.adobe.com/xap/1.0/"
            xmlns:pdfvtid="//www.npes.org/pdfvt/ns/id/"----------------pdfvt名字空间
            xmlns:dc="//purl.org/dc/elements/1.1/">
         <xmpMM:InstanceID>uuid:a3d72274-20db-4d66-a1b4-e32958f366d7</xmpMM:InstanceID>
         <xmpMM:DocumentID>uuid:F419DE48-BFA6-9DD8-9C1F-0F770631763B</xmpMM:DocumentID>
         <xmpMM:VersionID>1</xmpMM:VersionID>--------------------------------版本
         <xmpMM:RenditionClass>default</xmpMM:RenditionClass>
         <pdf:Trapped>False</pdf:Trapped> --------------------------与Info字典中的Trapped保存一致
         <pdf:Producer>PDFlib Personalization Server 9.1.1 (JDK 1.8/Linux-x86_64)</pdf:Producer>
         <pdfxid:GTS_PDFXVersion>PDF/X-4</pdfxid:GTS_PDFXVersion>
         <xmp:MetadataDate>2018-08-28T10:26:01+08:00</xmp:MetadataDate>
         <xmp:CreateDate>2017-08-07T09:29:31+02:00</xmp:CreateDate>
         <xmp:ModifyDate>2018-08-28T10:26:01+08:00</xmp:ModifyDate>
         <xmp:CreatorTool>PDFlib starter sample</xmp:CreatorTool>
         <pdfvtid:GTS_PDFVTVersion>PDF/VT-1</pdfvtid:GTS_PDFVTVersion>----pdfvt版本
         <pdfvtid:GTS_PDFVTModDate>2017-08-07T09:29:31+02:00</pdfvtid:GTS_PDFVTModDate>--修改日期
         <dc:format>application/pdf</dc:format>
         <dc:title>
            <rdf:Alt>
               <rdf:li xml:lang="x-default">starter_pdfvt1</rdf:li>----标题
            </rdf:Alt>
         </dc:title>
      </rdf:Description>
   </rdf:RDF>
</x:xmpmeta>

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32

PDF/VT-2

<?xpacket begin="" id="W5M0MpCehiHzreSzNTczkc9d"?>
    <x:xmpmeta xmlns:x="adobe:ns:meta/">
      <rdf:RDF xmlns:rdf="//www.w3.org/1999/02/22-rdf-syntax-ns#">
        <rdf:Description rdf:about="" xmlns:xmpMM="//ns.adobe.com/xap/1.0/mm/">
          <xmpMM:InstanceID>uuid:66EEACB5-98EC-5330-2A4E-BF391435C11E</xmpMM:InstanceID>
          <xmpMM:DocumentID>uuid:CB4A9C8C-9346-FA45-E3A8-35DE9B403CEA</xmpMM:DocumentID>
          <xmpMM:VersionID>1</xmpMM:VersionID>
          <xmpMM:RenditionClass>default</xmpMM:RenditionClass>
        </rdf:Description>
        <rdf:Description rdf:about="" xmlns:pdf="//ns.adobe.com/pdf/1.3/">
          <pdf:Trapped>False</pdf:Trapped>
          <pdf:Producer>PDFlib Personalization Server 9.1.0 (JDK 1.8/Linux-x86_64)</pdf:Producer>
        </rdf:Description>
        <rdf:Description rdf:about="" xmlns:pdfxid="//www.npes.org/pdfx/ns/id/">
          <pdfxid:GTS_PDFXVersion>PDF/X-5pg</pdfxid:GTS_PDFXVersion>
        </rdf:Description>
        <rdf:Description rdf:about="" xmlns:xmp="//ns.adobe.com/xap/1.0/">
          <xmp:MetadataDate>2017-01-26T15:59:00+01:00</xmp:MetadataDate>
          <xmp:CreateDate>2017-01-26T15:59:00+01:00</xmp:CreateDate>
          <xmp:ModifyDate>2017-01-26T15:59:00+01:00</xmp:ModifyDate>
          <xmp:CreatorTool>PDFlib starter sample</xmp:CreatorTool>
        </rdf:Description>
        <rdf:Description rdf:about="" xmlns:pdfvtid="//www.npes.org/pdfvt/ns/id/">
          <pdfvtid:GTS_PDFVTVersion>PDF/VT-2</pdfvtid:GTS_PDFVTVersion>
          <pdfvtid:GTS_PDFVTModDate>2017-01-26T15:59:00+01:00</pdfvtid:GTS_PDFVTModDate>
        </rdf:Description>
        <rdf:Description rdf:about="" xmlns:dc="//purl.org/dc/elements/1.1/">
          <dc:title>
            <rdf:Alt>
              <rdf:li xml:lang="x-default">starter_pdfvt2</rdf:li>
            </rdf:Alt>
          </dc:title>
        </rdf:Description>
      </rdf:RDF>
    </x:xmpmeta>
<?xpacket end="r"?>

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36

PDF / VT所基于的技术概念:

文档部件层次结构:
文档部分(DPart)层次结构指定PDF / VT文件中文档或文档部分的顺序和关系。 在通常情况下,PDF / VT文件包含许多收件人的子文档,每个文档部分对应于单个收件人的页面。 除了将页面分配给收件人之外,文档部件层次结构还可以反映更复杂的结构。例如,收件人可以根据其地址中的邮政编码进行分组,邮政编码可以根据州,国家的状态等进行组织。这种文件组织创建一种树状结构,包括 文档中的所有页面。 此树的元素称为DPart节点,其中每个内部节点包含其他DPart节点,每个叶节点为接收者指定一个或多个页面。
PDF / VT文件中的文档部件层次结构可用于访问页面,也可用于其他方法,例如按页码或页面标签访问。 PDF / VT文件中需要DPart层次结构。 可选的RecordLevel值选择DPart层次结构中与各个收件人的记录对应的级别。 这与范围提示相关(见下文)。

文档部分元数据
从根目录到文档树中的叶子的文档部分层次结构中的每个节点都可以包含文档部件元数据(DPM)。 这可用于传达有关特定收件人的子文档及其部分的信息。 特别是,可以用DPM编码与生产相关的属性(例如文档部分的拷贝数)或关于接收者的信息(例如相应的邮政编码)。
PDF / VT标准规定了用于存储文档部分元数据的一般方法,但没有规定任何特定类型的元数据方案或编码。 然而,该标准的制定偏向于元数据方案,该方案是作业定义格式(JDF)的一部分,JDF是由印前,印刷和印后组织(CIP4)国际合作进程整合的工作单格式。建议与PDF / VT一起使用的元数据格式称为ICS - 文档生成工作流的公共元数据。 欲了解更多信息,请访问www.cip4.org。
PDF / VT中不需要JDF(或其他)生产元数据,但在启用JDF的工作流程中增加了实质性价值。 PDF / VT标准还指定了将文档部分元数据表示为外部XML文档的方法。

针对重复图形内容的优化
打印元素通常在多个页面上重复使用,例如公司徽标或产品图片,显示在邮件的所有页面上。对重复图形内容的优化处理是改善文件大小和打印文件处理速度的重要策略。 PDF始终支持XObjects作为优化文件大小的方法,方法是在文件中仅包含一次打印元素所需的数据,并允许从多个页面(或同一页面上的多个实例)引用此数据。 XObjects可能包含栅格图像或任意文本和矢量图形内容。虽然PDF中的XObject旨在优化文档的整体大小,但到目前为止,PDF还没有包含任何优化重复页面内容渲染速度的方法。 PDF中没有任何内容可以告诉消费软件,例如,特定页面上的图像将再次出现在另一页面上,或稍后在同一文档中,或在下一个打印作业中。 PDF / VT扩展了PDF中XObjects的现有概念,并添加了以下优化打印性能的方法:

    唯一标识:可以为XObject分配一个标识符(称为GTS_XID),该标识符在所有文档中都是唯一的。 可以通过缓存需要识别等效XObject的实现来使用此标识符。 简单来说,已经为作业1处理并且发现在作业2中重新使用的图形不必再次被翻录,但是可以从高速缓存中获取光栅化结果。
    范围提示和环境上下文:XObjects可能包含有关重新使用图形内容的页面或文档范围的信息(称为GTS_Scope)。 这样,XObjects可以在缓存中携带有关其渲染结果的有效生命周期的信息:内容是仅重新用于当前收件人,在同一文件或文件流中的任何其他位置重复使用,还是根本不重复使用。 如果提供了环境上下文(称为GTS_Env),则XObject可以指定全局使用,即它将在多个PDF / VT实例中重用。 环境上下文字符串没有限制。 例如,客户或工作名称可用于识别环境。
    封装提示:XObject缓存算法必须考虑XObject与调用上下文和同一页面(或其他页面上的现有打印元素)的交互,例如在同一工作表上施加多个页面时。 例如,如果XObject没有指定颜色或线宽,但是在引用它时基于有效的颜色和线宽改变其外观,由于外观的变化,渲染结果的缓存是无效的。 如果XObject包含透明元素,则必然会将现有背景与XObject混合,从而出现类似情况。 为了便于XObject缓存,PDF / VT引入了Encapsulated XObjects的概念,可以将其标记(使用GTS_Encapsulated键)。 Encapsulated XObject必须满足某些便于缓存的规则。

所有这些条目都是可选的:PDF / VT不需要对重复的图形内容进行任何优化,但使用它们可以在支持PDF / VT的RIPs中提供显着的打印性能优势。

显示和打印PDF / VT文档

PDF / VT文档是纯PDF文件加上某些附加功能。但是,PDF / VT的添加不会影响页面呈现:PDF / VT文档的页面可以使用普通的PDF查看器查看,也可以使用支持PDF的RIP进行渲染,这些页面可能不直接支持PDF / VT,例如: Acrobat或第三方PDF查看器或RIP。 但是,必须谨慎对待某些方面:

    PDF / VT中的颜色管理功能需要PDF渲染器,它完全使用ICC配置文件实现颜色管理。 这与现有的PDF / A和PDF / X标准相似,后者也要求色彩管理。 现代PDF查看器完全支持PDF / VT查看的颜色相关要求。
    文档部件层次结构,文档部件元数据(DPM)和重复图形内容的优化对普通PDF查看器没有任何影响。
    PDF / VT-2允许使用外部引用的页面内容。 在Acrobat中,外部引用需要仔细配置才能获得所需的效果。
    PDF / VT-2s包不是PDF文档。 在使用普通PDF查看器查看文档之前,必须解压缩PDF / VT-2s MIME包的内容。

关于PDF / VT的常见误解
在各种出版物中,有关PDF / VT的一些错误信息已经传播开来。 让我们直截了当地得到以下几点:

    尽管名称不同,PDF / VT不包含任何变量:所有页面都包含或引用最终内容,没有任何动态内容创建或文档格式的空间。 同样,Acrobat显示除可变数据部分之外的PDF / VT文档的说法是错误的。
    虽然PDF / VT-2s是专为流式PDF生成而设计的,但创建PDF / VT文档无法与消费/打印交错,因为PDF文档(PDF / VT或其他)必须在渲染开始之前完全可用。 此规则的唯一例外是用于Web交付的线性化PDF,但此技术已针对在浏览器中快速呈现第一个PDF页面进行了优化,而不是在仍在创建文档的其余部分时打印数千页。
    PDF / VT确实可以实现的方案如下:PDF / VT-2s包中包含多个文档,这些文档通过MIME包中的网络流式传输。 只要包中的文档的所有必需块都可用,就可以为该文档启动呈现,而此时同一MIME包中的其他文档还在网络传输中。

PDF / VT和PDF / A

PDF / VT-1文档可以同时符合PDF / A进行存档(ISO 19005)。 这意味着发送到数字打印机的同一文档可以以PDF / A格式存档。 PDF / VT-2不能与PDF / A结合使用,因为PDF / A中不允许外部引用。 由于PDF / A-1基于PDF 1.4,因此组合的PDF / VT-1 + PDF / A-1文档必须限于PDF 1.4中的功能。 特别是,不能使用透明度和层。 对于基于ISO 32000-1的PDF / A-2和PDF / A-3,即PDF 1.7,此限制不适用。

本文由职坐标整理并发布,希望对同学们有所帮助。了解更多详情请关注职坐标大数据云计算大数据安全频道!

本文由 @小标 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved

208小时内训课程