Office Open XML ECMA-376标准文件阅读记录(一)

前言

工作离不开Excel,最近更是又要对大量Excel表格进行合并、汇总、计算、拆分等 。把以前写的代码花了几天改了改,虽然是解决了这些工作内容 , 但总感觉这种解决方式不够优雅 。想了想还是把ECMA-376标准文件拿出来读一遍,根据标准文件来写一个相对完善的底层库,让自己的代码能够勉强看得过去吧 。

一、Office Open XML 简介

Office Open XML (Open XML) 是一种国际认可的文件格式标准,Office 软件套件实施这种标准来保存和交换信息 。
Open XML 标准的主要目标之一是可与编写该标准时已存在的 Microsoft Office 文档集完全兼容 。
Open XML 为 Office 软件实施者提供一个支持各种功能的标准 。这些功能包括互操作性、存档保护、扩展性、与现有 Microsoft Office 文档的兼容性 , 等等 。
Open XML 可提供广泛支持 。例如:Mac 产品 iWork , Linux 操作系统上来自 OpenOffice.org 的产品,Windows 操作系统上,Microsoft Offic等均能够使用 Open XML 文件 。

二、ECMA-376 标准

【Office Open XML ECMA-376标准文件阅读记录(一)】Open XML 格式由名为 ECMA(欧洲计算机厂家协会) 的标准组织定义 。定义 Open XML 的特定文档是 ECMA-376 标准 。
另一个全球标准组织是国际标准化组织 (ISO),它也提供一项 Open XML 标准,称为 ISO/IEC 29500 。
ECMA-376 标准的第 2 版与 ISO 29500 的 Strict 版本相同 。
ECMA-376 标准用于指定 Open XML,它描述了创建、编辑和保存 Open XML 文件所需的要求 。它提供有关构成 Open XML 的标记语言的信息 。它说明用于 Open XML 文件的打包约定 , 并介绍了软件供应商可用于构建该标准的自定义扩展的机制 。ECMA-376 还介绍该标准的用于维护向后兼容性的功能 。

三、Office 软件商 Open XML 实现的样子

我们使用WPS软件新建一个XLSX格式的Excel电子表格文件,例如:“人员信息表.xlsx”,然后将拓展名由.xlsx修改为.zip , 解压后我们将看到以下文件结构:
_rels
---_rels.
docProps
---app.xml
---core.xml
---custom.xml
xl
---_rels
------workbook.xml.rels
---theme
------theme1.xml
---worksheets
------sheet1.xml
------sheet2.xml
------sheet3.xml
---sharedStrings.xml
---style.xml
---workbook.xml
我们打开xl文件夹中的worksheets文件夹 , 然后打开sheet1.xml,将看到以下内容:
0


四、最后

现在虽然我们已经获得了Office文件的Open XML文件 , 但是其中如[Content_Types.xml]等文件的含义,以及文件内容中如row等标签 , 我们均不了解其代表的含义 。接下来,我们就将开始阅读ECMA-376(Office Open XML)标准文件 , 看看能不能通过标准文件将这些文件、标签等内容的含义弄明白 。

相关经验推荐