格式的困惑

更新时间:2024-03-30 作者:用户投稿原创标记本站原创 点赞:19263 浏览:91091

在技术快速发展的今天,数字内容产品的格式层出不穷,对于开展数字出版工作具体业务的传统出版机构而言会面临很多困惑,困惑于哪些才是核心要存储的格式;困惑于当有新的技术产生,以前数字内容产品存储的格式未来无法应用怎么办;困惑于格式是否有通行的标准满足于未来应用的拓展等等.数字内容产品格式的选择问题犹如悬在数字出版工作之上的“达摩斯之剑”一直困扰着大家.

文件格式是什么

文件格式是指电脑为了存储信息而使用的对信息的特殊编码方式,用于识别内部储存的资料.任何一种类型的信息都可以一种或多种文件格式保存在我们的计算机中.比如同样一段文字加图片的信息,我们既可以存为word格式,也可以存为PDF格式等.每一种文件格式通常会有一种或多种扩展名可以用来识别.扩展名可以帮助应用识别文件格式.

有些文件格式被设计用于存储特殊的数据,文本类的文件有:Text文件一般仅存储简单没有格式的ASCII或Unicode的文本;HTML文件则可以存储带有格式的文本;PDF格式则可以存储内容丰富的,图文并茂的文本.

传统出版模式下以呈现的纸质产品为终极目标,电子文件仅仅是出版过程中无关轻重的一环,格式问题不存在任何困惑.

数字内容产品则不同,因为用户获得产品的终端不同、平台不同、应用的模式不同,导致数字内容产品在分发时都存在着与软硬件对接与兼容的问题,适应不同平台、不同应用模式的问题,格式的困惑也由此而生.


格式的分类

数字内容产品在终端并未形成规范的标准,所以相关的格式品种也极其繁多.如下表:

不同格式的对比:

通过以上两个表,我们对市面上主流的数字内容产品的格式有了一个总体的把握,其中所列举的格式也有一定的代表性.综上,XML文件做为数据存储、数据交换的基础性文件格式,在数字出版领域已经成为数据格式标准,广泛应用于数字出版案例中.

另外众所周知的PDF格式文件能达到具有纸版书的质感和阅读效果,并且可以“逼真地”展现原书的原貌.由于其普及率高已成为了数字化信息事实上的一个工业标准.

EPub于2007年9月成为国际数位出版论坛(IDPF)的正式标准,以取代旧的开放OpeneBook电子书标准,它代表了未来数字内容产品的方向,最关键的在于,EPUB元数据是XML,EPUB内容是XHTML,所以它与XML有天然的联系.

由此,传统出版机构在进行数字出版时,需要存什么格式的数字内容文件,就有一个基本的思路及方案了.

我们需要什么样的格式

首先,数字内容产品的元数据进行结构化加工后以XML格式存储.正文内容有两种存储方案,一种依然存成XML(优势:结构化、应用广泛、拓展性强;劣势:数字化成本高);另一种存为PDF格式(优势:现在的事实上标准、PC端应用广泛;劣势:在小尺寸的终端应用效果差).具体实施中,结构化程度高且有价值的数字化内容建议加工为XML格式;对于结构化程度偏低的数字化内容建议制作为PDF格式.

虽然技术发展很快,但依然有其规律可循,那就是选择通用的、覆盖面较大、开放的格式作为存储格式的依据.做到这一点,传统出版机构的数字出版工作的开展才能事半功倍,不至于走弯路.在数字出版工作中,技术始终起到引领作用,需要保持对最新技术的敏感,新的格式就是新技术应用的体现.比如,2011年,5月23日InternationalDigitalPublishingForum(以下简称IDPF)正式确定EPUB3标准:支持多媒体格式,可在电子书里面播放视频、音频内容;支持现实数学格式等复杂的文本内容;支持文字朗读技术;支持非罗马文字格式,比如日语、汉语和阿拉伯语,让这几种语言格式的电子书内容被检索;更好地支持DAISY有声书标准,为盲人提供听书怎么写作.综上,可以看出这个新的格式标准(EPUB3)的推广与应用将能够显示更丰富的内容,给读者带来更多交互体验.

总之,新格式将会对作者生产内容、读者消费内容的方式产生深远的变化.只有我们保持开放的心态,追随科技的脚步,我们才能抛开悬在我们头上的“达摩斯之剑”,让新技术及其带来的格式成为我们不断前行的加速剂.