用于生物信息学的可扩展标记语言

更新时间:2024-01-17 作者:用户投稿原创标记本站原创 点赞:33661 浏览:156317

E.塞拉米著

生物信息学代表了科学查询的一个新领域,是专门利用计算资源来回答有关生命的问题.生物信息学的关键性目标是创建能够储存及分析大的生物数据集合的数据库系统与软件平台.鉴于生物数据集合的多样性、生物数据按指数律地增加以及希望能为开放式科学交换共享数据,生物信息学界在不断地探索数据表示、存储及交换的新选择.在过去的几年中,许多生物信息社团转向了使用可扩展标记语言(XML)来满足与生物数据相关的迫切需求.XML正在迅速地成长为生物信息学与生物数据交换的关键性工具.它已成功地用于表示不断增加的生物学数据集合,包括核苷酸、蛋白质序列、基因组注释、蛋白质间相互作用及信号转导途径.XML还构成了生物数据交换的骨架,使研究人员能够从多个异构数据源中聚集数据.

本书用具体的生物信息学样本及实例研究来说明所有XML的核心概念,包括XML基础、文档类型定义(DTD)、XML名空间、XML模式、Perl和Ja中XML的语法分析、万维网怎么写作及简单对象访问协议(SOAP).书中所使用的例子和实例研究都是从内容广泛的生物信息学应用程序中挑选的,包括了生物信息学序列标记语言(BL)、美国国家生物信息中心(NCBI)的电子读取(E-Fetch)、分布式注释系统(DAS)和美国国家癌症研究所癌症生物信息基础结构对象(caBIO)项目.

全书共有9章.第1章生物信息学的XML的介绍;第2章XML和BL基础;第3章用于信息生物学的DTD;第4章用于生物信息学的XML模式;第5章在Perl中对NCBIXML的语法分析;第6章DAS;第7章用XML简单应用程序接口对DAS数据的语法分析;第8章用JDOM对DAS数据的语法分析;第9章用于生物信息学的万维网怎么写作.两个附录分别为核苷酸基本代码和氨基代码.


阅读本书不需要掌握任何XML知识,本书可供从事生物信息学的研究人员及研究生阅读参考.

胡光华,高级软件工程师

(原中国科学院物理学研究所)