职文格式职文范文,职文范文

更新时间:2023-12-20 作者:用户投稿原创标记本站原创 点赞:22986 浏览:105503

设计文档

毕设所解决问题

诸多文献数据库格式的统一和互相之间的自动转化

实现PDF,Office等文字处理软件的自动提取参考文献的功能

实现相应的数据库管理功能和GUI

整体设计思路

调查各文献数据库格式,整合主要文献数据库的标准格式

通过BibTex作为各个文献数据库格式间转化的中间格式并对其进行设计使得标准文献数据库格式之间的转化从一个N:M的形式转换成1:N的形式.

即:标准的各类文献数据库格式——>,BibTex——>,转化成其他标准文献数据库格式.又由于文献数据的特殊性,即其本身又可分为论文,着作,书籍,会议等诸多种类,因此在标准的各类文献数据库格式转化成为BibTex的时候实际上是转化成为一种标准的文献类型(即Bibliographyentries),而这种文献类型在数据库中的表现即为一种按文献类别分类的数据表格.据此,上面的2段转化模式应该更改为:

标准的各类文献数据库格式——>,转化成为14中标准的文献类型之一,即转化为某种表格数据——>,提取成为包括BibTex在内的某种既定合适的格式.

通过PDFbox等相关的提取工具对PDF和Office等文字处理软件进行提取

具体步骤:1)定位提取的内容

2)使用工具进行相关提取

3)判断属于哪种文献数据库格式

4)通过2中所述的2段转化模式进行转化

作为整个文献管理系统的一部分,该GUI所承载的功能如下:

1)显示每个已收录的标准文献数据库格式

2)对输入的某个或者某些文献数据库格式进行判定,分别确定其属于某个已经收录的文献数据库格式标准,并给出反馈

3)对于用户给出的文献数据库格式转化要求,只要在已收录范围内的都能转换

4)从PDF和Office中提取文献数据部分,并能对提取的部分实现1),2),3)中所示的功能

其GUI简图见PDF

BibTex的标准格式

BibTexx

@article{10.1109/TC.2001.970573,

author等于{D.LeeandJ.ChoiandJ.H.KimandS.H.NohandS.L.MinandY.ChoandC.S.Kim},

title等于{LRFU:ASpectrumofPoliciesthatSubsumestheLeastRecentlyUsedandLeastFrequentlyUsedPolicies},

journal等于{IEEETransactionsonComputers},

volume等于{50},

number等于{12},

issn等于{0018-9340},

year等于{2001},

pages等于{1352-1361},

doi等于{doi.ieeeputersociety./10.1109/TC.2001.970573},

publisher等于{IEEEComputerSociety},

address等于{LosAlamitos,CA,USA},

}

BibTex的文献类型

articleentry

bookentry

bookletentry

conferenceentry

inbookentry

incollectionentry

inproceedingsentry

manualentry

mastersthesisentry

miscentry

phdthesisentry

proceedingsentry

techreportentry

unpublishedentry

数据库模式中应该包含的14中表格模式

articleentry

AtrIDTitleJournalYearVolumeNumberPagesMonthNoteKID

bookentry

AtrIDTitlePublisherYearVolumeSeriesAddressEditionMouthNoteKIDbookletentry

TitleAtrIDHowpublishedAddressMouthYearNoteKID

conferenceentry

AtrIDTitleBookTitleYearEdIDPagesOrganizationPublisherAddressMouthNoteKID`inbookentry

AtrIDTitlechapterPublisherYearVolumeSeriesAddressEditionMouthNoteKID`incollectionentry

AtrIDTitleBookTitleYearEdIDPagesOrganizationPublisherAddressMouthNoteKID`inproceedingsentry

AtrIDTitleBookTitleYearEdIDPagesOrganizationPublisherAddressMouthNoteKID`manualentry

TitleAtrIDOrganizationAddressEditionMouthYearNoteKIDmastersthesisentry

AtrIDTitleSchoolYearAddressMouthNoteKID

miscentry

AtrIDTitleHowpublishedMouthYearNoteKID

phdthesisentry

AtrIDTitleSchoolYearAddressMouthNoteKID

proceedingsentry

TitleYearEdIDPublisherOrganizationAddressMouthNoteKID

techreportentry

AtrIDTitleInstitutionYearTypeNumberAddressMouthNoteKID`unpublishedentry

AtrIDTitleNoteMouthYearKID

以上诸表格的AtrID,EdID,KID三项需另有

AtrIDAuthorName

EdIDEditorName

KIDKey

依据BibTex做出的数据库表格设计

Table1

CKeyAuthorIDTNameJournalVLIssueYearPagesDoiPublisherAddressKeyWID Table2

AuthorIDAuthorName


Table3

KeyWIDKeyW

收录的文献数据库格式

中华人民共和国国标

AuthorIDBNameKdOtherArsEditionPublishPPublisheryrNoEditorIDannotation1)专着

AuthorIDAuthorName

OtherArsOtherArsName

EditorIDEditorName

2)连续出版物

PNameAuthorIDEditionVLPublishPPublisheryrEditorIDannotation

AuthorIDAuthorName

EditorIDEditorName

3)专利文献

AuthorIDTitleOtherArsannotationKdCountyPatentKdPatentNoDate

AuthorIDAuthorName

OtherArsOtherArsName

4)专着中析出的文献

【不清楚Citation_key是否必要,在下面的表中都没有注明了...不太清楚Citation_key是不是对任何类型的文献数据库格式都适用(为了防止数量多的时候的重复情况发生,而且是按一定方式自动生成了,所以列表的时候可以不列出来)】

AuthorIDTitleOtherArsOriginalAIDOriginalTitleEditionPublishPPublisheryrPlace

AuthorIDAuthorName

OtherArsOtherArsName

OriginalAIDOriginalAuthorName

5)连续出版物中析出的文献

AuthorIDTitleOtherArsOriginalTitleEditionPublishPPlace

AuthorIDAuthorName

OtherArsOtherArsName

OriginalAIDOriginalAuthorNameVLDB会议(AuthorID需另建表同上所示)

会议论文格式

AuthorIDTitleConferenceNamePagesYear

期刊格式

AuthorIDTitleJournalNameVolPagesYear

AuthorIDTitleBNameEditionPublishPPublisherYear书的格式

技术报告格式

AuthorIDTitleReportNoInstitutionPagesYear

SIGMOD会议

软件学报

1)期刊

AuthorIDTitleJournalNameYearVolPages

2)会议

AuthorIDTitleConferenceNameYearPages