檔案的最小單位是文件的件(頁(yè))數(shù),建立文件級(jí)目錄數(shù)據(jù)庫(kù)是一項(xiàng)基礎(chǔ)性工作,建立完整、準(zhǔn)確的文件級(jí)目錄數(shù)據(jù)庫(kù),可以有效地利用計(jì)算機(jī)實(shí)現(xiàn)檔案以件(頁(yè))為基本單位的管理,提高檔案的查全率、查準(zhǔn)率。一個(gè)高質(zhì)量的數(shù)據(jù)庫(kù)中的數(shù)字信息至少要達(dá)到四項(xiàng)質(zhì)量標(biāo)準(zhǔn),即數(shù)據(jù)的準(zhǔn)確性,數(shù)據(jù)項(xiàng)目和內(nèi)容的完整性,數(shù)據(jù)的規(guī)范性和數(shù)據(jù)的穩(wěn)定性。為此,應(yīng)首先制定目錄數(shù)據(jù)庫(kù)數(shù)據(jù)規(guī)范,包括數(shù)據(jù)字段長(zhǎng)度、字段類型、字段內(nèi)容要求(值域)等。目錄數(shù)據(jù)庫(kù)數(shù)據(jù)規(guī)范的制定應(yīng)符合《檔案著錄規(guī)則》(DA/T18)對(duì)檔案著錄的要求。在紙質(zhì)檔案目錄準(zhǔn)備與目錄數(shù)據(jù)庫(kù)建設(shè)工作中均應(yīng)嚴(yán)格遵守。
選擇數(shù)據(jù)庫(kù)時(shí)應(yīng)考慮建立在計(jì)算機(jī)環(huán)境下,能夠有效、準(zhǔn)確、完整、安全,并可以上網(wǎng)利用的格式,且此格式可轉(zhuǎn)換為通用數(shù)據(jù)格式,以便于數(shù)據(jù)交換。如:在目錄建庫(kù)時(shí)可以選擇能直接或間接通過(guò)XML文件格式進(jìn)行數(shù)據(jù)交換的數(shù)據(jù)庫(kù)類型。
設(shè)計(jì)庫(kù)結(jié)構(gòu)
科學(xué)合理地設(shè)計(jì)數(shù)據(jù)庫(kù)結(jié)構(gòu)應(yīng)包括確定檔案目錄的著錄項(xiàng)、必輸項(xiàng)和選輸項(xiàng)、字段類型、長(zhǎng)度和值域范圍等內(nèi)容。數(shù)據(jù)庫(kù)結(jié)構(gòu)的設(shè)計(jì)還應(yīng)特別注意保持檔案的內(nèi)在聯(lián)系,有利于紙質(zhì)檔案數(shù)字化成果的管理和利用。
檔案保管機(jī)構(gòu)的檔案來(lái)自各個(gè)立檔單位,檔案目錄等檢索工具是由文檔等人員在檔案管理規(guī)范標(biāo)準(zhǔn)指導(dǎo)下形成的。但是,由于文檔人員變動(dòng)頻繁、檔案業(yè)務(wù)指導(dǎo)面多線長(zhǎng),加之個(gè)別文件形成時(shí)的先天不足或是檔案整理工作的缺失給檔案著錄帶來(lái)諸多問(wèn)題。因此,在進(jìn)行目錄數(shù)據(jù)錄入前,如確有必要,可以結(jié)合實(shí)際拋開(kāi)原有的紙質(zhì)檔案案卷目錄、文件目錄,依據(jù)整理糾正后的檔案實(shí)體,按照《檔案著錄規(guī)則》的要求據(jù)實(shí)著錄,把題名不反映主題、目錄與實(shí)體不符等一系列問(wèn)題一并處理。
按照檔案著錄的結(jié)果進(jìn)行文件目錄及案卷目錄數(shù)據(jù)的規(guī)范輸入。此外,還應(yīng)將紙質(zhì)檔案數(shù)字化前處理工作中對(duì)紙質(zhì)檔案目錄進(jìn)行修改、補(bǔ)充的備注結(jié)果一并錄入數(shù)據(jù)庫(kù),形成準(zhǔn)確、完整的目錄數(shù)據(jù)。
目錄數(shù)據(jù)的規(guī)范錄入應(yīng)滿足四方面需要:
一是準(zhǔn)確,各著錄項(xiàng)數(shù)據(jù)輸入準(zhǔn)確,符合檔案著錄要求??梢圆捎脝螜C(jī)或雙機(jī)錄入目錄數(shù)據(jù),通過(guò)人工校對(duì)或軟件自動(dòng)校對(duì)錄入結(jié)果,以確保目錄數(shù)據(jù)錄入的準(zhǔn)確性。為有效降低出錯(cuò)率,推薦采用雙機(jī)錄入的方法提高數(shù)據(jù)質(zhì)量。
二是完整,文件題名、責(zé)任者、時(shí)間等必輸項(xiàng)無(wú)遺漏,并能夠滿足檔案檢索的需要。
三是檔案出庫(kù)、前處理、掃描等數(shù)字化加工階段利用的字段無(wú)遺漏。
四是數(shù)據(jù)錄入、校對(duì)、質(zhì)檢、驗(yàn)收、交接等標(biāo)明責(zé)任的字段自動(dòng)生成。
采用計(jì)算機(jī)自動(dòng)校對(duì)與人工校對(duì)相結(jié)合的方式,對(duì)目錄數(shù)據(jù)的質(zhì)量進(jìn)行檢查,包括著錄項(xiàng)目的完整性、著錄內(nèi)容的規(guī)范性和準(zhǔn)確性等。發(fā)現(xiàn)不合格的數(shù)據(jù)應(yīng)及時(shí)進(jìn)行修改或重錄。
為確保數(shù)據(jù)錄人質(zhì)量,目錄數(shù)據(jù)的檢查可以全宗的一個(gè)或多個(gè)目錄為單元,對(duì)條目數(shù)量及其著錄項(xiàng)內(nèi)容的準(zhǔn)確性進(jìn)行逐條、逐項(xiàng)檢查。
能夠采用計(jì)算機(jī)自動(dòng)檢驗(yàn)的項(xiàng)目應(yīng)采用計(jì)算機(jī)自動(dòng)檢驗(yàn)的方式進(jìn)行100%檢驗(yàn),檢驗(yàn)合格率應(yīng)為100%。對(duì)于無(wú)法用計(jì)算機(jī)自動(dòng)檢驗(yàn)的項(xiàng)目,可根據(jù)情況以件或卷為單位采用抽檢的方式進(jìn)行人工檢驗(yàn)。
檢查完成后,填寫《數(shù)據(jù)錄入工作單》,示例見(jiàn)表:
文章來(lái)源:《紙質(zhì)檔案數(shù)字化的流程與方法》