專業(yè)的文檔數(shù)字化服務(wù)
中博奧公司還可以為您提供專業(yè)的文檔整理、掃描服務(wù),擁有100多人的專業(yè)隊伍,10多名經(jīng)驗(yàn)豐富的項目經(jīng)理,60多臺高速掃描設(shè)備。成熟的管理流程,為各企事業(yè)單位提供了約1億頁的文檔整理、掃描服務(wù)。
一、檔案數(shù)字化概述
檔案是人類活動的真實(shí)記錄,是人們認(rèn)識和把握客觀規(guī)律的重要依據(jù)。借助檔案,我們能夠更好地了解過去、把握現(xiàn)在、預(yù)見未來。檔案事業(yè)是黨和國家事業(yè)發(fā)展的一個不可缺少的方面,是一項崇高的事業(yè)。
檔案是一項記錄歷史、傳承文明、積累知識和經(jīng)驗(yàn)的事業(yè), 涉及各個領(lǐng)域和行業(yè),是各項建設(shè)事業(yè)發(fā)展的重要基礎(chǔ)之一。
隨著大數(shù)據(jù)時代的來臨,大數(shù)據(jù)擁有者將大放異彩。
處在大數(shù)據(jù)時代的檔案事業(yè), 將朝社會化、多元化、開放性和先進(jìn)性發(fā)展,幫助人們洞察大數(shù)據(jù)帶來的大價值。檔案大數(shù)據(jù),其特點(diǎn)表現(xiàn)在一方面可以提供政府企業(yè)運(yùn)行的依據(jù),支持核心生產(chǎn)力與應(yīng)用,另一方面檔案仍對合規(guī)、電子取證、安全、診斷以及其他支持性應(yīng)用程序有相當(dāng)大的價值。將成為政府、企業(yè)集團(tuán)、機(jī)關(guān)事業(yè)單位、學(xué)校、金融等行業(yè)的無形資產(chǎn)。
中博奧長期從事檔案數(shù)字化工作,目前,已經(jīng)擁有一批專門的檔案整理人員,都經(jīng)過了專業(yè)檔案管理者的細(xì)致培訓(xùn),也在實(shí)踐中得到過充分鍛煉,文化水平較高,思路清晰,邏輯性強(qiáng),有一定的提煉和總結(jié)能力;完全能達(dá)到檔案數(shù)字化工作安全性、完整性、正確性、復(fù)雜性、權(quán)威性的要求。
二、檔案數(shù)字化內(nèi)容
所謂檔案數(shù)字化、信息化就是利用計算機(jī)掃描技術(shù),采用專業(yè)的掃描儀、高拍儀和數(shù)碼相機(jī)等數(shù)碼設(shè)備對紙質(zhì)檔案進(jìn)行數(shù)字化加工,將紙質(zhì)、縮微膠片、底片等載體上的檔案信息作數(shù)字化處理,生成數(shù)字影像文件進(jìn)行存貯,并將檔案檢索信息輸入計算機(jī),采用計算機(jī)檔案管理系統(tǒng)進(jìn)行管理和開發(fā)利用。
檔案數(shù)字化的主要內(nèi)容:
第一是檔案目錄信息的數(shù)字化,建立檔案目錄數(shù)據(jù)庫;
第二是各種載體檔案的數(shù)字化,如紙質(zhì)檔案、檔案縮微品、照片檔案及錄音錄像檔案等的數(shù)字化,建立檔案圖像數(shù)據(jù)庫或多媒體數(shù)據(jù)庫;
第三是各類檔案專題信息的采集與建庫。
目前,檔案室保存的檔案信息形態(tài)主要以紙質(zhì)、縮微膠片和底片等載體形式存在,只適應(yīng)于傳統(tǒng)的管理與傳播方式,即實(shí)施手工管理和以點(diǎn)到點(diǎn)的傳播,即便是經(jīng)過編研等初步加工,編輯印發(fā)檔案資料,實(shí)現(xiàn)以點(diǎn)到面的傳播,其覆蓋面也還是太小,很難達(dá)到社會化程度。檔案信息資源的經(jīng)濟(jì)價值和社會價值也難以充分實(shí)現(xiàn),更難適應(yīng)當(dāng)代“數(shù)字化生存” 的形勢。
檔案數(shù)字化以后,對檔案的現(xiàn)代化管理、使用和傳播等都具有很重要的作用。
首先,檔案數(shù)字化能有效地保護(hù)檔案原件。
1.代替原件使用,把原件妥善地保存起來,便可以有效地延長原件的保存時間。
2.數(shù)字化副本分地保存。對那些需要長期或永久保存的重要檔案,可以用數(shù)據(jù)備份的方法制成多份數(shù)字化副本的備份分地保存。
3.恢復(fù)檔案材料模糊褪變的字跡。有些檔案材料由于紙張、字跡和保管條件等因素,字跡出現(xiàn)了模糊擴(kuò)散或褪變。這種檔案可以經(jīng)過計算機(jī)掃描技術(shù)生成數(shù)字影像,再利用計算機(jī)圖像處理技術(shù)就可以恢復(fù)模糊褪變字跡,其次,檔案數(shù)字化能改善檔案的利用方式。
檔案的數(shù)字化副本以其積極的、動態(tài)的特性改變了長久以來的檔案利用方式
1.不再受“孤本”的限制。
2.異地調(diào)閱,數(shù)字影像文件可以通過計算機(jī)局域網(wǎng)或者廣域網(wǎng)進(jìn)行異地傳輸,使異地調(diào)閱利用成為可能。擴(kuò)大了檔案的利用空間,讓更多的人們來了解檔案,利用檔案。
3.“時間”不再是限制,利用者可以隨時使用自己需要的文件。數(shù)字化以后,將已開放的檔案上網(wǎng),這樣所有利用者就可以在任何時間上網(wǎng)利用檔案信息資源。
二、檔案數(shù)字化流程及細(xì)節(jié)
1.資料移交
首先要將資料從檔案室移交到加工現(xiàn)場的臨時庫房。在轉(zhuǎn)移之前,雙方共同在資料室完成資料的逐冊清點(diǎn)工作,并登記承接時間、總冊數(shù),并有雙方負(fù)責(zé)人在清單上簽字。清點(diǎn)交接工作必須認(rèn)真仔細(xì),逐筆核對,不允許出現(xiàn)任何差錯。這些信息作為資料歸還時檢查的參考依據(jù)。本步驟完成后,將會形成《移交清單》。
2.資料拆分
資料的整理和拆分時,資料拆分人員按照《資料拆分工作說明書》的要求進(jìn)行資料拆分工作,并填寫移交清單(此移交清單是資料拆分人員和項目經(jīng)理共同填寫)簽字后領(lǐng)取并進(jìn)行資料拆分。
3.資料掃描
原件的掃描與存儲格式完全按照國家檔案管理的統(tǒng)一標(biāo)準(zhǔn)要求掃描。資料掃描設(shè)置專業(yè)崗位和補(bǔ)掃崗位;補(bǔ)掃崗位主要負(fù)責(zé)改正圖像質(zhì)檢發(fā)現(xiàn)的問題。
通過掃描,紙質(zhì)資料數(shù)字化為電子資料。本步驟是資料數(shù)字化的核心和基礎(chǔ),直接影響對于紙質(zhì)資料獲取數(shù)字化信息的好壞。
掃描過程對掃描后的文件質(zhì)量影響主要參數(shù)是:掃描分辨率(DPI)、色彩(黑白、灰度、彩色)、存儲格式(JPG、TIFF、PDF)、明暗度和對比度。
按照技術(shù)指標(biāo),掃描時應(yīng)根據(jù)資料紙張的質(zhì)地,底色,薄厚程度,可拆或不可拆制定掃描方案,確保在掃描圖像質(zhì)量清晰的情況下,使原件完好無損。
4.圖像處理
掃描后的原始圖像需要進(jìn)行優(yōu)化處理,使得成品圖像清晰、端正。根據(jù)掃描后的具體情況,圖像要進(jìn)行如下處理:圖像旋轉(zhuǎn)、校正還原,以符合閱讀習(xí)慣;圖像去原始信息外臟點(diǎn)、斑點(diǎn)去除,如去黑點(diǎn)、黑線、黑框、黑邊等。處理過程中應(yīng)遵循保持原貌的原則。
5.插圖頁面處理
資料中有插圖的要在掃描時對掃描閥值做相應(yīng)調(diào)整,如黑插圖用灰度掃描不清楚時,應(yīng)該用其他色彩掃描,在保持原始頁面信息的同時使圖像清晰可辯。
6.圖像質(zhì)檢
圖像質(zhì)檢設(shè)置崗位由項目經(jīng)理兼任,負(fù)責(zé)每天抽檢比例不低于圖像處理總量的10%;
圖像質(zhì)檢也是對掃描工序的第二次校驗(yàn)(二校),主要對兩方面的情況進(jìn)行檢查:
圖像數(shù)量:對處理的圖像數(shù)量是否同原書數(shù)量一致、圖像是否存在重掃、漏掃的情況。
圖像質(zhì)量:對圖像是否清晰、可閱讀,是否字跡斷連、字跡過深,是否達(dá)到掃描要求的分辨率。
對文本域錄入與文本錄入域的標(biāo)引、文件的頁號及頁數(shù)進(jìn)行對比,對掃描前的圖像頁的標(biāo)引與掃描后的圖像頁的編號與頁數(shù)進(jìn)行對比,發(fā)現(xiàn)不合格的登記清單并退回上一流程重新處理。
7.資料裝訂還原
資料圖像成品檢查合格后,移交客戶前需要裝訂還原,根據(jù)原稿拆分時的情況按照騎馬釘、斜釘、書式塑料裝訂等方式裝訂還原。
8.圖像與索引掛接
文本域錄入和掃描處理檢驗(yàn)后的圖像成品,按年度進(jìn)行文字圖像與系統(tǒng)的掛接,不需手工掛接即可實(shí)現(xiàn)文本與圖像頁與系統(tǒng)的掛接。掛接到檔案管理系統(tǒng)中后,進(jìn)行再次的成品驗(yàn)收,對各種使用習(xí)慣逐頁進(jìn)行檢驗(yàn),驗(yàn)收合格后移交驗(yàn)收小組驗(yàn)收。
8.?dāng)?shù)據(jù)移交
通過網(wǎng)絡(luò)傳輸或硬盤方式移交成品數(shù)據(jù)。成品數(shù)據(jù)包括:單層PDF文件、TIFF圖像、《備注說明》(原書出現(xiàn)殘缺、重頁、水淹、火燒、圖像不清、空白頁、插頁、插圖,提交數(shù)據(jù)的總數(shù)與原書的總數(shù)不一致等情況)文檔。
9.檔案數(shù)字化加工流程
資料交接(填寫移交清單雙方簽字)和查重(重復(fù)資料的審核,客戶確認(rèn)后剔除)→→資料拆卷(起釘、書式塑料金屬裝訂物剔除),檢查紙張情況及內(nèi)容書寫清晰度→→資料分頁掃描(按厚薄、顏色、閥值調(diào)整掃描參數(shù))→→圖像修圖(糾偏、校正、清晰度調(diào)整、裁邊)→→圖像質(zhì)檢及無損壓縮(多頁TIF或PDF成品壓縮)→→圖像命名(PDF命名格式、命名字段規(guī)則)→→資料裝訂還原(騎馬釘、斜釘、書式塑料裝訂、書式金屬圈裝訂等)→→圖像與索引掛接→→資料移交(按移交表清點(diǎn)無誤后雙方簽字確認(rèn)裝箱)→→數(shù)據(jù)備份(硬盤或服務(wù)器雙備份)→→成品驗(yàn)收(按批次打印加工臺賬清單,移交目錄造冊;客戶驗(yàn)收通過簽訂驗(yàn)收合格書)