“喚醒”古籍!探訪文溯閣《四庫全書》數字化影印出版工程(人民眼·讓文物活起來③)

圖①:讀者古籍數字科技中心工作人員對文溯閣《四庫全書》數字化文件進行質檢。本報記者 王錦濤攝 圖②:甘肅省圖書館依托文溯閣《四庫全書》開發的文創產品。圖③:甘肅省圖書館文溯閣《四庫全書》藏書館工作人員巡查書庫。圖②③均為甘肅省圖書館提供 圖④:甘肅省圖書館文溯閣《四庫全書》藏書館主樓。本報記者 王錦濤攝引 子登臨蘭州北山九州台,甘肅省圖書館文溯閣《四庫全書》藏書館躍入眼簾——館樓飛簷翹角,踞北山而瞰黃河。自正門入樓,穿鞋套,做登記,進書庫。書庫恒溫恒濕,1128個香樟木書箱層層疊疊,收錄典籍6141函、3474種、36315冊的文溯閣《四庫全書》就安放於箱中。2023年6月,習近平總書記在中國國家版本館中央總館考察調研時,詳細聽取《四庫全書》版本源流、紙張印刷、保護收藏等介紹,叮囑工作人員:“我wo最zui關guan心xin的de就jiu是shi中zhong華hua文wen明ming曆li經jing滄cang桑sang留liu下xia的de最zui寶bao貴gui的de東dong西xi。中zhong華hua民min族zu的de一yi些xie典dian籍ji在zai歲sui月yue侵qin蝕shi中zhong已yi經jing失shi去qu了le不bu少shao,留liu下xia來lai的de這zhe些xie瑰gui寶bao一yi定ding要yao千qian方fang百bai計ji嗬he護hu好hao、珍惜好,把我們這個世界上唯一沒有中斷的文明繼續傳承下去。”《四庫全書》編纂於清代乾隆年間,是我國曆史上規模最大的叢書,修成後謄抄7部,分藏於紫禁城文淵閣、圓明園文源閣、盛京(今沈陽)文溯閣、承德避暑山莊文津閣、杭州文瀾閣等地。目前存世三部半,分別為文淵閣本、文溯閣本、文津閣本,以及被稱為“半部”的文瀾閣殘本。其中,文溯閣本輾轉多地,於2006年入藏現在的藏書館,也是“三部半”中唯一尚未完整影印出版的一部。為了讓書寫在古籍裏的文字活起來,經過長期縝密的籌劃論證,2021年8月,甘肅省正式啟動文溯閣《四庫全書》數字化影印出版工程。目前,文溯閣《四庫全書》數字采集工作已全部完成,數據處理工作完成70%。從現在起至2028年,文溯閣《四庫全書》將按經、史、子、集四部,分期分批推出全套影印版本。數字采集采集方案、流程規範和相關作業標準周密完善約8億字的文溯閣《四庫全書》共有多少頁?數字化之前鮮有人知。“換算為現代書籍頁碼,共488萬多頁。”文溯閣《四庫全書》數(shu)字(zi)化(hua)影(ying)印(yin)出(chu)版(ban)專(zhuan)職(zhi)工(gong)作(zuo)組(zu)組(zu)長(chang)宋(song)學(xue)娟(juan)說(shuo)。作(zuo)為(wei)讀(du)者(zhe)出(chu)版(ban)集(ji)團(tuan)有(you)限(xian)公(gong)司(si)所(suo)屬(shu)的(de)讀(du)者(zhe)古(gu)籍(ji)數(shu)字(zi)科(ke)技(ji)中(zhong)心(xin)總(zong)經(jing)理(li),宋(song)學(xue)娟(juan)過(guo)去(qu)兩(liang)年(nian)多(duo)時(shi)間(jian)帶(dai)領(ling)團(tuan)隊(dui)把(ba)文(wen)溯(su)閣(ge)《四庫全書》從紙上“搬進”了電腦——逐頁掃描、存入,數據資源總量逾700TB(太字節)。“如果用常見的容量32GB的U盤存儲,需要2.2萬多個才能裝下。”宋學娟說。文溯閣《四庫全書》既是曆史典籍,又是珍貴文物。若藏於高閣,難以活化利用;若活化利用,又有損壞之虞。如何破解“藏”“用”兩難?2021年8月,甘肅省委宣傳部製定《文溯閣〈四庫全書〉數字化影印出版工作重啟方案》,力求在保護的同時“喚醒”古籍。古籍真本由甘肅省圖書館提供,數據采集處理、影印出版等工作由讀者出版集團有限公司具體實施。數字化影印出版工程分為“數字采集—數據處理—影印出版及數據庫建設”3個階段。所需經費,部分由中央文化產業發展專項資金、甘(gan)肅(su)省(sheng)財(cai)政(zheng)資(zi)助(zhu),部(bu)分(fen)由(you)讀(du)者(zhe)出(chu)版(ban)集(ji)團(tuan)有(you)限(xian)公(gong)司(si)自(zi)籌(chou)。數(shu)字(zi)采(cai)集(ji),免(mian)不(bu)了(le)要(yao)接(jie)觸(chu)古(gu)籍(ji)真(zhen)本(ben),如(ru)何(he)確(que)保(bao)其(qi)安(an)全(quan)無(wu)損(sun)?甘(gan)肅(su)省(sheng)圖(tu)書(shu)館(guan)和(he)讀(du)者(zhe)出(chu)版(ban)集(ji)團(tuan)有(you)限(xian)公(gong)司(si)製(zhi)定(ding)了(le)周(zhou)密(mi)完(wan)善(shan)的(de)采(cai)集(ji)方(fang)案(an)、流程規範和相關作業標準,“54條數字化工作流程規定,涵蓋前期準備、文獻出庫、數據處理等全部流程。”宋學娟介紹。為保古籍安全萬無一失,文溯閣《四庫全書》藏書館二樓會議室被改造成了數字采集室,做到原書“出庫不出館”。而從書庫到采集室,平常不到一分鍾的路程,藏書館90後館員魏喬波卻要走好幾分鍾:戴上白色手套,細查一遍即將出庫的古籍,再輕輕捧起,就像捧著一碗不能灑出的水,慢慢往樓上“移”,“就怕腳下不穩”。“古籍出庫,要填報11類表格,層層審批。歸還時,所有細節都要對得上。”魏喬波說,以其中的《提書登記表》為例,提取古籍需詳細填報當日采集計劃、提取數量,然後與書庫管理員共同清點每一函、每一冊書,包括函盒、夾板、束帶、銅扣的存缺程度,每一冊古籍的題名、卷數、頁數,以及有無破損、汙跡或黴斑等情況,“這些都要一一記錄在案。一送一回路上、數據采集期間,古籍若有半點閃失,都會被及時發現。”數shu字zi采cai集ji作zuo業ye班ban班ban長chang楊yang旭xu勇yong告gao訴su記ji者zhe,采cai集ji時shi必bi須xu使shi用yong古gu籍ji專zhuan用yong非fei接jie觸chu式shi掃sao描miao儀yi高gao清qing掃sao描miao,且qie光guang源yuan必bi須xu是shi冷leng光guang源yuan。對dui采cai集ji人ren員yuan,甘gan肅su省sheng圖tu書shu館guan的de古gu籍ji專zhuan家jia也ye開kai展zhan了le多duo輪lun培pei訓xun演yan練lian,“既要保證掃描精度與進度,還要避免傷害古籍,翻書的力道不能輕也不能重,要穩而有力。”楊旭勇說。準備周密,工作前期進展順利,意料不到的問題還是出現了。“古籍開本大小相同,厚薄卻不一樣。”宋學娟翻開一本書,拿到一台掃描儀前比劃道,“超3厘米厚的古籍,用這種平板掃描儀掃描,靠近訂口的部分內容很難被有效采集。”為啥?不按壓,無法掃描;按壓,古籍易損,且采集到的內容會變形。怎麼辦?“為保證采集質量,我們追加預算,在已采購10台古籍專用平板掃描儀的基礎上,又購置了兩台V型古籍掃描儀。”宋學娟說,使用這種掃描儀,隻需將書翻開到90度,即可完成掃描采集,問題迎刃而解。2021年12月23日,開機掃描;2022年5月23日,采集告竣。“整整5個月,經過人員倒班,實現每天工作16個小時、一天未休。古籍沒有絲毫受損,函盒沒有增加一道劃痕。”陽光透過窗口,灑在黃底黑字的《文溯閣〈四庫全書〉數字化工作手冊》上,宋學娟長舒一口氣。數據處理數字文件與古籍真本如同孿生,最大程度呈現古籍原貌偌大的房間裏,數十名工作人員神情專注、緊盯屏幕,隻聽見鍵盤敲擊聲此起彼伏。在讀者古籍數字科技中心的數據處理室,采集來的文溯閣《四庫全書》數據,將被加工成標準的數字文件,供後續影印出版和數據庫建設之用。“數據處理有4道流程,圖版處理、一校、二校和質檢存儲。”宋學娟介紹,其中圖版處理是關鍵,主要工作是拚接完整“葉”。葉ye,古gu籍ji特te有you的de量liang詞ci。不bu同tong於yu現xian代dai書shu籍ji,古gu代dai紙zhi張zhang多duo為wei單dan麵mian印yin刷shua,一yi張zhang紙zhi即ji為wei一yi葉ye,書shu冊ce由you一yi葉ye一yi葉ye對dui折zhe後hou裝zhuang訂ding而er成cheng。一yi葉ye,相xiang當dang於yu現xian代dai書shu籍ji的de兩liang頁ye。所suo以yi,數shu字zi采cai集ji到dao的de掃sao描miao件jian實shi則ze都dou是shi半ban葉ye,圖tu版ban處chu理li就jiu是shi讓rang它ta們men合he二er為wei一yi。“最初,我們先在電腦上製作一個標準葉模板,再利用智能軟件,從掃描件上提取文字,貼在模板上。”宋學娟告訴記者,但實際操作中發現,智能軟件可能會漏字、識錯字,且原本每一葉的版式不盡相同,模板統一後,有“失真”之嫌。數字文件與古籍真本,如何保持孿生一般的相同麵貌?“我們摒棄了標準模板,選擇了逐葉拚接,最大程度呈現古籍原貌。”宋學娟說。圖版處理不易,校對任務也很繁重。文溯閣《四庫全書》數據校對人員張靜從事古籍校對工作已有10年,但從未校對過如此海量內容。利用數字技術能夠提速,但一些訛誤很難被發現。不久前,張靜在校對時發現,一個“丸”字疑為“九”字。經仔細核校後確認,果然是因為古籍宣紙裏的植物纖維發生黴變,掃描時多出了這一“點”。起初,一天校對300葉是張靜的上限。“剛開始時平均用力,耗時較多。”她說,而今這個數字翻了近3倍,“慢慢地,哪裏容易出錯、哪裏容易變色,心裏都有了數,效率提高不少。”效率高了,膽子卻小了。“總擔心有錯誤沒能及時發現。”張靜回憶,有次下樓吃午餐,飯剛端上來,她又起身趕忙回到辦公室,“以為忘了標注一處訛誤,打開電腦一看,其實已經做了記錄。”為明確權責,避免誤操作,從圖版處理到一校、二校,再到最後的質檢存儲,文溯閣《四庫全書》數據處理是條“單行道”。電腦之間不能互相訪問,數據傳給下一流程後,前一流程的人員將無權再改。“在數據處理程序軟件和製度流程上,我們有一套完整設計,確保數據資源安全。”宋學娟輸入賬號、密碼,登錄數字化成果管理係統,所有成品文件呈現在眼前,函盒編碼、書名、作者、朝代,以及長、寬、高和冊數等基本信息,都有詳細記錄。“我們爭取今年內基本完成圖版處理工作。”她說。影印出版不少圖書館、藏書機構等正虛位以待,靜待“四閣四庫合璧”文溯閣《四庫全書》影印出版,彙聚了社會各界的期待。西北師範大學教授趙逵夫全程參與了文溯閣《四庫全書》影印出版工程專家論證會。他說,《四庫全書》現存不同版本在內容、冊數、卷(juan)數(shu)上(shang)皆(jie)有(you)不(bu)同(tong),通(tong)過(guo)數(shu)字(zi)化(hua)影(ying)印(yin)出(chu)版(ban),方(fang)便(bian)學(xue)者(zhe)比(bi)對(dui)研(yan)究(jiu),意(yi)義(yi)重(zhong)大(da)。蘭(lan)州(zhou)大(da)學(xue)教(jiao)授(shou)汪(wang)受(shou)寬(kuan)也(ye)持(chi)相(xiang)同(tong)觀(guan)點(dian)。他(ta)曾(zeng)用(yong)兩(liang)年(nian)時(shi)間(jian),帶(dai)著(zhe)學(xue)生(sheng)對(dui)甘(gan)肅(su)省(sheng)圖(tu)書(shu)館(guan)編(bian)印(yin)的(de)《影印文溯閣四庫全書四種》進行整理、標點和精細校勘,並將收錄其中的《易圖說》《長安誌圖》《墨法集要》《璿璣圖詩讀法》這4種(每種各1冊)書,跟文淵閣本進行對比,發現兩個版本的文字、圖片等存在901處差異。“4冊書就有這麼多差異,3.6萬多冊會是什麼樣?”汪受寬說,“文溯閣《四庫全書》影印出版,將對文化史、史學史、文獻學研究等都產生重要影響。”期(qi)望(wang)值(zhi)高(gao),現(xian)實(shi)問(wen)題(ti)也(ye)不(bu)少(shao)。一(yi)方(fang)麵(mian),古(gu)籍(ji)實(shi)現(xian)數(shu)字(zi)化(hua)後(hou),盜(dao)印(yin)現(xian)象(xiang)難(nan)以(yi)杜(du)絕(jue)。另(ling)一(yi)方(fang)麵(mian),超(chao)大(da)規(gui)模(mo)古(gu)籍(ji)的(de)影(ying)印(yin)出(chu)版(ban)投(tou)入(ru)巨(ju)大(da),盈(ying)利(li)是(shi)個(ge)難(nan)題(ti)。“變古籍為現代書籍,背後是大量的人力、物力、財力成本。”讀者出版集團有限公司所屬甘肅人民出版社社長、總(zong)編(bian)輯(ji)原(yuan)彥(yan)平(ping)坦(tan)言(yan)。防(fang)止(zhi)數(shu)據(ju)泄(xie)露(lu),采(cai)集(ji)區(qu)域(yu)設(she)置(zhi)嚴(yan)密(mi)安(an)保(bao)措(cuo)施(shi)。宋(song)學(xue)娟(juan)介(jie)紹(shao),任(ren)何(he)人(ren)出(chu)入(ru)采(cai)集(ji)區(qu),都(dou)須(xu)經(jing)過(guo)嚴(yan)格(ge)安(an)檢(jian),以(yi)防(fang)手(shou)機(ji)等(deng)電(dian)子(zi)設(she)備(bei)進(jin)入(ru)工(gong)作(zuo)區(qu)域(yu)。同(tong)時(shi),每(mei)個(ge)工(gong)作(zuo)台(tai)均(jun)安(an)裝(zhuang)了(le)監(jian)控(kong)設(she)備(bei),每(mei)台(tai)電(dian)腦(nao)都(dou)作(zuo)了(le)加(jia)密(mi)設(she)置(zhi)。應(ying)對(dui)盈(ying)利(li)難(nan)題(ti),找(zhao)準(zhun)盈(ying)利(li)點(dian)是(shi)關(guan)鍵(jian)。原(yuan)彥(yan)平(ping)給(gei)記(ji)者(zhe)詳(xiang)細(xi)分(fen)析(xi):古籍影印本主要有仿真本和縮印本。前者好比是“克隆體”,從紙張到字號,從排版到裝幀,與原書幾乎“一模一樣”;後者則是“迷你版”,內容不變,但字號變小、頁數變少,冊數大幅縮減。“文溯閣《四庫全書》若是出全套仿真影印本,成本過高,市場較小。”原彥平說,文溯閣《四庫全書》多達3.6萬餘冊,數據采集、處理、編輯、出版等投入大,且多為手工完成,成本高,發行對象則主要為圖書館、文化館、高校、研究院所等專業機構和為數不多的研究者。2024年1月3日,文溯閣《四庫全書》經部影印出版專題工作會議召開,確定了出版方案——縮印、16開本、236冊。“我們將按經、史、子、集四部,分期分批推出縮印本。如果全套出齊,預計共1500冊。”原彥平說。走進甘肅省圖書館的古籍閱覽室,其他三閣《四庫全書》的影印本旁,工作人員已為文溯閣《四庫全書》的影印本騰好了書架。“古籍影印本看似小眾、銷路窄,實際上,版本好、印刷精美、定價合適的古籍,自有其發行空間。”從事出版行業20多年,宋學娟對文溯閣《四庫全書》影印本的市場前景頗有信心——版本獨一份,價值突出,公眾期待較高;自帶流量和話題,營銷成本較低,做到客戶明確、精準供給,就能減輕銷售壓力。今年初,宋學娟帶領團隊參加2024北京圖書訂貨會。文溯閣《四庫全書》全套影印出版工作頗受關注,不僅有高校、圖書館、文博機構的負責人,還有銷售商和個人前來谘詢。“據市場調研,不少圖書館、藏書機構等正虛位以待,靜待‘四閣四庫合璧’。”宋學娟說。“在做好保護工作基礎上,我們將深入挖掘文溯閣《四庫全書》價值,努力在信息服務、文化創意、文旅融合上求突破,讓這座資源寶庫在新時代活起來、用起來。”讀者出版集團有限公司黨委書記、董事長梁朝陽表示。活化利用首推精選本,開發文創產品,讓更多人領略古籍魅力“宣傳推廣古籍的文創產品,既要開發周邊,更要聚焦古籍本身。”甘肅省圖書館館長肖學智說,不妨跳出杯子、本子、袋子等樣式,回歸古籍做文創,出版精選本圖書。汪受寬介紹,《四庫全書》曆來有“典籍總彙,文化淵藪”之譽,不僅囊括了從先秦至清代乾隆中期之前中國曆史上的主要典籍,而且涵蓋了中國傳統學術文化的各個學科門類和各個專門領域。“卷帙浩繁通常也意味著無從讀起,從這個意義上講,讓‘高冷’的古籍變暢銷的書籍,就是好文創。”肖學智說。啟函盒、取夾板、解束帶,《文溯閣四庫全書影印精選》露出真容。翻開書頁,映入眼簾的楷書溫潤大方、賞心悅目。每頁8行、每行21字,雖是手抄,可字的大小、間距幾無差異,工整如打印一般。“共計40卷,分為3函、5種、18冊。”肖學智介紹,為突出甘肅文化特色,這套影印精選本甄選了文溯閣《四庫全書》子部所收古代隴人著作兩種——《潛夫論》和《拾遺記》,另外還有《文房四譜》《法書要錄》《畫史會要》等書畫藝術史經典作品3種。這樣一套精裝古籍,俘獲了不少讀者的心。“自去年5月出版發行,迄今已銷售680多套,平均每天銷售約2套,這在古籍中銷量不低。”甘肅省圖書館文創中心負責人介紹,甘肅省圖書館10多年前就曾出版《影印文溯閣四庫全書四種》,暢銷至今,共售出5600多套。“優質的古籍,就是優質的文創。”肖學智說,近年來,甘肅省圖書館以文溯閣《四庫全書》為素材,從其包裝方式、撰寫格式、用色寓意、人文理念等角度汲取靈感,推出了一係列文創產品,“目前,我們正挖掘文溯閣《四庫全書》中的龍元素,即將推出特色伴手禮。”“古籍活化,不能止於開發文創產品。”肖學智說,為了讓更多人樂於走近文溯閣《四庫全書》,領略古籍魅力,甘肅省圖書館打造了多個文創場景——線上,推出“文溯·隴跡”等專欄,在“雲”上賦予古籍新話題;線下,建成甘肅省圖書館文溯閣《四庫全書》藏書館展廳,讓參觀者沉浸式體驗纂修、流傳、保護、發展等曆史場景,與“書”同行……“我們舉辦的‘千古巨製——《四庫全書》展’是國內較早推出的《四庫全書》專題展覽,至今已在全省50多個圖書館流動展出。”肖學智介紹,今年3月,省圖書館還啟動了專題展覽進校園活動,未來還將推動展覽進社區。年輕讀者馬瑛正是通過這個展覽認識了文溯閣《四庫全書》,並買了一套《影印文溯閣四庫全書四種》。“帶回去,讓更多人了解我們的典籍瑰寶。”馬瑛說。今年,甘肅省出台《關於以“八個一”文化品牌為抓手全力推動文化傳承發展的實施方案》,其中一個“一”即為“一部《四庫全書》,讓中國古典文化活起來”。實施方案提出,加強文溯閣《四庫全書》保護傳承、整理研究、數字轉化、版權開發、活化利用等,激發古籍保護利用活力。“影印出版,是活化利用的第一步。”肖學智說,未來還將建設完整、好用的數據庫,研發音視頻等產品,讓文溯閣《四庫全書》的“數字分身”走進千家萬戶。
來源 | 人民日報客戶端


