《道藏》南华真经数字化

两年前的毕业总结里,我为自己画了个顿号,希望自己能不断进步。

2021年12月末,我搭建了个人网站。

2022年,我做了The Collection of Chuangtzu(文献篇),并尽可能找齐目录中的电子资源。

2023年,依托前两年的成果,我结识了一些同好,并一起做了些东西出来,特在此做个分享:《道藏》庄子白文的数字化。

github链接:https://github.com/tobeabooker/ChuangTzu-text

2026更新:

将国图本文本校以宫内厅本、崂山本。

所有的资源可通过网盘获取:https://pan.quark.cn/s/3e093f6fad76

html文件中,使用说明经过修订,新增附录,说明了三本的图像质量、文本质量、与宋本异文以及我发现的三种《道藏》在“女”“慕”“贞”“洁”四函的一些异文。

附錄

圖像質量

宮內廳本圖像質量最好,體積最大;國圖本次之;嶗山本清晰度最差,複雜的字看不清筆畫,且不同卷之間清晰度不同,卷三、卷四質量最差。

嶗山道藏公布的文件是長圖,崔羅虛(正音悉達)裁切爲8行。因爲長圖太長,卷四分爲兩部分,崔羅虛(正音悉達)所裁切的pdf沒有後一部分。爲方便對照閲讀,將嶗山本與宮內廳本的原圖像進行裁切,每頁10行,與國圖本一致。通過PDF-XChange裁切後,嶗山本pdf文件大小與清晰度都下降,所以pdf不清晰時還需查閲原jpg長圖(雖然原圖像也不一定能看清);宮內廳本文件大小下降明顯,清晰度下降沒那麽大。

之前爲與涵芬樓本頁碼一致,將國圖本五卷中的卷二卷三、卷四卷五合併。此次也將宮內廳本與嶗山本合併。另外,嶗山本還進行了頁面縮放以及增加空白頁。嶗山本原jpg長圖與未經過合併的文件都放在原始文件文件夾中。

文本質量

《道藏源流考》:“《正統道藏》所收書籍,多避宋諱。蓋雖係明刻,而淵源固自《政和道藏》也。”目前看見的避讳字:恒𢘆、桓󰾡、匡󰾣、筐。

整體來講,《正統道藏》的文本質量是不錯的。就《南華眞經》而言,宮內廳本文本質量最好,國圖本次之,嶗山本最差,總能錯出新花樣。

據《道藏源流考》與《傳世明〈道藏〉印本的收藏與現狀》,宮內廳與嶗山藏《道藏》爲明刻明印,國圖藏《道藏》爲明刻清印,且經過康熙、道光修補。

明刻明印自然比明刻清印好。但這是從《道藏》這一整體來論述的,具體到某一文獻則不一定。嶗山藏《道藏》“女”卷一的經文,是仿照《道藏》的形式抄於紙上,明顯是因部份經卷失佚,故用抄本補足(《傳世明〈道藏〉印本的收藏與現狀》),宮內廳藏《道藏》亦有抄本補入(見崔羅虛(正音悉達)整理説明:https://www.shuge.org/meet/topic/169674/)。

細察之,嶗山藏《道藏》“傷”函第三種《太上玄靈北斗本命延生眞經》沒有斷板;缺少千字文計數“傷一 六”到“傷一 十一”;“願”字字形與宮內廳本差異較大,而與國圖本同。“傷”函餘下的經文,除了缺失的外,三種《道藏》字體一致,有相同的斷板。

嶗山藏《道藏》“女”“慕”“貞”三函,沒有斷板,字體與宮內廳和國圖所藏《道藏》不一致,千字文計數有很多不一致的地方(目前所見,錯漏的都是嶗山《道藏》,甚至有把對的改成錯的時候)。校對《南華眞經》(貞二-貞六)過程中,多次發現國圖本與宮內廳本有斷板的地方,嶗山本沒有。當然,也存在1.宮內廳本有斷板,國圖本沒有;2.國圖本有斷板,宮內廳本沒有兩種情況。前者當是因爲國圖本經過重修,後者則是後續新增的斷板。至於千字文計數,嶗山本有漏抄的,有多抄的,有抄錯的(卷三)。

抄本補入,非明刻原本,這就是嶗山本《南華眞經》文本質量最差的原因(抄寫工太不認眞啦!)。旣然嶗山本爲抄本補入,其校勘價値自然不高。但繼而出現的問題,如:嶗山本《道藏》共有多少抄本、何時抄寫補入、所抄原本是哪種等等,或許還需要借助這些異文。故而簡單介紹一下異文的情況,供有能力有意願的人去硏究。本人能力有限,由於時間原因,衹是粗略地翻檢對比了一下,疏漏在所難免。

所有的異文可以分爲四種情況:

  • 國圖本與宮內廳本同
  • 國圖本與嶗山本本同
  • 宮內廳本與嶗山本同
  • 三本都不相同

因為破損、清晰度不足、各版本之間十分微小的字形不一致(嶗山本有些字一筆兩筆與宮內廳、國圖本不同),有一些字未設置為異文(如:後,齊、竊),還有一些疏漏未設置class。國圖本有幾處可能破損的地方計入異文。所以統計數據衹能作爲參考。所有異文(包括DiffChar與DiffCharShape)一共418項(與上述四種情況總數對不上,找了半天也沒找到,不找了)。

國圖本與宮內廳本同

宮內廳本同國圖本、宮內廳本:爲關鍵詞檢索html文件,結果為317項,是出現次數最多的情況。在這317個結果中,class為DiffCharShape(僅字形不一致,仍是同一字)的有261項,餘下的56項都是嶗山本抄寫錯誤。

嶗山本抄錯比較明顯的異文,列之於下:

徙於南𡨋(嶗山本:徒於)

官知止而神欲行(嶗山本:宫知)

毀首碎胷(嶗山本:碎貿)

舟車之所通(嶗山本:所道)

曳尾於塗中(嶗山本:夷尾)

遺忘而不知察(嶗山本:道忘)

老弱孤寡(嶗山本:者弱)

全部56個結果,使用雙條件檢索,可用如下代碼得到:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
from lxml import etree
import os

# 1. 定义文件夹路径和具体的文件名
folder_path = r'道藏庄子白文数字化 2026.5.24'
file_name = '《道藏》南华真经文图对照.html'

# 2. 拼接完整的文件绝对路径
file_path = os.path.join(folder_path, file_name)

# 3. 读取并解析 HTML 文件
with open(file_path, 'r', encoding='utf-8') as f:
tree = etree.HTML(f.read())

# 4. XPath 查询:查找所有 class="FN" 且包含 "宮內廳本同" 的 class為DiffChar的span 标签
xpath_query = '//span[@class="FN"][contains(., "宮內廳本同")][not(.//*[@class="DiffCharShape"])]'
results = tree.xpath(xpath_query)

# 查询:查找所有 class="FN" 且包含 DiffCharShape "宮內廳本同" 的 span 标签
# xpath_query = '//span[@class="FN"][.//a[contains(@class,"DiffCharShape")]][contains(., "宮內廳本同")]'

# 5. 打印结果总数
print(f"文件《{file_name}》中,数量为: {len(results)}\n")

# 6. 遍历并打印每一条匹配到的具体文本内容
for i, item in enumerate(results, 1):
# 提取当前元素下的所有纯文本,并去掉多余空白
text = item.xpath('string(.)').strip()
print(f"第 {i} 条匹配内容:{text}")

國圖本與嶗山本同

嶗山本同,檢索結果為38項,其中據宮內廳本改(總數為30)數量為2。38項中有兩處差異較大,另有一處宮內廳本無字,其餘都是字形稍有不同。這三處如下:

爲圃畦

行賢而去自賢之行

願以境内累(宮內廳本無“願”字)

國圖本、嶗山本:檢索結果為28項,其中據宮內廳本改數量為26(另外兩處,一處國圖本不清,一處三本都不同)。

除去夫天、含舍這類簡單的形近而誤,差異較大的異文有:

方二千餘里

國圖本、嶗山本:三千

衆雌而無雄

國圖本、嶗山本:衆雄

逆物之情

國圖本、嶗山本:道物

夫子問于老聃

國圖本、嶗山本:向于

齊士有皇子告敖者

國圖本、嶗山本:里子

東海有鳥焉

士成𦂶明日復見,曰

國圖本、嶗山本:𦥑

二𩔖相召

嶗山本:一𩔖

容成氏

國圖本、嶗山本:成民

欲規我以利

國圖本、嶗山本:於規

苴竿

國圖本、嶗山本:真年

  • 國圖本與嶗山本的關係

通過上面的異文,國圖本與宮內廳本相同之處最多,其次便是與嶗山本同的數量。對於已經有不少印刷數量的數書籍,一般來說,只有根據刻本產生抄本,沒有用抄本來校正修補刻本的道理。以下例子或能證明。

言其消也

此處國圖本有斷板,修補字形兩橫成了“口”字,嶗山本抄成了“可”字。

必有餘地矣

此處國圖本有斷板,看不清是否有丶,嶗山本抄成了“刀”字。

復朴

國圖本:豕,嶗山本則多了丿。

是其市南僚邪

国图,崂山本:宀日

在女、慕、貞、潔這几函中,也出現國圖本断板或修補,嶗山本抄錯的例子(這几函的全部異文在文末)。如:

則為

宮內廳本、國圖本有斷板,崂山本抄成“宫”

頸至腰三斬之

國圖本有破損,但還能看出是自,嶗山本抄成“目”

層之臺

國圖本有修補,嶗山本抄成“六”

常善救物

國圖本修補成“披物”,嶗山本抄錯

龍若蛟

國圖本破損,嶗山本形誤成“右”

宮內廳本與嶗山本同

宮內廳本、嶗山本:檢索結果為13項,都是同一字的字形差別。

三本都不相同

這類沒有固定的檢索詞,故全部列出,總數為20。

言其日消也

道惡乎隱而有眞僞

子祀徃

彫𤥨(據宮內廳本改)

則并與斗斛而竊之

公族也

懼故𥚢

嶗山本看不清,宮內廳本與國圖本不同的有:

有物採之

黄軦生乎九猷

魚鼈之所不游也

發冡

以𦥷事,以每成功

亂莫大焉

國家昏亂

兼濟導物

子見夫犠

鬱而不發

大觳

而倍譎不同

救世之戰

與宋本異文

在校對過程中,發現有些字三本同,而與宋本(僅指《莊子校詮》與《莊子彙校考訂》)存在一定差異,所列不全,僅供參考。

  • 因以為茅靡

宋本:因以爲弟靡

  • 體盡無窮而遊無󰿥

宋本:體盡无窮而遊无朕

  • 二人相視而笑,莫逆於心

宋本:三人相視而笑,莫逆於心

  • 臠卷聮拳傖囊

宋本:臠卷傖囊

  • 道物之情

宋本:逆物之情

  • 萬萬云云

宋本:萬物云云

  • 閑汝外

宋本:閉汝外

  • 民孰不敢輯

宋本:民孰敢不輯

  • 貨敗弗爭

宋本:貨財弗爭

  • 閭里之識

宋本:閭里知識

  • 人見曰

宋本:入見曰

  • 有虛舡來觸舟

宋本:有虛船來觸舟

  • 温伯雪子適齊,舍魯

宋本:温伯雪子適齊,舍於魯

  • 生者𭮀之徒

宋本:生也𭮀之徒

  • 踸踔而行

宋本:趻踔而行

  • 調一絃

宋本:調一弦

  • 熟哉鬱鬱乎

宋本:孰哉鬱鬱乎

  • 終身食肉而終

宋本:然身食肉而終

  • 請常言移是

宋本:請嘗言移是

  • 解心之繆、六者繆心也

宋本:解心之謬、六者謬心也

  • 若勿恠

宋本:若勿怪

  • 宜有樞

宋本:冥有樞

  • 爲之傳之

宋本:爲之傅之

  • 而見戴晉人。晉人

宋本:而見戴晉人。戴晉人

  • 以徳爲在民

宋本:以得爲在民

  • 不止於萬物

宋本:不止於萬

  • 莊子家貧

宋本:莊周家貧

  • 終身言,未甞言

宋本:終身言,未甞不言

  • 彊陽

宋本:強陽

  • 氣者也

宋本:氣也者

  • 求狙猴之𣏾者斬之

宋本:求狙猴之杙者斬之

  • 孔丘之於至人,其末邪?

宋本:孔丘之於至人,其未邪?

  • 我悲人之自䘮者,吾又悲夫悲人之悲者,

宋本:我悲人之自喪者,吾又悲夫悲人者,吾又悲夫悲人之悲者

  • 物出不得先物也,猶其有物也无已

宋本:物出不得先物也,猶其有物也。猶其有物也无已

  • 聲若出金石

宋本:聲滿天地,若出金石

  • 養道者忘心

宋本:致道者忘心

  • 自省而不窮於道

宋本:内省而不窮於道

  • 共伯得乎丘首

宋本:共伯得乎共首

  • 必我爲貪也

宋本:必以我爲貪也

  • 此六子者,無異於磔犬

宋本:此四子者,無異於磔犬

  • 䟽戚無倫

宋本:疏戚无倫

  • 𪫟惕之心,欣歡之喜

宋本:𪫟惕之恐,欣懽之喜

  • 則下久病民阨而不死者

宋本:則亦久病長阨而不死者

  • 賜一千金

宋本:賜之千金

  • 以忠勝士爲鐔

宋本:以忠聖士爲鐔

  • 聞諌愈甚,謂之狠

宋本:聞諫愈甚,謂之很

  • 孰恊唐、許

宋本:孰協唐、許

  • 勇敢多怨

宋本:勇動多怨

  • 腓無肢

宋本:腓无胈

  • 瑰不失道

宋本:塊不失道

  • 折萬物之理

宋本:析萬物之理

  • 知萬物皆有所可,皆有所不可

宋本:知萬物皆有所可,有所不可

  • 推拍輐斷

宋本:椎拍輐斷

  • 不師智慮

宋本:不師知慮

  • 歴物之意

宋本:歷物之意

  • 狐駒未常有母

宋本:孤駒未嘗有母

《道藏》女、慕、貞、潔異文

女十一 嶗山本卷末闕兩字及卷名

女十三 十 嶗山本至心信大惠衆善天尊後少5行,不知道是原本少抄,還是沒掃描上

女十五 七 宮內廳本:欽信。國圖、宮內廳:飲信

  • 慕一 道德真經

慕一 三 十二到二十九章,國圖本《道德眞經》字更小,字距更大,似爲修補

慕一 七 二十九章到三十七章,國圖本《道德眞經》內容錯誤,嶗山本同誤。這是《道德經古本篇》的內容。有趣的是,國圖本《道德眞經》這裏的內容有斷板(與宮內廳本《道德經古本篇》斷板不同),到《道德經古本篇》這部分內容時,反而是另外的字體(與慕一 三修補的字體同)補上去的。

國圖本這兩書的二十九章到三十七章,內容相同,千字文計數與宮內廳本相同,字體不同。嶗山本則是內容相同,字體相同,千字文計數與宮內廳本不同。

巧用章第二十七:常善救物。國圖本修補成披物,嶗山本抄錯

謙德章第六十一:小國以下大國。國圖本、嶗山本:詩國以下大國

守微章第六十四:層之臺。國圖本有修補,嶗山本抄成

  • 慕二 道德經古本篇

國圖本一到十章 二十九章到三十七章字更小,字距更大,似爲修補

二十八章:則為長,宮內廳本、國圖本有斷板,崂山本误为

  • 慕六 文始眞經

而即有言有行者求道。,國圖、嶗山本:

龍若蛟。國圖本破損,嶗山本:

味可以養氣。國圖本、嶗山本:

  • 慕七-慕九 沖虛至德眞經

慕七 八,國圖本缺少部分,嶗山本抄成 慕十。之前與之後的沒有抄錯成 慕十

慕七 十一 國圖本誤成 十

商丘開往無難色,火往還。 國圖本破損,嶗山本抄成

慕八 十 㳺 遊

慕八 十一 撫其而哭。嶗山本:撫其而哭

慕八 十一 遇鄧析。嶗山本:遇鄧祈

慕八 二十五 頸至腰三斬之。國圖本有破損,但還能看出是,嶗山本:頸至腰三斬之。

慕九 八 然而自得。國圖、嶗山本:然而自得

慕九 十一 糟漿之氣逆於人鼻。嶗山本:糟漿之於後庭,以晝足夜。少抄5行。

慕九 二十七 竊。嶗山本:竊

  • 貞一 洞靈真經

貞一 三 不知是我。嶗山本:不知是我

貞一 五 才多而好謙,嶗山本:

貞一 九()冒,三者亂國之梯也

貞一 十六 音丘,則字不能是丘,宮內廳本:𠀈,國圖本有斷板,嶗山本誤。

貞一 二十四 行地滋逺,嶗山本:遠

󹦻舌 嶗山本:習舌

壞,󰗬

嶗山本潔一、潔二为明刻原本,錯誤很少。

潔一 十一 司命。國圖本:可命

潔二 三,此頁斷板與嶗山、宮內廳不同,顯然經過修復。一直到潔二 五,國圖本每行第一个字有誤,是三頁後的內容,也就是前後內容反了。