《道藏》南华真经数字化

发表于 2024-01-05 更新于 2026-06-04 分类于哲学，庄子

github链接：https://github.com/tobeabooker/ChuangTzu-text

两年前（2021年9月）的毕业总结里，我为自己画了个顿号，希望自己能不断进步。

2021年12月末，我搭建了个人网站。

2022年，我做了The Collection of Chuangtzu（文献篇），并尽可能找齐目录中的电子资源。

2023年，依托前两年的成果，我结识了一些同好，并一起做了些东西出来，特在此做个分享：《道藏》南华真经的数字化。

github链接：https://github.com/tobeabooker/ChuangTzu-text

2026更新：

将国图本文本校以宫内厅本、崂山本。

所有的资源可通过网盘获取：https://pan.quark.cn/s/3e093f6fad76

html文件中，使用说明经过修订，新增附录，说明了三本的图像质量、文本质量、与宋本异文以及我发现的三种《道藏》在“女”“慕”“贞”“洁”四函的一些异文。使用说明中有图片，不方便放在blog上，可去下载html文件查看。附录可下滑查看。

两年前，好友noodles促成了此工作的开始，并校对了看典古籍的ocr文本，订正了许多我漏校的字。今年，好友Amber赠送的茶叶，伴隨我整个校对过程。noodles对生活的勇气、Amber对古籍的热爱，都让我备受鼓舞。在此万分感谢。

附錄

圖像質量

宮內廳本圖像質量最好，體積最大；國圖本次之；嶗山本清晰度最差，複雜的字看不清筆畫，且不同卷之間清晰度不同，卷三、卷四質量最差。

嶗山道藏公布的文件是長圖，崔羅虛（正音悉達）裁切爲8行。因爲長圖太長，卷四分爲兩部分，崔羅虛（正音悉達）所裁切的pdf沒有後一部分。爲方便對照閲讀，將嶗山本與宮內廳本的原圖像進行裁切，每頁10行，與國圖本一致。通過PDF-XChange裁切後，嶗山本pdf文件大小與清晰度都下降，所以pdf不清晰時還需查閲原jpg長圖（雖然原圖像也不一定能看清）；宮內廳本文件大小下降明顯，清晰度下降沒那麽大。

之前爲與涵芬樓本頁碼一致，將國圖本五卷中的卷二卷三、卷四卷五合併。此次也將宮內廳本與嶗山本合併。另外，嶗山本還進行了頁面縮放以及增加空白頁。嶗山本原jpg長圖與未經過合併的文件都放在原始文件文件夾中。

文本質量

《道藏源流考》：“《正統道藏》所收書籍，多避宋諱。蓋雖係明刻，而淵源固自《政和道藏》也。”目前看見的避讳字：恒𢘆、桓󰾡、匡󰾣、筐。

整體來講，《正統道藏》的文本質量是不錯的。就《南華眞經》而言，宮內廳本文本質量最好，國圖本次之，嶗山本最差，總能錯出新花樣。

據《道藏源流考》與《傳世明〈道藏〉印本的收藏與現狀》，宮內廳與嶗山藏《道藏》爲明刻明印，國圖藏《道藏》爲明刻清印，且經過康熙、道光修補。

明刻明印自然比明刻清印好。但這是從《道藏》這一整體來論述的，具體到某一文獻則不一定。嶗山藏《道藏》“女”卷一的經文，是仿照《道藏》的形式抄於紙上，明顯是因部份經卷失佚，故用抄本補足（《傳世明〈道藏〉印本的收藏與現狀》），宮內廳藏《道藏》亦有抄本補入（見崔羅虛（正音悉達）整理説明：https://www.shuge.org/meet/topic/169674/）。

細察之，嶗山藏《道藏》“傷”函第三種《太上玄靈北斗本命延生眞經》沒有斷板；缺少千字文計數“傷一六”到“傷一十一”；“願”字字形與宮內廳本差異較大，而與國圖本同。“傷”函餘下的經文，除了缺失的外，三種《道藏》字體一致，有相同的斷板。

嶗山藏《道藏》“女”“慕”“貞”三函，沒有斷板，字體與宮內廳和國圖所藏《道藏》不一致，千字文計數有很多不一致的地方（目前所見，錯漏的都是嶗山《道藏》，甚至有把對的改成錯的時候）。校對《南華眞經》（貞二-貞六）過程中，多次發現國圖本與宮內廳本有斷板的地方，嶗山本沒有。當然，也存在1.宮內廳本有斷板，國圖本沒有；2.國圖本有斷板，宮內廳本沒有兩種情況。前者當是因爲國圖本經過重修，後者則是後續新增的斷板。至於千字文計數，嶗山本有漏抄的，有多抄的，有抄錯的（卷三）。

抄本補入，非明刻原本，這就是嶗山本《南華眞經》文本質量最差的原因（抄寫工太不認眞啦！）。旣然嶗山本爲抄本補入，其校勘價値自然不高。但繼而出現的問題，如：嶗山本《道藏》共有多少抄本、何時抄寫補入、所抄原本是哪種等等，或許還需要借助這些異文。故而簡單介紹一下異文的情況，供有能力有意願的人去硏究。本人能力有限，由於時間原因，衹是粗略地翻檢對比了一下，疏漏在所難免。

所有的異文可以分爲四種情況：

國圖本與宮內廳本同
國圖本與嶗山本同
宮內廳本與嶗山本同
三本都不相同

因為破損、清晰度不足、各版本之間十分微小的字形不一致（嶗山本有些字一筆兩筆與宮內廳、國圖本不同），有一些字未設置為異文（如：後，齊、竊），還有一些疏漏未設置class。國圖本有幾處可能破損的地方計入異文。所以統計數據衹能作爲參考。所有異文（包括DiffChar與DiffCharShape）一共418項(與上述四種情況總數對不上，找了半天也沒找到，不找了)。

國圖本與宮內廳本同

以宮內廳本同與國圖本、宮內廳本：爲關鍵詞檢索html文件，結果為317項，是出現次數最多的情況。在這317個結果中，class為DiffCharShape（僅字形不一致，仍是同一字）的有261項，餘下的56項都是嶗山本抄寫錯誤。

嶗山本抄錯比較明顯的異文，列之於下：

徙於南𡨋（嶗山本：徒於）
官知止而神欲行（嶗山本：宫知）
毀首碎胷（嶗山本：碎貿）
舟車之所通（嶗山本：所道）
曳尾於塗中（嶗山本：夷尾）
遺忘而不知察（嶗山本：道忘）
老弱孤寡（嶗山本：者弱）

全部56個結果，使用雙條件檢索，可用如下代碼得到：

from lxml import etree
import os

# 1. 定义文件夹路径和具体的文件名
folder_path = r'道藏庄子白文数字化 2026.5.24'
file_name = '《道藏》南华真经文图对照.html'

# 2. 拼接完整的文件绝对路径
file_path = os.path.join(folder_path, file_name)

# 3. 读取并解析 HTML 文件
with open(file_path, 'r', encoding='utf-8') as f:
    tree = etree.HTML(f.read())

# 4. XPath 查询：查找所有 class="FN" 且包含 "宮內廳本同" 的 class為DiffChar的span 标签
xpath_query = '//span[@class="FN"][contains(., "宮內廳本同")][not(.//*[@class="DiffCharShape"])]'
results = tree.xpath(xpath_query)

# 查询：查找所有 class="FN" 且包含 DiffCharShape "宮內廳本同" 的 span 标签
# xpath_query = '//span[@class="FN"][.//a[contains(@class,"DiffCharShape")]][contains(., "宮內廳本同")]'

# 5. 打印结果总数
print(f"文件《{file_name}》中，数量为: {len(results)}\n")

# 6. 遍历并打印每一条匹配到的具体文本内容
for i, item in enumerate(results, 1):
    # 提取当前元素下的所有纯文本，并去掉多余空白
    text = item.xpath('string(.)').strip()
    print(f"第 {i} 条匹配内容：{text}")

國圖本與嶗山本同

嶗山本同，檢索結果為38項，其中據宮內廳本改（總數為30）數量為2。38項中有兩處差異較大，另有一處宮內廳本無字，其餘都是字形稍有不同。這三處如下：

爲圃畦
行賢而去自賢之行
願以境内累（宮內廳本無“願”字）

國圖本、嶗山本：檢索結果為28項，其中據宮內廳本改數量為26（另外兩處，一處國圖本不清，一處三本都不同）。

除去夫天、含舍這類簡單的形近而誤，差異較大的異文有：

方二千餘里

國圖本、嶗山本：三千

衆雌而無雄

國圖本、嶗山本：衆雄

逆物之情

國圖本、嶗山本：道物

夫子問于老聃

國圖本、嶗山本：向于

齊士有皇子告敖者

國圖本、嶗山本：里子

東海有鳥焉

士成𦂶明日復見，曰

國圖本、嶗山本：𦥑

二𩔖相召

嶗山本：一𩔖

容成氏

國圖本、嶗山本：成民

欲規我以利

國圖本、嶗山本：於規

苴竿

國圖本、嶗山本：真年

國圖本與嶗山本的關係

通過上面的異文，國圖本與宮內廳本相同之處最多，其次便是與嶗山本同的數量。對於已經有不少印刷數量的數書籍，一般來說，只有根據刻本產生抄本，沒有用抄本來校正修補刻本的道理。以下例子或能證明。

言其日消也

此處國圖本有斷板，修補字形兩橫成了“口”字，嶗山本抄成了“可”字。

遊刃必有餘地矣

此處國圖本有斷板，看不清是否有丶，嶗山本抄成了“刀”字。

彫琢復朴

國圖本:豕，嶗山本則多了丿。

是其市南宜僚邪

国图，嶗山本：宀日

在女、慕、貞、潔這几函中，也出現國圖本断板或修補，嶗山本抄錯的例子（這几函的全部異文在文末）。如：

則為官長

宮內廳本、國圖本有斷板，嶗山本抄成“宫”

自頸至腰三斬之

國圖本有破損，但還能看出是自，嶗山本抄成“目”

九層之臺

國圖本有修補，嶗山本抄成“六”

常善救物

國圖本修補成“披物”，嶗山本抄錯

若龍若蛟

國圖本破損，嶗山本形誤成“右”

宮內廳本與嶗山本同

宮內廳本、嶗山本：檢索結果為13項，都是同一字的字形差別。

三本都不相同

這類沒有固定的檢索詞，故全部列出，總數為20。

言其日消也
道惡乎隱而有眞僞
子祀徃
彫𤥨（據宮內廳本改）
則并與斗斛而竊之
公族也
懼故𥚢

嶗山本看不清，宮內廳本與國圖本不同的有：

有物採之
黄軦生乎九猷
魚鼈之所不游也
發冡
以𦥷事，以每成功
亂莫大焉
國家昏亂
兼濟導物
子見夫犠
鬱而不發
大觳
而倍譎不同
救世之戰

與宋本異文

在校對過程中，發現有些字三本同，而與宋本（僅指《莊子校詮》與《莊子彙校考訂》）存在一定差異，所列不全，僅供參考。

因以為茅靡

宋本：因以爲弟靡

體盡無窮而遊無󰿥

宋本：體盡无窮而遊无朕

二人相視而笑，莫逆於心

宋本：三人相視而笑，莫逆於心

臠卷聮拳傖囊

宋本：臠卷傖囊

道物之情

宋本：逆物之情

萬萬云云

宋本：萬物云云

閑汝外

宋本：閉汝外

民孰不敢輯

宋本：民孰敢不輯

貨敗弗爭

宋本：貨財弗爭

閭里之識

宋本：閭里知識

人見曰

宋本：入見曰

有虛舡來觸舟

宋本：有虛船來觸舟

温伯雪子適齊，舍魯

宋本：温伯雪子適齊，舍於魯

生者𭮀之徒

宋本：生也𭮀之徒

踸踔而行

宋本：趻踔而行

調一絃

宋本：調一弦

熟哉鬱鬱乎

宋本：孰哉鬱鬱乎

終身食肉而終

宋本：然身食肉而終

請常言移是

宋本：請嘗言移是

解心之繆、六者繆心也

宋本：解心之謬、六者謬心也

若勿恠

宋本：若勿怪

宜有樞

宋本：冥有樞

爲之傳之

宋本：爲之傅之

而見戴晉人。晉人

宋本：而見戴晉人。戴晉人

以徳爲在民

宋本：以得爲在民

不止於萬物

宋本：不止於萬

莊子家貧

宋本：莊周家貧

終身言，未甞言

宋本：終身言，未甞不言

彊陽

宋本：強陽

氣者也

宋本：氣也者

求狙猴之𣏾者斬之

宋本：求狙猴之杙者斬之

孔丘之於至人，其末邪？

宋本：孔丘之於至人，其未邪？

我悲人之自䘮者，吾又悲夫悲人之悲者，

宋本：我悲人之自喪者，吾又悲夫悲人者，吾又悲夫悲人之悲者

物出不得先物也，猶其有物也无已

宋本：物出不得先物也，猶其有物也。猶其有物也无已

聲若出金石

宋本：聲滿天地，若出金石

養道者忘心

宋本：致道者忘心

自省而不窮於道

宋本：内省而不窮於道

共伯得乎丘首

宋本：共伯得乎共首

必我爲貪也

宋本：必以我爲貪也

此六子者，無異於磔犬

宋本：此四子者，無異於磔犬

䟽戚無倫

宋本：疏戚无倫

𪫟惕之心，欣歡之喜

宋本：𪫟惕之恐，欣懽之喜

則下久病民阨而不死者

宋本：則亦久病長阨而不死者

賜一千金

宋本：賜之千金

以忠勝士爲鐔

宋本：以忠聖士爲鐔

聞諌愈甚，謂之狠

宋本：聞諫愈甚，謂之很

孰恊唐、許

宋本：孰協唐、許

勇敢多怨

宋本：勇動多怨

腓無肢

宋本：腓无胈

瑰不失道

宋本：塊不失道

折萬物之理

宋本：析萬物之理

知萬物皆有所可，皆有所不可

宋本：知萬物皆有所可，有所不可

推拍輐斷

宋本：椎拍輐斷

不師智慮

宋本：不師知慮

歴物之意

宋本：歷物之意

狐駒未常有母

宋本：孤駒未嘗有母

《道藏》女、慕、貞、潔異文

女十一嶗山本卷末闕兩字及卷名

女十三十嶗山本至心信大惠衆善天尊後少5行，不知道是原本少抄，還是沒掃描上。

女十五七宮內廳本：欽信。國圖、宮內廳：飲信。

慕一道德真經

慕一三十二到二十九章，國圖本《道德眞經》字更小，字距更大，似爲修補。

慕一七二十九章到三十七章，國圖本《道德眞經》內容錯誤，嶗山本同誤。這是《道德經古本篇》的內容。有趣的是，國圖本《道德眞經》這裏的內容有斷板（與宮內廳本《道德經古本篇》斷板不同），到《道德經古本篇》這部分內容時，反而是另外的字體（與慕一三修補的字體同）補上去的。

國圖本這兩書的二十九章到三十七章，內容相同，千字文計數與宮內廳本相同，字體不同。嶗山本則是內容相同，字體相同，千字文計數與宮內廳本不同。

巧用章第二十七：常善救物。國圖本修補成披物，嶗山本抄錯。

謙德章第六十一：小國以下大國。國圖本、嶗山本：詩國以下大國。

守微章第六十四：九層之臺。國圖本有修補，嶗山本抄成六。

慕二道德經古本篇

國圖本一到十章二十九章到三十七章字更小，字距更大，似爲修補。

二十八章：則為官長，宮內廳本、國圖本有斷板，嶗山本誤為宫。

慕六文始眞經

而即有言有行者求道。者，國圖、嶗山本：老。

若龍若蛟。國圖本破損，嶗山本：右。

五味可以養氣。國圖本、嶗山本：玉。

慕七-慕九沖虛至德眞經

慕七八，國圖本缺少部分，嶗山本抄成慕十。

慕七十一國圖本誤成 十。

商丘開往無難色，入火往還。國圖本破損，嶗山本抄成人。

慕八十㳺遊

慕八十一撫其尸而哭。嶗山本：撫其而而哭。

慕八十一遇鄧析。嶗山本：遇鄧祈。

慕八二十五 自頸至腰三斬之。國圖本有破損，但還能看出是自，嶗山本：目頸至腰三斬之。

慕九八 逌然而自得。國圖、嶗山本：道然而自得。

慕九十一糟漿之氣逆於人鼻。嶗山本：糟漿之於後庭，以晝足夜。少抄5行。

慕九二十七竊鈇。嶗山本：竊鐵。

貞一洞靈真經

貞一三 迺不知是我。嶗山本：逥不知是我。

貞一五才多而好謙。嶗山本：

貞一九（）冒，三者亂國之梯也

貞一十六音丘，則字不能是丘，宮內廳本：𠀈，國圖本有斷板，嶗山本誤。

貞一二十四行地滋逺。嶗山本：遠。

󹦻舌嶗山本：習舌

壞，󰗬

嶗山本潔一、潔二為明刻原本，錯誤很少。

潔一十一 司命。國圖本：可命。

潔二三，此頁斷板與嶗山、宮內廳不同，顯然經過修復。一直到潔二五，國圖本每行第一个字有誤，是三頁後的內容，也就是前後內容反了。

附錄