人工智能复原古人(如何用最先进的人工智能技术鉴定古籍)
人工智能复原古人(如何用最先进的人工智能技术鉴定古籍)据方广锠介绍,鉴定工作始于2011年,他为此与电脑软件工程师一起开发了“中华古籍数字化整理”和“敦煌遗书专用检索软件”两套系统,能够将需鉴定的古籍上每个字切割下来单独考察,并对现有敦煌遗书经卷按字进行检索,便于对经书上字的结字、书风和用笔特点进行人工比对。如今,近七成敦煌遗书保存在英法等海外博物馆和研究机构,中国国家图书馆现存1万余卷。因此,每一件流失的敦煌遗书被重新找回之后,都需要经过严格鉴定与考证。此次负责鉴定“敦煌遗书”《成实论》卷二的是敦煌遗书研究专家、上海师范大学法政学院教授方广锠。古书画鉴定的“数字助手”敦煌遗书一直是中国考古界的遗憾。1900年,敦煌藏经洞内6万余卷4至11世纪的经书佛画陆续被西方探险者们以极低的价格骗劫而去,其余部分则散落民间,成为官宦与收藏家们的玩物,或流入古物市场,由此也出现了大量的敦煌遗书赝品伪卷。法国汉学家伯希和在敦煌藏经洞内调查,挑选出2000余卷
文物鉴定能否借助计算机技术?擅长视觉和图像识别的AI能否助力古画文玩鉴定?如今,这一设想正在化为现实。
“敦煌遗书”《成实论》卷二将在北京中国嘉德2019年春拍预展亮相,这卷作于南梁天监十六年(公元517年)的佛经,是全球存世的两件南朝写经之一,也是梁武帝在位时期的重要佛教记录。而此前的那件,便是当年英国汉学家斯坦因从敦煌带走的《大般涅槃经》卷十一,现藏于大英图书馆,书于南梁天监五年(公元506年)。
敦煌遗书《成实论》卷二 梁天监十六年(517)比丘惠谛写本 局部
在这卷完整度高、字迹隽逸精美的经书引来惊叹与瞩目的背后,则是敦煌学专家学者长达数年运用科技,结合历史资料严密考察和鉴定的心血。
古书画鉴定的“数字助手”
敦煌遗书一直是中国考古界的遗憾。1900年,敦煌藏经洞内6万余卷4至11世纪的经书佛画陆续被西方探险者们以极低的价格骗劫而去,其余部分则散落民间,成为官宦与收藏家们的玩物,或流入古物市场,由此也出现了大量的敦煌遗书赝品伪卷。
法国汉学家伯希和在敦煌藏经洞内调查,挑选出2000余卷最有价值的带回巴黎(图片来源:维基百科)
如今,近七成敦煌遗书保存在英法等海外博物馆和研究机构,中国国家图书馆现存1万余卷。因此,每一件流失的敦煌遗书被重新找回之后,都需要经过严格鉴定与考证。此次负责鉴定“敦煌遗书”《成实论》卷二的是敦煌遗书研究专家、上海师范大学法政学院教授方广锠。
据方广锠介绍,鉴定工作始于2011年,他为此与电脑软件工程师一起开发了“中华古籍数字化整理”和“敦煌遗书专用检索软件”两套系统,能够将需鉴定的古籍上每个字切割下来单独考察,并对现有敦煌遗书经卷按字进行检索,便于对经书上字的结字、书风和用笔特点进行人工比对。
敦煌遗书鉴定专家方广锠通过数字软件做比对鉴定(图片来源:上海纪实)
“这样的方法比鉴定者自己一个字一个字在古经卷中去寻找快捷方便许多,且可以一次性地、遗漏地集中比对每个字的所有字形。”方广锠告诉记者。
以《成实论》卷二的考察为例,在流失的敦煌遗书中常有人在真卷上伪造题记。为判断本卷题记与原卷经文出于一人之手,方广锠通过数字检索软件的帮助对比了题记的35字与原卷经文的5708字,由此肯定全本都为比丘惠谛所写。
敦煌遗书《成实论》卷二 梁天监十六年(517)比丘惠谛写本 题记
人与机器的笔触识别对决
虽然AI拥有视觉和图像识别优势,但文物鉴定仍是一个高度依赖研究者目鉴经验和直觉的行业,学者需要对真品研究和大量史料积累才能判断真伪。虽然“走眼”的情况也时有发生,但人工鉴定的传统方式仍以绝对优势胜过人工智能的应用。
学者运用文物鉴定放大镜进行研究考察
考古学上,检测古书画纸张年代的方法主要有红外线材质分析、碳-14和气相色谱分离等技术。最靠谱的年代测定技术为“碳-14断代法”。可是该方法取样样本量大,会对珍贵的纸本古籍造成损伤,因此历来是考古学家们“没有办法的办法”。绝大多数古籍书画的断代,还是从历史工艺、书绘风格和文字来分析断代。
“以人工智能进行古书画和古籍的鉴定,是一个值得探索的方向,而且在未来肯定可以在鉴定中起到重大作用。”方广锠推测。AI关注的是古籍书画的书绘风格而非材质。而每个画家或书法家的用笔特点,例如笔触的形状和曲度、挥笔的速度等,当拥有足够多的作品数据就可以找到艺术家独有的“艺术指纹”,成为辨别真伪的钥匙。
目前,国内也已经出现了一些从事“AI鉴宝”研究的创业公司,而美国新泽西州的罗格斯大学教授艾哈迈德·埃尔加马尔(Ahmed Elgammal)也开发出了AI鉴宝的工具。研究人员用来自毕加索、马蒂斯和莫迪利亚尼的近300幅原作,并将其分解成8万个单独笔触,通过RNN深度学习框架为每位艺术家建立数据集。据报道这种方法的准确率可达70-90%之间,而且AI鉴宝的工作速度快,成本也很低,几秒之内就能“一眼”看出画师真迹与赝作。
对毕加索的画作进行笔触分割用颜色标出
AI也在考古领域越来越多地运用,宁夏大学也曾运用AI破解“天书”西夏文。这项技术为OCR计算机字符识别技术,事实上与我们在手机使用的“传图识别文字”的原理一致。
学者对37个西夏文的解读
西夏文笔画复杂难以识读,一个个地查字典式地比对非常耗时费力,可用AI依据西夏文的结构,提取特征自动识别,快速判别出每个西夏文对应的汉字,这项技术在240类9600个西夏文上进行了试验,识别率达到87.99%。
“AI鉴宝”带来的新问题
AI正在为古籍鉴定和研究做出积极贡献,但很多研究专家还未摆脱传统思维模式的习惯,这有赖于人工智能与考古领域的学者长时间跨界合作才能实现。
于此同时,“AI鉴宝”的缺点也是显而易见的。AI擅长模式识别,而这一依据对于古籍书画鉴定而言太过片面。许多真伪的线索不仅仅蕴藏在艺术家的绘画或笔迹风格之中,作品的提款文字、画名史料记载也是不可忽视的判定线索。
以《富春山居图》的真假鉴别为例,伪作《富春山居图·子明卷》甚至骗过了乾隆皇帝的眼睛,而后来艺术史学家发现它与真迹《富春山居图·无用师卷》对比是赝品的重要证据就在于史料的破绽:同一月里画家黄公望的确为子明作的山水画,但史料的记载与《富春山居图》并不相同,这样工程浩大作品不可能在一月内完成两张。通过理解古籍文献判断真伪,就人类而言尚且需要深厚专业知识的积累,训练AI查找并读懂古籍作为鉴定文物的依据,还有大量问题尚未解决。
满是乾隆题跋的《富春山居图》子明卷 台北故宫博物院藏
其次,难以学习人类的鉴赏力也是AI的硬伤。鉴赏作品的所唤起审美力和情感是最难以被转换为具体算法的抽象问题,同一艺术家不同作品孰优孰劣?哪件更具有代表性和创造灵感?这些问题如何转化为机器语言,至今还是人工智能科学的难题。AI对于考古和鉴定界目前只是一个备受期待的技术工具。
来源:天下网商