诗人作品中提到“酒”
一半是在追思,三成是开心
团队不仅分析了《全宋词》文本表面的信息,还深入挖掘宋词所表达的意象含义,整合成意象情绪图。
意象情绪图选取了30个像“月”“酒”等常见的字词,以苏轼、李清照等24位高产词人作为代表。通过大数据分析,得出这些意象词汇所表示的情绪,并将情绪分为五种——“喜怒哀乐思”,然后用饼状图表现出各种字词所表示的不同情绪的比例。
比如诗人在写“酒”时,近半数想要表现的意象是怀念和思考。陆游写“红酥手,黄滕酒”,或者晏殊写“一曲新词酒一杯,去年天气旧亭台”,都是在追忆故人以及对人生的思考。还有近三成,是类似朱敦儒笔下“日日深杯酒满,朝朝小圃花开”的开怀一笑。
那么,大数据技术是如何从宋词的字里行间体察到词人当时的情绪呢?
首先,团队需要将基本只表示某种特定情绪的典型意象整理出来。张玮说,为了更精确,团队还专门请来浙大文学院博士胡秋研进行了核对。
负责数据分析和前端开发的潘如晟告诉记者,他们会用大数据分析上下文,根据典型意象去计算该字词属于某一情绪的概率,得出诗人最有可能想要表达的情感。
简单来说,比如诗人张在的《题兴龙寺老柏院》中写到:“南邻北舍牡丹开,年少寻芳日几回。惟有君家老柏树,春风来似不曾来。”其中,“松柏”表达的就是一种“追思”的情绪。再联系上下文,可以得出“牡丹”和“春风”想要传达的也是“思”。
通过可视化的数据呈现
让唐诗宋词真正通俗易懂
当问及这项研究的难点所在,张玮首先提到的是图表的选择。为了找到最合适的数据呈现方式,许多图表都是几易其稿。
合适的图表,既要美观,又要能涵盖所需要呈现的信息,同时还要表现得直观,还要与读者进行比较顺畅的互动,这着实让团队费了不少工夫。据张玮介绍,团队曾尝试用“小山峰”视图去表现词的抑扬顿挫,但考虑到图像重叠影响观感,又不利于摆放意象图像,最后只能作罢。
“人是视觉性的,可视化形式的科普手段,可以把晦涩的古诗词变得通俗易懂,让科普摆脱说教或者沉闷的刻板印象,从而起到推广传统文化的作用。”浙江大学计算机科学与技术学院副院长陈为说。
这项研究定位是科普,因此选择分析的对象也以唐诗宋词最基本的内容为主。张玮说:“这个产品的制作并不是为了得出某一结论,而是给人们提供一种探索唐诗宋词的有趣工具。”因此,更多有意思的结论还有待于读者们去发现。
本文转载至互联网,不代表福建高考网立场,如有侵权,请联系官方删除
注:通过加密传输不会对外展示联系方式
官方企业微信
官方微信公众号
志愿填报小程序