南京大学外国语学院2022高端学术讲座之“文本连贯性测量方法探索”在云端成功举办

发布者:仇蓓玲发布时间:2022-05-25浏览次数:10


2022519日,南京大学外国语学院成功举办了以“文本连贯性测量方法探索”为主题的校庆高端学术讲座。本次讲座由北京航空航天大学外国语学院院长、博士生导师梁茂成教授主讲,南京大学外国语学院英语系主任周丹丹教授主持,南京大学外国语学院院长何宁教授出席讲座并致欢迎辞,南京大学外国语学院部分教师及硕博研究生,各兄弟院校、科研院所相关师生共300多人济济一堂,在云端聆听了讲座。

讲座以衔接与连贯两个基本概念作为导入,梁教授指出较好的衔接手段并不能保证较强的连贯性,因而仅通过语篇衔接手段考察文本的连贯性具有不可靠性,而早期文本连贯性的相关研究很大程度上局限于对语篇衔接纽带等文本表面特征的考察,但却忽视了对文本意义层面的考察。20世纪90年代出现的潜在语义分析方法(Latent Semantic AnalysisLSA)基于分布语义学的理论基础,对文本语篇句子间的语义相关性展开分析,极大地提升了文本连贯性的测量效果。梁教授以Coh-Metrix 3.0软件为例,展示了LSA对句子连贯性测量的内在原理,即通过对句子与句子之间及文本与文本之间的相似度分析,实现文本连贯性测评。梁教授进一步指出,Coh-Metrix软件对LSA起到了极大助推作用,但该软件内嵌的测评指标过多,包含大量与连贯性无关的考量指标,同时缺乏考虑语序和语境对语义的影响,因而具有不可避免的内在弊端。

接下来梁教授以sentence transformers深度学习技术为例,探讨了自然语言处理领域的技术革命对文本大数据处理带来的颠覆性影响。梁教授指出sentence transformers技术同时考虑了语序和语境对语义的影响,充分考虑了文本语篇中词与词之间的内在相互关系。随后,梁教授以Machinewrites网站提供的“summarization”,“text paraphrasing”,“content writing”预训练模型为例,展示了sentence transformers技术在英语文本写作领域的革命性应用。在此基础上,梁教授提出sentence transformers的技术优势能够与Coh-Metrix文本连贯性检测的相关考量指标相结合,应用于文本连贯性测评。为了检测该方法的有效性,梁教授将相关英语作文数据导入sentence transformers,对作文文本连贯性的两个维度展开测评,即作文相邻段落间的整体连贯性与相邻句子间的局部连贯性。随后sentence transformers的机器作文评测结果与具有较高测评信度的人工作文评测结果进行了相关性比较,结果表明sentence transformers对文本局部连贯性与整体连贯性的测评得分与人工测评得分具有较高的相关性与一致性。基于该检验结果,梁教授指出sentence transformers技术能够应用于对文本句子连贯性的探测与考察。

在应用语言学领域,客观、科学的文本连贯性测量方法对教材和教辅材料的选择、学习者作文质量评价等意义重大,利用sentence transformers技术对文本连贯性的测量探索对推动文本连贯性测量研究具有重要意义。本次讲座使外院师生充分认识到人工智能技术与语言大数据相结合催生的自然语言处理技术对语言研究所带来的革命性影响,拓宽了语言学人的研究视角,参会代表纷纷表示今后将积极尝试,努力将自然语言处理技术应用到理论语言学及应用语言学的相关研究当中。