|
|
8.
大语言模型的语言能力评测研究:特征、路径和趋势
易保树, 倪传斌
江汉学术
2025, 44 (4):
73-83.
DOI: 10.16388/j.cnki.cn42-1843/c.2025.04.007
回顾大语言模型(Large Language Models,LLMs)语言能力发展研究,对比LLMs与人类语言学习特征的差异,从学习环境和机制、语言特异性泛化能力测量及语法能力测评多维度探讨LLMs的语言能力评测及其理论启示,可以发现:学习环境层面,LLMs凭借海量单模态文本输入实现高效统计泛化,而人类在生态效度更高的多模态交互中发展语言能力,二者形成互补性差异;针对语言天赋论的核心假设,通过消融实验、无监督和监督测试三类范式,揭示LLMs虽缺乏人类先验语法特异性,却能通过统计模式复现部分语法规则;语法能力测评表明,LLMs虽可习得表层句法结构,但对深层递归性、语义—句法接口等人类特异性特征的建模仍存在显著局限。同时,LLMs的涌现能力对刺激贫乏论与语言天赋假设构成双重挑战,并推动计算语言学与理论语言学、认知科学等领域的范式融合。未来大模型语言能力测评需聚焦语言形式与功能的认知解耦机制,探索跨学科方法论协同路径,以厘清LLMs语言能力边界。
相关文章 |
多维度评价 |
评论(0)
|
|