AI × 应用语言学前沿2026. 05. 28. 08:09:36标准不够深:五项新基准挑战 LLM 的语言理解下限语用量级偏差、篇章跨句整合、田野语言学元推理、阿拉伯语形态句法、词序计算可学性——五项新基准从不同维度指向同一个发现:LLM 的流利与高分,掩盖了深层语言理解能力的系统性缺口。
AI × 应用语言学前沿2026. 05. 27. 12:32:15语言均质化机器:LLM 预训练的语体偏见与方言的代价LLM 预训练数据里的语体偏见、写作助手对非主流英语的文化标记抗除、方言与非标准语言在 AI 系统中面临的结构性局限——三篇论文从数据、模型行为和制度批判三个层面提问:谁的语言被 AI 当成默认值?
AI × 应用语言学前沿2026. 05. 27. 12:32:01BabyLM 实验室:语言习得理论在大模型里如何接受检验?BabyLM 双语实验发现双语输入对统计学习者没有原则性障碍;小规模模型在而这个实验中把实证了构式语法的“统计先发抑制”构延“不可说”的因果来源;其中一篇坑进百个词的场景如何预测児童词汇习得难度。