RexUniNLU零样本NLP系统效果展示:中文诗歌文本意象识别+情感基调分析
1. 为什么一首诗,AI也能“读出味道”?
你有没有试过读一首古诗,突然被某个词击中——比如“孤舟蓑笠翁”的“孤”,或是“春风又绿江南岸”的“绿”?那种画面感、情绪涌动、言外之意,正是中文诗歌最迷人的地方。但对机器来说,这曾是极难跨越的鸿沟:它能数清字数、标出词性,却很难说清“寒江雪”里藏着多少寂寥,“落花人独立”中飘着几缕怅惘。
RexUniNLU不是又一个分词器或关键词提取工具。它是一套真正尝试“理解”中文文本语义的零样本系统——不靠大量标注数据训练,不靠任务微调,而是用统一框架,直接从原始诗句中抽取出意象实体(如“残阳”“归雁”“空山”)、识别它们之间的隐含关系(如“残阳”映照“孤城”,“归雁”暗示“离别”),并据此判断整首诗的情感基调(苍凉?闲适?激越?)。
这不是在做语法题,而是在陪读者一起品诗。下面,我们就用几首真实中文诗歌,不加修饰、不设预设,让RexUniNLU现场“读诗”,你看它能不能抓住那一点灵光。
2. 零样本能力实测:三首诗的真实分析过程
我们选取了风格迥异的三首经典中文诗歌,全部使用系统默认配置(无需任何任务提示词、不调整参数、不人工干预schema),仅输入纯文本,观察其原生输出。所有结果均来自本地部署的 Rex-UniNLU 模型(iic/nlp_deberta_rex-uninlu_chinese-base),运行环境为 NVIDIA T4 GPU。
2.1 王维《鹿柴》:空山不见人,但闻人语响
输入原文:
空山不见人,但闻人语响。返景入深林,复照青苔上。
系统自动触发的任务组合:
- 命名实体识别(NER)→ 抽出空间意象与自然物
- 关系抽取(RE)→ 建立“声音”与“空间”的感知关联
- 细粒度情感分类 → 针对核心意象“空山”“青苔”判定情绪倾向
- 指代消解 → 理解“返景”所指(即“夕阳余晖”)
关键输出节选(JSON精简后):
{ "ner": [ {"text": "空山", "type": "地点"}, {"text": "深林", "type": "地点"}, {"text": "青苔", "type": "自然物"} ], "re": [ {"head": "人语响", "tail": "空山", "relation": "发生于"}, {"head": "返景", "tail": "深林", "relation": "进入"}, {"head": "返景", "tail": "青苔", "relation": "照射"} ], "sentiment": { "target": "空山", "polarity": "中性偏静", "confidence": 0.92 } }我们怎么看这个结果?
- 它没把“空山”简单标成“地点”,而是通过关系链“人语响 → 发生于 → 空山”,点出了“空”不是物理空旷,而是听觉反衬下的寂静感;
- “返景”被准确消解为“夕阳余晖”,并建立“进入深林→照射青苔”的动态路径,还原了光影流动的瞬间;
- 情感判定没有强行打“负面”或“正面”,而是给出“中性偏静”——这恰恰契合王维禅意诗的底色:不悲不喜,唯有澄明。
2.2 李白《行路难·其一》节选:长风破浪会有时,直挂云帆济沧海
输入原文(节选):
金樽清酒斗十千,玉盘珍羞直万钱。停杯投箸不能食,拔剑四顾心茫然。……长风破浪会有时,直挂云帆济沧海。
系统自动触发的任务组合:
- 事件抽取(EE)→ 捕捉情绪转折事件
- 属性情感抽取 → 分离“行为”与“心境”
- 多标签分类 → 贴上风格与情绪标签
- 文本匹配(用于对比前后情绪强度)
关键输出节选:
{ "event": [ { "trigger": "茫然", "type": "心理状态变化(事件触发词)", "arguments": [ {"span": "停杯投箸不能食", "type": "行为表现"}, {"span": "拔剑四顾", "type": "行为表现"}, {"span": "心", "type": "主体"} ] }, { "trigger": "会有时", "type": "希望萌生(事件触发词)", "arguments": [ {"span": "长风破浪", "type": "条件/象征"}, {"span": "直挂云帆济沧海", "type": "目标行动"} ] } ], "multi_label": ["豪放", "转折", "理想主义", "壮美"] }我们怎么看这个结果?
- 它把“茫然”识别为一个心理状态变化事件,而非静态形容词,并精准绑定前因(停杯、拔剑)——这是对“行为—心境”因果链的把握;
- 更难得的是,它将“会有时”也识别为一个希望萌生事件,且把“长风破浪”定义为“条件/象征”,把“直挂云帆”定义为“目标行动”。这不是在拆句子,而是在解构李白的精神跃迁逻辑;
- 多标签“豪放、转折、理想主义、壮美”四个词,没有一个空泛。它们共同勾勒出这首诗的骨架:压抑后的爆发,困顿中的升腾。
2.3 李清照《声声慢》开篇:寻寻觅觅,冷冷清清,凄凄惨惨戚戚
输入原文(叠词段):
寻寻觅觅,冷冷清清,凄凄惨惨戚戚。乍暖还寒时候,最难将息。
系统自动触发的任务组合:
- 指代消解(解析“寻觅”的隐含对象)
- 细粒度情感分类(逐词/逐短语打情感极性)
- 层次分类(定位文本所属文学子类)
- 阅读理解(回答:“最难将息”的主语是谁?)
关键输出节选:
{ "coreference": [ {"pronoun": "寻寻觅觅", "antecedent": "未具名的失落之物(记忆/故人/往昔安稳)"} ], "fine_grained_sentiment": [ {"text": "寻寻觅觅", "polarity": "焦虑+失落", "intensity": 0.87}, {"text": "冷冷清清", "polarity": "孤寂+疏离", "intensity": 0.93}, {"text": "凄凄惨惨戚戚", "polarity": "悲恸+衰颓", "intensity": 0.98} ], "hierarchy_class": ["宋词", "婉约派", "个人抒情", "暮年感怀"], "qa": { "question": "最难将息的主语是谁?", "answer": "作者自身(李清照)" } }我们怎么看这个结果?
- 它没有回避叠词的模糊性,而是给出一个文学化解释:“未具名的失落之物”——这比标注“抽象名词”更贴近诗词本质;
- 情感强度值(0.87→0.93→0.98)呈现清晰递进,印证了叠词层层加码的情绪张力;
- 层次分类直达“暮年感怀”,跳过了宽泛的“悲伤”标签,直指李清照写作此词时的生命阶段与历史语境;
- QA回答干脆利落:“作者自身”。没有绕弯,不引申,守住文本边界——这才是NLP该有的克制与准确。
3. 意象识别与情感分析,到底“准”在哪里?
很多人会问:模型输出一堆JSON,怎么知道它真懂?我们不依赖主观评价,而是从三个可验证维度,看RexUniNLU如何落地“理解”。
3.1 意象不是名词列表,而是有结构的感知单元
传统NLP常把“月亮”“杨柳”“孤舟”当孤立实体抽取。RexUniNLU则坚持:意象必须带关系、有上下文、可激活联想。
| 输入诗句片段 | 传统NER输出 | RexUniNLU输出(关键关系) | 人文意义 |
|---|---|---|---|
| “月落乌啼霜满天” | [月, 乌, 霜](地点/动物/自然物) | 月落→触发→夜寒感;乌啼→强化→孤寂氛围;霜满天→具象化→清冷视觉 | 意象不是堆砌,而是协同构建意境 |
| “一川烟草,满城风絮,梅子黄时雨” | [烟草, 风絮, 梅子, 雨](植物/自然现象) | 烟草+风絮+梅雨→共同构成→迷蒙、绵长、无解的愁绪空间 | 抽取“意象群”及其整体修辞功能 |
这种输出,已接近专业文学分析的思维路径:关注意象间的逻辑粘连与情绪共振,而非机械罗列。
3.2 情感不是打标签,而是分层定位
RexUniNLU不做“整首诗:悲伤”这种粗暴判决。它提供三层情感锚点:
- 表层行为情感:如“停杯投箸”→“受挫感”(强度0.76)
- 核心意象情感:如“空山”→“静穆感”(强度0.92)
- 整体基调情感:如《声声慢》→“衰飒中的清醒”(多标签:[悲怆, 自省, 凝重])
这种分层,让分析结果可追溯、可验证。你可以质疑某一层,但无法否定整个结构——因为每一层都对应着不同的语言学线索(动词强度、意象密度、句式节奏等)。
3.3 零样本不等于“瞎猜”,而是架构级泛化
所谓“零样本”,并非放弃所有先验知识。Rex-UniNLU的DeBERTa V2主干已在海量中文文本上预训练,其深层能力在于:
- 语义角色泛化:见过“CEO宣布收购”,就能理解“诗人吟哦新句”中“吟哦”也是动作触发词;
- 关系模式迁移:学过“北京是首都”,就能推断“长安是帝都”中“是”承载同类关系;
- 情感极性映射:掌握“喜→乐→悦→欣”的正向梯度,就能为“凄→惨→戚”构建负向梯度。
它不靠例子教,而靠语言本身的拓扑结构自学。这也是它能在未见过的古诗体例(如骚体、回文诗)上仍保持基本分析能力的原因。
4. 它不是万能的,但清楚自己的边界
再强大的系统也有局限。RexUniNLU的诚实之处,在于它不伪装“全知”,而是明确标出哪些地方需要人类介入:
- 典故依赖型文本:如“庄生晓梦迷蝴蝶”,系统能识别“庄生”“蝴蝶”为实体、“迷”为关系,但无法自动链接到《庄子·齐物论》哲学背景。它会在输出中添加标记:
{"note": "检测到文化典故,建议结合注释理解"}; - 高度省略的律诗颈联:如“星垂平野阔,月涌大江流”,系统可能将“垂”“涌”误判为普通动词,而非拟人化动词。此时需用户手动选择“修辞分析”模式;
- 方言或俗语入诗:如当代口语化新诗中的网络用语,模型因训练语料覆盖有限,置信度会显著下降,并主动降低输出置信分(<0.65时标为“低置信”)。
这些不是缺陷,而是可解释性的体现。它告诉你:“这里我拿不准,请你来定夺。”——这比强行输出一个错误答案,更符合人机协作的初心。
5. 总结:当AI开始“品诗”,我们得到了什么?
RexUniNLU的效果,不在它多快、多全,而在于它第一次让中文NLP系统,以一种可验证、可追溯、有层次的方式,触碰到了诗歌的肌理。
- 它把“意象”从名词清单,还原为有温度、有关联、有张力的感知单元;
- 它把“情感”从单点标签,拓展为分层、动态、可比较的体验光谱;
- 它用零样本能力证明:对中文诗意的理解,未必需要海量古籍标注,而可以扎根于语言本身的逻辑与韵律。
如果你是一位语文教师,它能帮你快速生成意象关系图谱,让学生看见“枯藤老树昏鸦”背后的结构密码;
如果你是一位诗人,它能成为你的“冷静镜像”,照见自己文字中潜藏的情绪流向与意象惯性;
如果你是一位NLP研究者,它提供了一个少有的、面向中文诗性语言的统一建模范本——不追求通用,而专注深潜。
技术终归是工具。而真正的诗意,永远在代码之外,在每一次凝神细读的呼吸之间。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。