
近日,第64届计算语言学协会年会(The 64th Annual Meeting of the Association for Computational Linguistics, ACL 2026)公布论文接收结果,香港中文大学(深圳)理工学院共有4篇研究成果被大会收录。这一成果充分体现了理工学院在自然语言处理与人工智能领域扎实的科研实力与创新能力,也彰显了理工学院师生在前沿交叉领域深耕探索、持续产出创新成果的学术活力。
在本次被收录的论文中,论文一的通讯作者为理工学院赵俊华教授,论文二、三、四的独立通讯作者为理工学院唐晓莹教授,参与作者包括12位理工学院学生/毕业生:
本科生:霍煜、寿浩然、谢雨露
硕士研究生:吴阳、邓文博
博士研究生:程裕恒、何奕锐、王志超、刘皓月、柳文轩、郭永新、赵焕


01
计算语言学协会(ACL,Association for Computational Linguistics)成立于1962年,是自然语言处理(NLP)与计算语言学领域的国际顶级学术组织。协会创立之初命名为"机器翻译与计算语言学协会"(AMTCL),1968年正式更名为现名。ACL每年夏季举办年度学术会议,是该领域公认的顶级国际学术会议,同时也是中国计算机学会(CCF)推荐的人工智能方向A类会议。协会亦主办由麻省理工学院出版社(MIT Press)出版的权威学术期刊《计算语言学》(Computational Linguistics),其年会与期刊长期被视为该领域最具代表性的学术交流与成果发表平台。本届会议(ACL 2026)共收到12148份有效投稿,主会接受率为19%,Findings接受率为18%。
来源:
https://www.aclweb.org/portal/what-is-cl


论文介绍
02
1
EngiBench: A Benchmark for Evaluating Large Language Models on Engineering Problem Solving
摘要:
大语言模型(LLMs)在定义明确的数学推理任务中已展现出较强性能。然而,现实世界中的工程问题通常具有不确定性、情境依赖性以及开放性特征,远超纯符号计算的范畴。现有基准主要聚焦于定义良好或抽象的推理任务,难以刻画上述复杂性。为此,我们提出了EngiBench,一个用于评估LLMs解决工程问题能力的分层基准。该基准涵盖三个递进难度层级(基础知识检索、情境推理和开放式建模),并覆盖多个工程子领域。为深入分析模型性能,我们进一步将每个问题系统性地改写为三类可控变体(扰动版本、知识增强版本和数学抽象版本),从而分别评估模型的鲁棒性、领域知识以及数学推理能力。实验结果表明,模型性能随任务难度增加而显著下降,在轻微扰动下表现退化明显,并在高层次工程任务上显著低于人类水平。上述结果揭示,当前LLMs仍缺乏应对真实工程问题所需的高层次推理能力,表明未来亟需发展更具深度与可靠性的求解能力。
该论文被ACL Findings接收,第一作者为金融工程专业毕业生周茜缘,王馨蕾博士。通讯作者为理工学院赵俊华教授,INSAIT顾津锦教授,南洋理工大学徐岩教授。本文的作者还包括理工学院新能源科学与工程专业本科毕业生谢雨露,计算机与信息工程专业在读硕士生吴阳,计算机与信息工程专业在读博士生何奕锐、程裕恒,计算机与信息工程专业博士毕业生柳文轩、赵焕。
2
Adaptive Prompt Structure Factorization: A Framework for Self-Discovering and Optimizing Compositional Prompt Programs
摘要:
在大语言模型时代,提示词的质量直接决定了模型在推理、问答等任务中的表现。然而,现有的自动提示词优化方法通常将整条提示词作为不可分割的整体进行重写,导致功能模块间相互干扰,难以精确定位性能瓶颈,且优化开销高昂。

本文提出了aPSF(Adaptive Prompt Structure Factorization)框架,核心思想是将提示词分解为多个可独立优化的语义因子(如任务描述、推理策略、输出格式等),并通过误差引导的单因子干预更新机制,实现对性能瓶颈的精准定位与定向优化。具体而言,aPSF首先利用LLM的自省能力将提示词自动分解为结构化的语义因子;随后在每轮优化中,通过分析错误样本诊断失败原因,智能选择最相关的因子进行针对性更新,同时保持其余因子不变,有效避免了全局重写带来的不稳定性。

在GSM8K、AQUA、BBH等多个复杂推理基准上,aPSF稳定优于OPRO、GrIPS、CriSPO等主流方法,平均准确率最高提升达+2.16个百分点;同时将优化Token开销降低45%–87%,甚至仅需1步即可达到最优性能。该工作使提示词优化过程从不可解释的“整体试错”转变为可归因、可分析的结构化优化过程。
论文第一作者为理工学院计算机与信息工程专业在读博士生刘皓月,通讯作者为理工学院唐晓莹教授。本文其他的主要作者来自唐晓莹教授课题组,包括:计算机与信息工程专业在读博士生王志超,计算机与信息工程专业博士毕业生、港中大(深圳)T-Lab郭永新和电子与计算机专业在读本科生、港中大(深圳)T-Lab实习生寿浩然。论文已被 ACL 2026 Main Conference 接收。
3
G²RPO-A: Guided Group Relative Policy Optimization with Adaptive Guidance for Small Language Model Reasoning
摘要:
现有GRPO等强化学习方法在大模型上效果显著,但迁移到1.7B及更小规模语言模型时,常受困于奖励稀疏,高质量推理轨迹难以稳定采样。针对这一瓶颈,本文提出 G²RPO-A(Guided Group Relative Policy Optimization with Adaptive Guidance),通过在 roll-out过程中注入高质量guidance,并依据训练状态自适应调整guidance强度,在降低训练难度的同时保留有效advantage信号。G²RPO-A的整体框架如下图所示。
该方法把guided与unguided completions联合纳入训练,并根据近期奖励变化动态调整 guidance length,在“被扶一把”和“自己学会走”之间自动切换。相较于固定长度guidance,G²RPO-A更适合小模型推理训练的非稳定优化过程。
在多个主流模型家族和数学、代码任务上的实验表明,G²RPO-A显著优于vanilla GRPO。以Qwen3-1.7B为例,MATH500从50.96提升至67.21,HumanEval从46.08提升至75.93,说明自适应指导对小模型推理能力提升尤其有效。

进一步的训练动态分析表明,G²RPO-A不仅提升reward,还保持更健康的advantage方差,从而缓解naive guidance容易“奖励上去了、训练却学不动”的问题。

论文作者包括理工学院唐晓莹教授课题组的计算机与信息工程专业在读研究生邓文博、计算机与信息工程专业博士毕业生郭永新,通讯作者为唐晓莹教授。论文已被 ACL 2026 Main Conference 接收。
论文链接:
https://arxiv.org/abs/2508.13023
代码链接:
https://github.com/T-Lab-CUHKSZ/G2RPO-A
4
RepoShapley: Shapley-Enhanced Context Filtering for Repository-Level Code Completion
摘要:
现有的“检索增强”(RAG)代码补全方法在上下文控制上往往存在关键缺陷。在实践中,它们依赖于独立的片段评分机制,难以捕捉代码片段间复杂的“交互依赖”:某些片段只有在与互补上下文(如接口声明与实现)配对时才有用,而有些在存在冲突证据(如过期与新版API)时反而会损害生成质量。
本文提出了 RepoShapley,一种新颖的联盟感知上下文过滤框架,通过引入Shapley值来量化跨文件证据的边际贡献,实现了真正“考虑交互作用”的精准检索控制。我们通过ChunkShapley模块构建了离线标签,结合单块探测、逻辑替代博弈以及解码时验证机制,捕捉片段间的互补性与冲突。随后,我们将这些验证后的保留/丢弃决策蒸馏为离散的控制Token,使单一模型能够在推理时自主决定何时检索以及保留哪些上下文。这种方法将检索控制转化为一个联盟博弈问题,允许模型在单次前向传播中剔除噪声并保留协同证据。
通过在RepoEval、CrossCodeEval和CCLongEval等多个基准测试上的广泛实验,我们证明了RePoShapley 不仅显著优于传统的独立评分基线(如CODEFILTER)和全量检索方法,还在所有测试的 11 项指标上达到了SOTA性能。此外,我们还展示了该方法在减少有害上下文和不必要检索方面的卓越能力:模型学会了识别并过滤掉那些在孤立检索中看似相关但在组合后会导致干扰的片段。RePoShapley为解决代码补全中复杂的跨文件依赖问题开辟了一种全新的范式。

通过在StarCoder-Base(1B/3B/7B) 和CodeLlama(7B/13B) 等多个主流模型家族以及 RepoEval、CrossCodeEval、CCLongEval等多个代码补全benchmark上的广泛实验,REPOShapley展现了其强大的上下文过滤能力和卓越的性能。REPOShapley不仅在所有测试的11项指标上均实现了SOTA性能,稳定超越了No-Retrieve、Full-Retrieve、RepoFormer和 CODEFILTER等基线方法,而且在处理高难度的跨文件依赖任务(如 API 补全和函数级补全)时表现尤为突出。例如,在StarCoder-Base-7B模型上,REPOShapley将 RepoEval API任务的Exact Match (EM) 从 53.62% 提升至 58.79%,将函数级单元测试通过率 (UT)从 37.79% 提升至 41.84%。另外,极高的推理效率与实用性:尽管使用了复杂的离线Shapley计算,但在推理阶段,REPOShapley的延迟(1053 ms/req)与现有的CODEFILTER基线(947 ms/req)相当,通过控制Token机制有效减少了不必要的检索开销,为开发者提供了一种兼顾性能与效率的解决方案。

论文第一作者为理工学院电子与计算机工程专业在读本科生霍煜,通信作者为唐晓莹教授。本文主要作者还包括中山大学本科生曾坤。该论文被ACL Findings接收。


作者简介
03

赵俊华
教授、英国工程技术学会会士(IET Fellow)、Elsevier中国高被引学者
澳大利亚昆士兰大学博士
(上下滑动查看教授简介)
赵俊华教授是香港中文大学(深圳)理工学院教授,深圳河套学院“人工智能+能源”实验室秘书长,中新智慧储能联合研究中心执行主任,深圳高等金融研究院能源市场与能源金融实验室主任,深圳人工智能与机器人研究院群体智能中心副主任。他回国前曾担任澳大利亚纽卡斯尔大学智能电网研究中心主任科学家,在澳大利亚有11年的电力行业从业经验。长期从事智能电网、电力市场、低碳转型、人工智能等方面的研究工作。在国际、国内著名期刊和国际会议上发表论文400余篇,其中包括Nature子刊Nature Reviews Electrical Engineering1篇、Nature Communications1篇、Scientific Data2篇、Cell子刊Joule1篇,Patterns1篇,Nexus1篇,中国工程院院刊Engineering2篇,IEEE Transactions收录论文100余篇。发表的论文被国内外引用21000余次,H-index为71(根据Google Scholar统计)。合著英文著作两部。
2023年当选英国工程技术学会会士(IET Fellow)。2023年获评麻省理工科技评论“中国智能计算创新人物”。2021–2024年连续入选Elsevier“中国高被引学者”。2023-2024年连续获国际金融论坛(IFF)“全球绿色金融奖”。2025年获中国人工智能学会“全国人工智能应用场景创新挑战赛”特等奖,中国电力企业联合会“电力创新奖”特等奖,中国能源研究会“能源创新奖”一等奖。2022年获广东省电力科技杰出贡献奖。2020年获得浙江省自然科学二等奖。2020年获国际期刊Energy Conversion and Economics年度最具影响力论文。2017年获澳大利亚达沃斯论坛(ADC Forum)授予青年科学家奖(Young Scientist of the Future)。2017年获国家科技部“中国百篇最具影响力中文科技期刊论文”奖。2016年获得顶级期刊IEEE Transactions on Smart Grid授予最佳审稿人奖。2014年获得IEEE电力与能源大会(IEEE PES General Meeting)最佳论文奖(Best Paper Award)。两次获得湖南省科技进步二等奖。2020年获深圳特区金融学会重点课题评选二等奖。
他的研究成果在工业界产生了重要影响,担任我国首个省级电力现货市场和首个区域电力现货市场的专家组成员,参与了国内首个跨境碳交易产品的设计。参与开发的多个软件产品先后应用于纽约爱迪生公司、港灯集团、广东省能源集团、中海油、大唐发电等大型能源企业。主持国家自然科学基金重点项目、面上项目、澳大利亚“智能电网、智能城市”示范项目、澳大利亚科学院(CSIRO)“未来电网”重大专项项目等重大科技项目数十项。
他还是深圳市决策咨询委员会委员。南方电网数字电网集团(深圳)、深圳能源集团科技创新委员会委员。招商银行总部特聘能源行业专家。《澳大利亚国家展望报告(Australian National Outlook)》特邀外部专家。IEEE Special Interest Group (SiG) on Active Distribution Grids and Microgrids联合主席。IEEE PES SBLC (Smart Building, Load and Customer) 亚太工作组秘书,国际智能电网联盟(GSGF)“Interfaces of Grid Users/ Focus on EV and Local Storage”专家组成员。担任国际期刊Power Grid Engineering Science副主编,担任Scientific Data (Nature Portfolio)、IEEE Transactions on Network Science and Engineering、Energy Conversion and Economics、Smart Power & Energy Security等多个国际期刊编委。
•

唐晓莹
助理教授、校长青年学者
香港中文大学博士
(上下滑动查看教授简介)
唐晓莹博士,香港中文大学(深圳)理工学院助理教授、博导、校长青年学者。主要研究方向为大模型(推理、多模态、MOE)、联邦学习、电动车充电调度与智能优化等,近年来在ICML、NeurIPS、ICLR、CVPR、ICCV、AAAI、IEEE SmarGridComm、TMC、TII、TSG、TPWRS、IOTJ等国际期刊和会议发表学术论文 80 余篇,以第一作者获得IEEE通信协会智能电网旗舰会议IEEE SmartGridComm 2013最佳论文奖(年度唯一),并获 IEEE/ACM ASE 2023杰出论文奖、IEEE SmartGridComm 2024年度最佳论文奖(年度唯二)、IEEE ICCT 2024最佳海报报告奖等,以第一作者在国际知名出版社 Springer 出版科研专著 1 部,现担任国际期刊IEEE TMC(中科院1区Top、CCF A类)和IEEE IOTJ (JCR一区)期刊编委,以及 Nature Machine Intelligence、ICML、NeurIPS、ICLR等国际期刊或会议审稿人。入选2024 腾讯犀牛鸟专项研究计划、广东省青年人才计划,担任IEEE PES中国区电动汽车技术委员会委员、电动汽车与能源交通系统融合技术分委会常务理事、广东省计算机学会移动与边缘计算专委会常务委员、深圳市人工智能学会理事。获四川省国际“互联网+“大学生创新创业大赛优秀指导教师奖、全国大学生数学建模竞赛广东赛区优秀指导老师、香港中文大学(深圳)理工学院2023年度杰出贡献奖等。作为项目负责人主持多项中国南方电网、腾讯等知名头部企业项目。
学生作者简介(部分)

霍煜,理工学院电子与计算机工程专业在读本科生。目前在唐晓莹教授课题组参与科研工作,主要研究方向为大语言模型、代码生成与代码智能、多模态推理及联邦学习。

周茜缘,金融工程专业2024届本科毕业生。现于新加坡南洋理工大学攻读博士学位。主要研究领域为大语言模型和能源市场。

邓文博,理工学院计算机与信息工程专业硕士研究生(MPhil),本科毕业于合肥工业大学。其研究兴趣包括大语言模型推理、注意力机制与可解释性,当前聚焦于通过改进 GRPO 等强化学习方法提升小语言模型推理能力。

理工学院计算机与信息工程专业在读博士生刘皓月。

郭永新,理工学院计算机与信息工程专业博士毕业生,现为淘宝天猫集团算法工程师。其研究兴趣包括大语言模型训练与推理效率、多模态大模型等。本次发表论文工作延续了其在小模型推理与强化学习优化方面的研究。
供稿 | 教授团队提供
港中大(深圳)理工学院推广及传讯组出品
【END】
点击以下链接,进入理工时刻:
活动邀请 | 港中大(深圳)理工学院2026年卓越本科生夏令营最全指南








精选推荐

更多大学校园动态,请关注
