4月28日,arXiv人工智能板块单日狂飙370篇论文,大模型与智能体研究持续井喷。小编梳理了当日最具突破性的四项研究,看完直呼:AI的进化速度已经超出想象!首先是位置编码的颠覆性创新。论文《LearningtoRotate》提出SIREN-RoPE,打破了Transformer架构中旋转位置编码(RoPE)长期被视为固定手工设计的传统。研究团队将旋转空间视为可学习的、由信号调节的维度,通过双分支正弦网络注入连续时间戳、周期性时间模式和分类元数据。在大型社交网络新闻推荐系统的生产级数据集上测试,该方法在校准和排序目标上均带来持续性能提升,且计算开销几乎可以忽略。这相当于给Transformer打开了一个全新的"虚数轴",注意力机制的潜力被进一步释放。医疗AI评估领域迎来重大进展。《Case-SpecificRubricsforClinicalAIEvaluation》研究针对临床AI文档系统评估难题,提出了一种由临床医生编写案例特定评分标准的方法论。在对823个临床案例(736个真实世界案例+87个合成案例)的评估中,临床医生编写的评分标准有效区分了高质量与低质量输出,中位分数差距达82.9%。更令人惊喜的是,LLM生成的评分标准在与临床医生的排序一致性上(tau:0.42-0.46)甚至超过了临床医生之间的一致性(tau:0.38-0.43),而成本仅为前者的约千分之一。智能体能力评估有了新基准。《CanCurrentAgentsClosetheDiscovery-to-ApplicationGap?》提出了SciCrafter基准,基于《我的世界》红石电路任务来测试AI代理的发现到应用闭环能力。研究团队评估了GPT-5.2、Gemini-3-Pro和Claude-Opus-4.5等前沿模型,结果发现所有模型的成功率都卡在约26%的瓶颈。研究将这一闭环分解为知识缺口识别、实验发现、知识整合和知识应用四种能力,为诊断智能体失败模式提供了系统性框架。AI治理框架迎来理论突破。《GoverningWhatYouCannotObserve》提出了基于Aubin生存理论的AgentViabilityFramework,并实现了RiskGate系统。该框架通过监控、预测和单调限制三个必要且充分的性质,来应对智能体行为漂移、对抗适应和决策模式变化等安全风险。系统引入标量生存指数VI(t)∈[-1,+1]和基于首次通过时间t*的预测,将治理从事后反应转变为主动预测。这几项研究从底层架构创新、垂直领域应用、能力评估到安全治理,全方位展示了AI技术的前沿动向。AI资讯人工智能