Command Palette
Search for a command to run...
Wiki
Machine Learning Glossary: Explore definitions and explanations of key AI and ML concepts
感受野是理解视觉信息处理的重要概念,为设计、分析和优化视觉模型提供参考。
SVG 实现了更快的扩散训练、高效的少步采样以及生成质量的提升。
RewardMap 提升了多模态大语言模型在结构化视觉任务中的能力。
一种新的基于原则的判别约束优化框架,避免了难度偏差和训练不稳定性。
ReinFlow 具有轻量级实现、内置探索功能,并能广泛适用于各种流策略变体。
FHE 广泛应用于云计算安全、联邦学习、医疗数据分析、金融数据协作等场景。
BRFL 意在解决模型聚合过程中出现的拜占庭攻击问题。
EGMN 成功捕捉了用户偏好和视频特征之间的潜在交互效应。
SAC Flow 在连续控制和机器人操作基准测试中达到最先进性能。
UserBench 旨在评估和促进智能体理解、交互和适应现实世界用户沟通的能力。
PLACER 具有快速和随机的特性,可以轻易生成预测集合来映射构象异质性。
RAE 凭借明显优势有望成为扩散 Transformer 训练的新默认选择。
基于 GRPO 等微调技术现有局限性,GVPO 作为一种可靠、多功能的后训练范式应运而生。
ReCA 在应用场景和系统规模上具有泛化能力,成功任务率提升了 4.3% 。
DexFlyWheel 是一个用于灵巧操作的、可扩展且自我改进的数据生成范式。
NovaFlow 能够在不同的机器人形态中处理刚性、铰接和可变形物体。
TreeSynth 在大规模数据合成方面展现出卓越鲁棒性和可扩展性。
GTA 在多个文本分类基准测试中均显著优于标准 SFT 基线和最先进的 RL 方法。
ACE 通过动态优化输入上下文使智能体能够自我改进。
Vibe-coding 的兴起,不仅改变了编程的形态,也重塑了软件开发的生态。
类比 LLM 领域的思维链概念,CoF 适用于当今的生成视频模型。
在三个对齐能力上的实验表明 TAE 的有效性,特别是真实性以极低成本超越基线 25.8% 。
彩票假说的出现,催生了一系列高效训练神经网络的方法。
TileLang 通过统一的块和线程范式以及透明的调度能力,能够满足现代 AI 系统开发所要求的强大功能和灵活性。
感受野是理解视觉信息处理的重要概念,为设计、分析和优化视觉模型提供参考。
SVG 实现了更快的扩散训练、高效的少步采样以及生成质量的提升。
RewardMap 提升了多模态大语言模型在结构化视觉任务中的能力。
一种新的基于原则的判别约束优化框架,避免了难度偏差和训练不稳定性。
ReinFlow 具有轻量级实现、内置探索功能,并能广泛适用于各种流策略变体。
FHE 广泛应用于云计算安全、联邦学习、医疗数据分析、金融数据协作等场景。
BRFL 意在解决模型聚合过程中出现的拜占庭攻击问题。
EGMN 成功捕捉了用户偏好和视频特征之间的潜在交互效应。
SAC Flow 在连续控制和机器人操作基准测试中达到最先进性能。
UserBench 旨在评估和促进智能体理解、交互和适应现实世界用户沟通的能力。
PLACER 具有快速和随机的特性,可以轻易生成预测集合来映射构象异质性。
RAE 凭借明显优势有望成为扩散 Transformer 训练的新默认选择。
基于 GRPO 等微调技术现有局限性,GVPO 作为一种可靠、多功能的后训练范式应运而生。
ReCA 在应用场景和系统规模上具有泛化能力,成功任务率提升了 4.3% 。
DexFlyWheel 是一个用于灵巧操作的、可扩展且自我改进的数据生成范式。
NovaFlow 能够在不同的机器人形态中处理刚性、铰接和可变形物体。
TreeSynth 在大规模数据合成方面展现出卓越鲁棒性和可扩展性。
GTA 在多个文本分类基准测试中均显著优于标准 SFT 基线和最先进的 RL 方法。
ACE 通过动态优化输入上下文使智能体能够自我改进。
Vibe-coding 的兴起,不仅改变了编程的形态,也重塑了软件开发的生态。
类比 LLM 领域的思维链概念,CoF 适用于当今的生成视频模型。
在三个对齐能力上的实验表明 TAE 的有效性,特别是真实性以极低成本超越基线 25.8% 。
彩票假说的出现,催生了一系列高效训练神经网络的方法。
TileLang 通过统一的块和线程范式以及透明的调度能力,能够满足现代 AI 系统开发所要求的强大功能和灵活性。