HyperAI

Date

1 个月前

Organization

Paper URL

2510.26418

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding

Ready-to-use GPUs

Best Pricing

Get Started View Pricing

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

Date

1 个月前

Organization

Paper URL

2510.26418

Related Wiki

帧链 Chain-of-frames

类比 LLM 领域的思维链概念，CoF 适用于当今的生成视频模型。

2 个月前

多编程语言 MoE 架构：MultiPL-MoE

MultiPL-MoE 是后预训练阶段扩展低源编程语言的一种有效方法。

1 个月前

组方差策略优化 GVPO

基于 GRPO 等微调技术现有局限性，GVPO 作为一种可靠、多功能的后训练范式应运而生。

2 个月前

指数-高斯混合网络 EGMN

EGMN 成功捕捉了用户偏好和视频特征之间的潜在交互效应。

2 个月前

Cache-to-Cache（C2C）

C2C 通过转换和融合模型间的键值（KV）缓存，实现直接的语义交流。

1 个月前

HiPO 混合策略优化框架

HiPO 用于自适应 LLM 推理，主要包括混合数据构建和混合强化学习。

1 个月前

多智能体工作流程 CudaForge

CudaForge 是一个简单有效且低成本的用于 CUDA 内核生成和优化的多智能体工作流程。

1 个月前

门控注意力 Gated Attention

通义千问团队系统地研究了门控机制在标准 softmax 注意力中的作用。

1 个月前

赫胥黎–哥德尔机 Huxley–Gödel Machine

在编码代理环境下近似 Gödel Machine，并通过具有自适应调度的 Thompson 采样来指导扩展。

1 个月前

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding

Ready-to-use GPUs

Best Pricing

Get Started View Pricing

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

思维链劫持 Chain-of-Thought Hijacking

Build AI with AI

HyperAI Newsletters

Command Palette

思维链劫持 Chain-of-Thought Hijacking

Related Wiki

帧链 Chain-of-frames

多编程语言 MoE 架构：MultiPL-MoE

组方差策略优化 GVPO

指数-高斯混合网络 EGMN

Cache-to-Cache（C2C）

HiPO 混合策略优化框架

多智能体工作流程 CudaForge

门控注意力 Gated Attention

赫胥黎–哥德尔机 Huxley–Gödel Machine

Build AI with AI

HyperAI Newsletters

Command Palette

思维链劫持 Chain-of-Thought Hijacking

Related Wiki

帧链 Chain-of-frames

多编程语言 MoE 架构：MultiPL-MoE

组方差策略优化 GVPO

指数-高斯混合网络 EGMN

Cache-to-Cache（C2C）

HiPO 混合策略优化框架

多智能体工作流程 CudaForge

门控注意力 Gated Attention

赫胥黎–哥德尔机 Huxley–Gödel Machine

Build AI with AI

HyperAI Newsletters

Related Wiki

帧链 Chain-of-frames

多编程语言 MoE 架构：MultiPL-MoE

组方差策略优化 GVPO

指数-高斯混合网络 EGMN

Cache-to-Cache（C2C）

HiPO 混合策略优化框架

多智能体工作流程 CudaForge

门控注意力 Gated Attention

赫胥黎–哥德尔机 Huxley–Gödel Machine

Related Wiki

帧链 Chain-of-frames

多编程语言 MoE 架构：MultiPL-MoE

组方差策略优化 GVPO

指数-高斯混合网络 EGMN

Cache-to-Cache（C2C）

HiPO 混合策略优化框架

多智能体工作流程 CudaForge

门控注意力 Gated Attention

赫胥黎–哥德尔机 Huxley–Gödel Machine