HyperAIHyperAI

Command Palette

Search for a command to run...

赫尔墨斯4 技术报告

Ryan Teknium Roger Jin Jai Suphavadeeprasit Dakota Mahan Jeffrey Quesnelle Joe Li Chen Guang Shannon Sands Karan Malhotra

Abstract

我们提出 Hermes 4,这是一个融合结构化多轮推理能力与广泛指令遵循能力的混合推理模型系列。我们详细描述了在数据整理、数据合成、训练与评估过程中遇到的挑战,并概述了在大规模下应对这些挑战所采用的解决方案。我们在数学推理、编程、知识问答、理解能力以及对齐性等多个基准上进行了全面评估,既报告了定量性能指标,也提供了定性行为分析。为支持开放研究,所有模型权重已公开发布于 https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728


Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供