HyperAIHyperAI

Command Palette

Search for a command to run...

AceMath Instruct Training Data 数学推理数据集

Date

1 年前

Size

4.82 GB

Organization

NVIDIA(英伟达)

Paper URL

arxiv.org

Tags

AceMath Instruct Training Data 是由 NVIDIA 于 2025 年发布的一个用于训练 AceMath 模型的数据集,旨在提升模型在数学推理任务中的表现,相关论文成果为「AceMath: Advancing Frontier Math Reasoning with Post-Training and Reward Modeling」。

该数据集包含多个阶段的微调数据,其中第一阶段的 general_sft_stage1 包含 2,261,687 个样本,主要涵盖代码和数学领域的指令微调样本;第二阶段的 general_sft_stage2 包含 1,634,573 个样本,进一步扩展到代码、数学和通用领域的指令微调;而专门针对数学领域的 math_sft 则包含 1,661,094 个样本,专注于提升数学推理能力。这些数据的生成结合了 Qwen2.5-Math-72B-Instruct 和 GPT-4o-mini 模型,确保了数据的多样性和高质量。

AceMath-Instruct-Training-Data.torrent
Seeding 1Downloading 1Completed 146Total Downloads 227
  • AceMath-Instruct-Training-Data/
    • README.md
      1.61 KB
    • README.txt
      3.23 KB
      • data/
        • AceMath-Instruct-Training-Data.zip
          4.82 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供