HyperAIHyperAI

Command Palette

Search for a command to run...

CC-OCR 文字识别数据集

Date

1 年前

Size

1.49 GB

Organization

Alibaba Group
华中科技大学
华南理工大学

Publish URL

github.com

Paper URL

arxiv.org

CC-OCR 数据集由阿里巴巴集团、华中科技大学和华南理工大学于 2024 年联合开发,旨在为评估大型多模态模型在文字识别(OCR)任务中的表现提供一个全面且具有挑战性的基准,相关论文成果为「CC-OCR: A Comprehensive and Challenging OCR Benchmark for Evaluating Large Multimodal Models in Literacy」。

该数据集涵盖了多场景文本阅读、多语言文本阅读、文档解析和关键信息提取 4 大核心任务,包含 39 个子集和 7,058 张全标注图像。 CC-OCR 的推出填补了当前多模态模型在复杂结构和细粒度视觉挑战方面评估的空白,对推动多模态模型在实际应用中的进步具有重要意义。

CC-OCR.torrent
Seeding 1Downloading 1Completed 205Total Downloads 396
  • CC-OCR/
    • README.md
      1.52 KB
    • README.txt
      3.04 KB
      • data/
        • CC-OCR.zip
          1.49 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供