泡泡资讯网

本文介绍了智谱AI发布的开源OCR模型GLM-OCR。该模型以“小尺寸、高精度”

本文介绍了智谱AI发布的开源OCR模型GLM-OCR。该模型以“小尺寸、高精度”为特点,在性能上达到SOTA水平,并支持多种复杂文档场景,如手写体、复杂表格、代码文档等。

重要亮点
1.性能SOTA:在OmniDocBench V1.5等基准测试中取得SOTA性能,参数量仅0.9B。
2.场景优化:在手写体、复杂表格、代码文档等高难场景中表现稳健。
3.推理高效:支持vLLM、SGLang和Ollama部署,降低推理延迟与算力开销。
4.开源易用:同步开源完整SDK与推理工具链,支持一行命令快速调用。
5.应用广泛:可应用于教育、科研、办公、金融、物流等多个领域。