智谱开源GLM-OCR模型：仅0.9B参数，多项基准取得SOTA表现-新科技-资讯-头部财经

智谱开源GLM-OCR模型：仅0.9B参数，多项基准取得SOTA表现

资讯 » 新科技 2026-02-03

2月3日，智谱宣布正式发布并开源GLM-OCR。据介绍，该模型仅0.9B参数规模，支持vLLM、SGLang和Ollama部署，在公式识别、表格识别、信息抽取的多项主流基准中均取得SOTA表现。

据官方信息，GLM-OCR针对手写体、复杂表格、代码文档、印章识别及多语言混排等场景进行了优化。在效率方面，其处理PDF文档的吞吐量可达1.86页/秒。通过API调用，其定价为0.2元/百万Tokens。

该模型采用“编码器-解码器”架构，集成了自研的CogViT视觉编码器，并采用“版面分析→并行识别”的两阶段技术流程。模型完整SDK与推理工具链已同步开源，适用于高并发及边缘计算场景。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿，经过编辑审核收录，不代表头部财经观点和立场。
证券投资市场有风险，投资需谨慎！请勿添加文章的手机号码、公众号等信息，谨防上当受骗！如若本网有任何内容侵犯您的权益，请及时联系我们。

张雪，为什么突然火了？

2026-04-0522阅读
从连接线上线下，到构建AI底座：美团在两个时代的基建接力

2026-04-0522阅读
从易点天下与亚马逊云科技的深度协同，看出海营销的AI解法

2026-04-0522阅读
OpenAI获得1220亿美元融资扩展AI基础设施布局

2026-04-0522阅读
千问3.6Plus大模型登顶全球模型调用排行榜首

2026-04-0522阅读
阿里千问3.6Plus大模型登顶全球模型调用排行榜首

2026-04-0522阅读
今日又清明，致敬星辰大海征途上的先烈

2026-04-0522阅读
豆包大模型日均Token使用量超120万亿

2026-04-0522阅读
消息称Meta低调组建硬件团队，打造以多种形态陪伴人类的智能体

2026-04-0522阅读
专业的成都小程序开发机构

2026-04-0522阅读