全球OCR新王来自中国开源!GitHub狂揽73300+Star

2026-03-31 jxgzhc 0 条评论 0 阅读
📰 资讯来源
量子位

🔗 查看原文 →

📰 来源:量子位  |  查看原文 谷歌持续霸榜多年的PaddleOCR被赶超

📰 来源:量子位  |  查看原文

谷歌持续霸榜多年的PaddleOCR被赶超

GitHub OCR项目之王刚刚历史性易主。

诞生近40年、统治OCR领域的技术标杆Tesseract OCR,被中国开源拉下王座——

百度文心衍生模型PaddleOCR以73300+Star,正式登顶GitHub全球OCR项目榜,终结谷歌Tesseract OCR长期霸榜局面。

这也是中国开源在这一基础赛道上,首次拿下全球Star第一。

不仅如此,在Hugging Face上,PaddleOCR也长期处于OCR与文档解析领域的头部位置,已经成为全球开发者的必备工具。

从“跟跑”到“领跑”,大模型时代,中国开源项目正在用实力改写全球竞争格局。

PaddleOCR同步升级服务放出一波福利,官⽹免费每⽇解析⻚数翻番,由1万提升⾄2万。用户还可通过OpenClaw直接调用PaddleOCR Skill,为其接入专业“视觉”能力。

PaddleOCR OCEAN生态联盟也重磅发布,面向核心开源贡献者、企业用户、模型托管平台及硬件厂商等OCR上下游伙伴,这将进一步推动OCR能力在更广泛场景中的应用落地。

大模型时代,PaddleOCR是如何拔得头筹的?OCR又为何如此重要?

在OCR领域,Tesseract OCR无疑是一座里程碑式的存在,它的发展历程跨越四十多年。

1985年,Tesseract OCR诞生于惠普公司的研发项目。彼时的OCR技术尚处于起步阶段,核心需求集中在商业文档的自动化识别与录入。

1994年,Tesseract OCR核心版本开发完成。在1995年美国内华达大学拉斯维加斯分校(UNLV)组织的OCR评测中,Tesseract OCR凭借优异的印刷体识别精度,跻身全球顶尖OCR引擎行列。

不过,随着惠普业务重心的调整,1996年后,Tesseract OCR的研发工作几乎陷入停滞。直到2005年,惠普决定将Tesseract OCR开源。

转折点出现在2006年,谷歌看中了Tesseract OCR的技术潜力,接过手来将其纳入自身开源生态体系。研发团队修复了大量历史遗留的bug,优化了引擎的运行速度和兼容性,更紧跟技术潮流,推动其完成了从传统算法到深度学习的跨越。

但技术世界的法则从来如此:没有永恒的王者,只有持续迭代的创新

文心大模型衍生而来的PaddleOCR,正是这场变革的引领者。

PaddleOCR的登顶,并非一朝一夕之功。它诞生于2020年,是深度学习时代下原生基于深度学习技术构建的模型。

2023年,大模型浪潮席卷整个AI行业,OCR赛道也迎来代际更替。文心大模型的持续高速迭代,直接为PaddleOCR带来了全新的能力天花板

PaddleOCR与文心大模型之间,逐渐玩出了一套非常有意思的双向赋能组合拳:

一个负责“看”:用高精度的文本提取能力,把文档中的文字、表格、公式准确捞出来,为大模型提供“食材”。

一个负责“懂”:文心大模型快速迭代,在多模态方向实现突破,视觉理解、跨模态融合、结构化输出,能力版图一步步补齐。文心不仅能消化这些信息,还能反哺PaddleOCR,让它真正理解复杂文档的逻辑脉络。

这种协同直接推动了PaddleOCR的爆发式增长。

Star History显示,GitHub PaddleOCR Star数自2024年起呈现加速增长态势。

基于文心大模型技术底座,PaddleOCR-VL、PaddleOCR-VL-1.5核心模型相继推出。

2025年10月,百度发布并开源自研多模态文档解析模型PaddleOCR-VL

PaddleOCR-VL仅0.9B参数量,就在全球权威文档解析评测榜单OmniDocBench V1.5上拿下92.6分的成绩,超越Gemini-2.5 Pro、GPT-4o等与其体量悬殊的多模态大模型以及OCR领域的垂直模型dots.ocr、MinerU等,获得综合性能全球第一。

在文本识别、公式识别、表格理解、阅读顺序四大核心能力上,PaddleOCR-VL全面刷新SOTA:

同时,发布16小时内,PaddleOCR-VL直冲HuggingFace Trending全球第一、ModelScope Trending全球第一、HuggingFace Paper Trending全球第一,持续五天登顶。

今年一月底,百度再次发力,发布并开源新一代文档解析模型PaddleOCR-VL-1.5

本文转载自量子位,版权归原作者所有

jxgzhc

暂无个人简介

查看全部文章
上一篇 下一篇

评论

评论已关闭。