type
status
date
slug
summary
tags
category
icon
password
URL
Rating
 
[中文] | [English]
 
Pix2Text (P2T) 期望成为 Mathpix 的免费开源 Python 替代工具,目前已经可以完成 Mathpix 的核心功能。 Pix2Text (P2T) 可以识别图片中的版面、表格、图片、文字、数学公式等内容,并整合所有内容后以 Markdown 格式输出。P2T 也可以把一整个 PDF 文件(PDF 的内容可以是扫描图片或者其他任何格式)转换为 Markdown 格式。P2T 的文字识别引擎已支持 80+ 种语言,如英文、简体中文、繁体中文、越南语等。
 
Pix2Text 当前整合了以下模型:
  • 文字识别引擎:支持 80+ 种语言,如英文、简体中文、繁体中文、越南语等。其中,英文简体中文识别使用的是开源 OCR 工具 CnOCR ,其他语言的识别使用的是开源 OCR 工具 EasyOCR 。
其中多个模型来自其他开源作者, 非常感谢他们的贡献。
notion image
具体说明请参考 可用模型

P2T 网页版

 
所有人都可以免费使用 P2T网页版,每人每天可以免费识别 10000 个字符,正常使用应该够用了。请不要批量调用接口,机器资源有限,批量调用会导致其他人无法使用服务。
 
受限于机器资源,网页版当前只支持简体中文和英文,要尝试其他语言上的效果,请使用以下的在线 Demo
 

在线 Demo

 
国内镜像(不用梯子,但未必长久可用):
 
可以使用 在线 Demo 尝试 P2T 在不同语言上的效果。但在线 Demo 使用的硬件配置较低,速度会较慢。如果是简体中文或者英文图片,建议使用 P2T网页版

在线文档

 

付费模型

P2T 中包含数学公式检测(MFD)数学公式识别(MFR)两种模型,细节参见 项目说明。P2T 默认会使用免费的开源模型,使用时进行自动下载。但免费模型之外,我也会持续优化模型。最新的模型需要购买才可下载使用。如果不做本地部署,建议直接使用 P2T网页版,网页版会一直使用最新的模型。
 
当前网页版使用了最新的模型:
  • MFR-Plus/MFR-Pro V1.0
  • MFD-Pro V1.1.1: version-20240618
P2T网页版使用的付费模型效果比开源模型好。如果你需要自己部署P2T服务,建议你购买网页版同款模型。
 
为感谢星球会员的支持,星球会员购买B站所有的个人版模型一律八折。通过下面表格中的链接购买并确认收货后,加小助手为好友,小助手会把折扣金额返现。注意:企业版不提供折扣。
 
购买前注意事项:
📌
请确保你用开源的模型跑通了 Pix2Text,否则你下载完付费模型可能跑不起来。详细安装和使用说明看 Pix2Text 项目文档就行。遇到问题可以在这里评论,或者加入群聊与我沟通,但请注意帮你跑通代码不在作者的服务范围之内(参考 星球说明)。
📌
个人使用请参考以下表格中的“个人购买”列;企业购买请参考以下表格中的“企业购买”列,或者 联系作者
 

模型商店

模型购买包含以下 2 个商店。
商店
说明
仅售卖个人使用的模型。无法开具发票。
售卖商用个人使用的模型。平台可以开具发票(美式发票)。
接下来给出更具体的说明。

购买数学公式检测(MFD)模型

以下是不同版本的购买链接。建议先使用 在线 Demo 验证效果后再购买。各个版本的 License 不同,请点击表格内链接查看商品明细。遇到问题可以 联系作者 。企业版同时包含 MFD 和 MFR 模型,无需重复购买。
检测模型版本
企业购买
个人购买
对星球会员
免费可下载
mfd
✖️
✖️
✔️
✔️
mfd-advanced
✖️
✔️ 免费
✖️
mfd-pro
✔️ 个人使用 B站购买八折
✖️
📌
以上模型只兼容 Pix2Text V1.1.1。
 

购买数学公式识别(MFR)模型

以下是不同版本的购买链接。建议先使用 在线 Demo 验证效果后再购买。各个版本的 License 不同,请点击表格内链接查看商品明细。遇到问题可以 联系作者 。企业版同时包含 MFD 和 MFR 模型,无需重复购买。
识别模型版本
企业购买
个人购买
对星球会员
免费可下载
mfr
✖️
✖️
✔️
✔️
mfr-pro
✔️ 个人使用 B站购买八折
✖️
mfr-plus
✖️
✖️
✖️
📌
以上模型兼容 Pix2Text V1.0、V1.1、V1.1.* 。
 
Pix2Text V1.0+ 包含两种企业版。它们的权益差异见下图。企业 Pro 版 是一次性购买,之后有新模型需要重新购买。企业 Pro 版 只允许企业内部使用或者对外提供免费的服务(如教育机构),不允许对外提供付费服务。企业 Plus 版 购买后一年内可以免费获取所有的新模型。企业 Plus 版 除了提供 Pro 模型外也提供 Plus 版 模型,同时提供所有模型的 PyTorch 版本,企业可以基于这些模型利用自己的数据进行模型精调,或者转换为需要的其他模型格式(如 CoreML等)。企业 Plus版 允许企业对外提供付费服务。
更详细说明请见 模型购买商店(进入商品的详情页有具体说明)。
notion image
 
购买链接见:模型购买商店(进入商品的详情页有具体说明)。
 

购买后使用说明

各个版本的 Pix2Text 的使用说明如下(推荐使用最新的版本):
 

代码库

 
📌
P2T 利用 CnOCREasyOCR 识别图片中的文字部分,CnOCR 相关内容参考 这里
 
CnOCRP2T Detailed Infos
Loading...