查看原文
其他

公式识别工具LaTeX-OCR不完美替代mathpix

niuniu LaTeX工作室 2024-03-30

https://github.com/lukas-blecher/LaTeX-OCR 是一个基于学习的系统,旨在将数学公式的图像转换为相应的 LaTeX 代码。

这是一个开源的光学字符识别(OCR)软件,专为 LaTeX 文档提供支持。其主要目的是帮助用户将扫描的文档转换为 LaTeX 编辑器可以使用的可编辑文本,从而方便进行修改、编辑和排版。这个项目的核心是一个名为pix2tex的工具,它使用了一个视觉变换器(ViT)模型来实现图像到LaTeX代码的转换。

  1. OCR 精度: LaTeX-OCR 能精准地辨识扫描文档中的字符,并以文本形式完美呈现。这一特性确保了转换后文本品质,为后续编辑工作奠定了坚实的基础。
  2. LaTeX 格式完美呈现: 此软件专为 LaTeX 文档定制,能够精准保留源文档中的 LaTeX 语法与格式。因此,输出的文本与原始 LaTeX 文档如出一辙,无需用户再进行繁琐的格式调整。
  3. 多语言兼容: LaTeX-OCR 支持多种语言,涵盖英语、西班牙语、德语、法语等主流语种。
  4. 操作简便: 软件设计直观易用,用户只需轻松导入扫描文档、选择适当设置,即可迅速完成 OCR 过程。这种用户友好的设计不仅提高了工作效率,还降低了使用门槛,使更多人能够轻松驾驭这一强大工具。

安装使用

LaTeX-OCR 可以从源码进行安装,也可以直接用 pip 来安装,这里直接使用 pip 进行安装,为了方便管理环境,这里使用 conda 创建虚拟环境。

首先推荐新建一个 conda 环境,这里官方要求 python>=3.7。

// 1. 创建一个名为latexocr的环境
$ conda create -n latexocr python=3.7
// 2. 进入名为latexocr的环境
$ conda activate latexocr
// 3. 安装LaTeX-OCR(如果不需要代理可以直接 $ pip3 install pix2tex[gui])
$ pip3 install pix2tex[gui] -i https://pypi.tuna.tsinghua.edu.cn/simple some-package
// 4. 设置临时代理(因为首次启动LaTeX-OCR需要下载训练数据,如果访问快的话可以跳过这个步骤)
$ set http_proxy=http://127.0.0.1:端口号
$ set https_proxy=http://127.0.0.1:端口号
// 5. 启动LaTeX-OCR
$ latexocr

识别测试:

如果你代码调用,可以这样使用:

from PIL import Image
from pix2tex.cli import LatexOCR

img = Image.open('path/to/image.png')
model = LatexOCR()
print(model(img))

不会安装也可以用

如果你觉得上面的配置比较麻烦,这里有一个 LaTeX-OCR 一键整合包分享,(注意本整合包只支持 windows 环境,其他环境按照上述过程进行安装)。

文件包解压之后找到 latexocr.exe 启动即可,总体识别准确度还需要大家自己测试玩玩。

文件获取,本公众号回复:LaTeXocr 即可获取下载链接!Happy LaTeXing!~

关注我们公众号,学习 LaTeX 无烦恼!

入门资料,免费知识代码:

https://flowus.cn/latex/share/66110e84-b24a-4cd5-b8a7-2ba2afb35a30

精心制作免费视频教程:

https://space.bilibili.com/209746320

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存