pdf-ocr-layout

作者：@baokui

⬇️ 下载量：1.1K ⭐ 收藏量：1 版本：v3 v

OpenClaw的pdf-ocr-layout-技能（skill）的描述

基于智谱GLM-OCR、GLM-4.7及GLM-4.6V的多模态文档深度解析工具。

使用场景：
- 需要高精度提取文档（PDF/图片）中的表格并转换为Markdown格式
- 需要从文档页面中自动裁剪并提取插图、图表为独立文件
- 需要对提取的图表进行深度语义理解（基于GLM-4.6V视觉分析）
- 需要对提取的表格数据进行逻辑分析（基于GLM-4.7文本分析）

核心架构：
1. 视觉提取：GLM-OCR
2. 语义理解：GLM-4.7（纯文本/表格）+ GLM-4.6V（多模态/图像）

OpenClaw's pdf-ocr-layout skill

基于智谱 GLM-OCR、GLM-4.7 及 GLM-4.6V 的多模态文档深度解析工具。

Use when:
- 需要高精度提取文档（PDF/图片）中的表格并转换为 Markdown 格式
- 需要从文档页面中自动裁剪并提取插图、图表为独立文件
- 需要对提取的图表进行深度语义理解（基于 GLM-4.6V 视觉分析）
- 需要对提取的表格数据进行逻辑分析（基于 GLM-4.7 文本分析）

核心架构：
1. 视觉提取：GLM-OCR
2. 语义理解：GLM-4.7 (纯文本/表格) + GLM-4.6V (多模态/图像)

安装 pdf-ocr-layout 技能

将下面的AI引导词，复制到您的openClaw对话中，发送给大龙虾，即可安装该技能

请先检查是否已安装 SkillHub 商店，若未安装，请根据 http://openclawweb.cn/skillhub.md 安装Skillhub商店，但是只安装CLI，然后安装 pdf-ocr-layout 技能。

pdf-ocr-layout - skill原始代码包

访问pdf-ocr-layout技能原始代码

该作者的其他技能

pdf-parser-mineru

⬇️ 965 ⭐ 0