Skip to main content
POST
/
paas
/
v4
/
layout_parsing
版面解析
curl --request POST \
  --url https://open.bigmodel.cn/api/paas/v4/layout_parsing \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "GLM-OCR",
  "file": "https://cdn.bigmodel.cn/static/logo/introduction.png"
}
'
{
  "id": "task_123456789",
  "created": 1727156815,
  "model": "GLM-OCR",
  "md_results": "# 文档标题\n这是文档内容...",
  "layout_details": [
    [
      {
        "index": 1,
        "label": "text",
        "bbox_2d": [
          0.1,
          0.1,
          0.5,
          0.3
        ],
        "content": "这是文本内容",
        "height": 800,
        "width": 600
      }
    ]
  ],
  "layout_visualization": [
    "<string>"
  ],
  "data_info": {
    "num_pages": 5,
    "pages": [
      {
        "width": 600,
        "height": 800
      }
    ]
  },
  "usage": {
    "prompt_tokens": 123,
    "completion_tokens": 123,
    "prompt_tokens_details": {
      "cached_tokens": 123
    },
    "total_tokens": 123
  },
  "request_id": "req_123456789"
}

Authorizations

Authorization
string
header
required

使用以下格式进行身份验证:Bearer

Body

application/json
model
enum<string>
required

模型编码:glm-ocr

Available options:
glm-ocr
Example:

"glm-ocr"

file
string
required

需要识别的图片或者pdf文档,支持urlbase64。支持图片格式:PDFJPGPNG。单图≤10MB,PDF≤50MB,最大支持100页

Example:

"https://cdn.bigmodel.cn/static/logo/introduction.png"

return_crop_images
boolean
default:false

是否需要截图信息

need_layout_visualization
boolean
default:false

是否需要详细布局图片结果信息

start_page_id
integer

传入pdf时,开始解析的页码

Required range: x >= 1
end_page_id
integer

传入pdf时,结束解析的页码

Required range: x >= 1
request_id
string

唯一请求标识符,如不提供则自动生成

Example:

"req_123456789"

user_id
string

终端用户ID,用于滥用监控。长度:6-128字符

Required string length: 6 - 128
Example:

"user_123456"

Response

业务处理成功

id
string
required

任务 ID

Example:

"task_123456789"

created
integer<int64>
required

请求创建时间,是以秒为单位的 Unix 时间戳

Example:

1727156815

model
string
required

模型名称

Example:

"GLM-OCR"

md_results
string

Markdown 格式的识别结果

Example:

"# 文档标题\n这是文档内容..."

layout_details
object[][]

布局详细信息

layout_visualization
string[]

识别结果图片url

data_info
object

文档基础信息

usage
object

调用结束时返回的 Token 使用统计。

request_id
string

请求ID

Example:

"req_123456789"