版面解析

版面解析

curl --request POST \
  --url https://open.bigmodel.cn/api/paas/v4/layout_parsing \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "GLM-OCR",
  "file": "https://cdn.bigmodel.cn/static/logo/introduction.png"
}
'

{
  "id": "task_123456789",
  "created": 1727156815,
  "model": "GLM-OCR",
  "md_results": "# 文档标题\n这是文档内容...",
  "layout_details": [
    [
      {
        "index": 1,
        "label": "text",
        "bbox_2d": [
          0.1,
          0.1,
          0.5,
          0.3
        ],
        "content": "这是文本内容",
        "height": 800,
        "width": 600
      }
    ]
  ],
  "layout_visualization": [
    "<string>"
  ],
  "data_info": {
    "num_pages": 5,
    "pages": [
      {
        "width": 600,
        "height": 800
      }
    ]
  },
  "usage": {
    "prompt_tokens": 123,
    "completion_tokens": 123,
    "prompt_tokens_details": {
      "cached_tokens": 123
    },
    "total_tokens": 123
  },
  "request_id": "req_123456789"
}

POST

paas

layout_parsing

版面解析

curl --request POST \
  --url https://open.bigmodel.cn/api/paas/v4/layout_parsing \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "GLM-OCR",
  "file": "https://cdn.bigmodel.cn/static/logo/introduction.png"
}
'

{
  "id": "task_123456789",
  "created": 1727156815,
  "model": "GLM-OCR",
  "md_results": "# 文档标题\n这是文档内容...",
  "layout_details": [
    [
      {
        "index": 1,
        "label": "text",
        "bbox_2d": [
          0.1,
          0.1,
          0.5,
          0.3
        ],
        "content": "这是文本内容",
        "height": 800,
        "width": 600
      }
    ]
  ],
  "layout_visualization": [
    "<string>"
  ],
  "data_info": {
    "num_pages": 5,
    "pages": [
      {
        "width": 600,
        "height": 800
      }
    ]
  },
  "usage": {
    "prompt_tokens": 123,
    "completion_tokens": 123,
    "prompt_tokens_details": {
      "cached_tokens": 123
    },
    "total_tokens": 123
  },
  "request_id": "req_123456789"
}

Authorizations

Authorization

string

header

required

使用以下格式进行身份验证：Bearer

Body

application/json

model

enum<string>

required

模型编码：glm-ocr

Available options:

glm-ocr

Example:

"glm-ocr"

file

string

required

需要识别的图片或者pdf文档，支持url和base64。支持图片格式：PDF、JPG、PNG。单图≤10MB，PDF≤50MB，最大支持100页

Example:

"https://cdn.bigmodel.cn/static/logo/introduction.png"

return_crop_images

boolean

default:false

是否需要截图信息

need_layout_visualization

boolean

default:false

是否需要详细布局图片结果信息

start_page_id

integer

传入pdf时，开始解析的页码

Required range: x >= 1

end_page_id

integer

传入pdf时，结束解析的页码

Required range: x >= 1

request_id

string

唯一请求标识符，如不提供则自动生成

Example:

"req_123456789"

user_id

string

终端用户ID，用于滥用监控。长度：6-128字符

Required string length: 6 - 128

Example:

"user_123456"

Response

业务处理成功

string

required

任务 ID

Example:

"task_123456789"

created

integer<int64>

required

请求创建时间，是以秒为单位的 Unix 时间戳

Example:

1727156815

model

string

required

模型名称

Example:

"GLM-OCR"

md_results

string

Markdown 格式的识别结果

Example:

"# 文档标题\n这是文档内容..."

layout_details

object[][]

布局详细信息

Hide child attributes

layout_details.index

integer

required

元素序号

Example:

1

layout_details.label

enum<string>

required

元素类型：image表示图像，text表示文本内容，formula表示行间公式，table表示表格

Available options:

image,

text,

formula,

table

Example:

"text"

layout_details.bbox_2d

number[]

归一化的元素坐标 [x1,y1,x2,y2]

Required array length: 4 elements

Required range: 0 <= x <= 1

Example:

[0.1, 0.1, 0.5, 0.3]

layout_details.content

string

元素内容（文本 / 图片 URL / 表格 HTML）

Example:

"这是文本内容"

layout_details.height

integer

页面高度

Example:

800

layout_details.width

integer

页面宽度

Example:

600

layout_visualization

string[]

识别结果图片url

data_info

object

文档基础信息

Hide child attributes

data_info.num_pages

integer

required

文档总页数

Example:

5

data_info.pages

object[]

文档页面数量信息

Hide child attributes

data_info.pages.width

integer

required

页面宽度

Example:

600

data_info.pages.height

integer

required

页面高度

Example:

800

usage

object

调用结束时返回的 Token 使用统计。

Hide child attributes

usage.prompt_tokens

number

用户输入的 Token 数量。

usage.completion_tokens

number

输出的 Token 数量

usage.prompt_tokens_details

object

Hide child attributes

usage.prompt_tokens_details.cached_tokens

number

命中的缓存 Token 数量

usage.total_tokens

integer

Token 总数

request_id

string

请求ID

Example:

"req_123456789"

文本分词器网络搜索

⌘I

API 指引

模型 API

工具 API

Agent API

文件 API

批处理 API

知识库 API

实时 API

助理 API

智能体 API（旧）

Authorizations

Body

Response