招投标数据提取方案
Scrapy
、BeautifulSoup
、Selenium
)抓取网页中的文本和表格数据。通过解析HTML的DOM结构,提取目标数据。(平台暂无工具)pdfplumber
或python-docx
)提取表格的结构和数据。提取后的表格数据可以转化为CSV或JSON格式,方便后续处理。YYYYMMDDHHMMSS
。这可以确保时间字段在不同系统中具有一致的解析方式。500000元
),以便在后续财务分析或报告生成中能够准确使用。正常请求 | Batch请求 | |
---|---|---|
任务量 | 1 亿请求(2048 tokens) | 1 亿请求(2048 tokens) |
模型 | GLM-4-Air | GLM-4-Air |
并发量 | 100 并发 | 4000 并发 |
天数 | 340 天 | 8.6 天 (40倍效率) |
价格 | 204,800 元 | 102,400 元(省钱一半) |
模型 | Batch一次最大请求 |
---|---|
GLM-4-Flash | 1000万次 |
GLM-4-Air | 1000万次 |
GLM-3-Turbo | 200万次 |
Embedding-2 | 200万次 |
Embedding-3 | 200万次 |
GLM-4-Plus | 200万次 |
GLM-4-0520 | 50万次 |
GLM-4 | 50万次 |