proofdb/ark.txt
2026-05-01 23:40:14 +08:00

30 lines
840 B
Plaintext

archives
- id 主键、自增
- archive_uid 非空
- title 主题
- summary 档案摘要
- year 年份
- author 作者
- source 来源
- series 所属系列集
- tags JSON
- metadata JSON
- content OCR识别全文存放地址
- raw 原始pdf/图片存放地址
- chunks JSON
- created_time 入库时间
- updated_time 修改时间
chunks
- id 主键、自增
- chunk_uid 非空
- archive_uid 所属档案ID
- chunk_index chunk序号
- page_start
- page_end
- text chunk文本
- length
- embedding_status INT 0=none, 1=OpenSearch
- embedding_ref JSON
- embedding_model TEXT 格式例如 fastembedding/1.0