archives
- id                 主键、自增
- archive_uid        非空
- title              主题
- summary            档案摘要
- year               年份
- author             作者
- source             来源
- series             所属系列集
- tags               JSON
- metadata           JSON
- content            OCR识别全文存放地址
- raw                原始pdf/图片存放地址
- chunks             JSON
- created_time       入库时间
- updated_time       修改时间

chunks
- id                 主键、自增
- chunk_uid          非空
- archive_uid        所属档案ID
- chunk_index        chunk序号
- page_start
- page_end
- text               chunk文本
- length
- embedding_status   INT 0=none, 1=OpenSearch
- embedding_ref      JSON
- embedding_model    TEXT  格式例如 fastembedding/1.0
