archives - id 主键、自增 - archive_uid 非空 - title 主题 - summary 档案摘要 - year 年份 - author 作者 - source 来源 - series 所属系列集 - tags JSON - metadata JSON - content OCR识别全文存放地址 - raw 原始pdf/图片存放地址 - chunks JSON - created_time 入库时间 - updated_time 修改时间 chunks - id 主键、自增 - chunk_uid 非空 - archive_uid 所属档案ID - chunk_index chunk序号 - page_start - page_end - text chunk文本 - length - embedding_status INT 0=none, 1=OpenSearch - embedding_ref JSON - embedding_model TEXT 格式例如 fastembedding/1.0