rabin 2 月之前
父节点
当前提交
6cb9a94ddb
共有 1 个文件被更改,包括 1 次插入1 次删除
  1. 1 1
      service/extract/docs/pdf.py

+ 1 - 1
service/extract/docs/pdf.py

@@ -43,7 +43,7 @@ class Pdf(Base):
             for i, b in enumerate(blocks):
                 y_top = b["bbox"][1]
                 y_bottom = b["bbox"][3]
-                if y_top < 30 or (page_height - y_bottom) < 30:
+                if y_top < page_height * 0.02 or y_bottom > page_height * 0.98:
                     continue
 
                 if b['type'] == 0: