rabin 2 달 전
부모
커밋
9f36e2b0e7
1개의 변경된 파일1개의 추가작업 그리고 2개의 파일을 삭제
  1. 1 2
      service/extract/docs/pdf.py

+ 1 - 2
service/extract/docs/pdf.py

@@ -43,8 +43,7 @@ class Pdf(Base):
             for i, b in enumerate(blocks):
                 y_top = b["bbox"][1]
                 y_bottom = b["bbox"][3]
-                block_height = y_bottom - y_top
-                if (y_top < page_height * 0.02 or y_bottom > page_height * 0.98) and block_height < 20:
+                if y_top < 30 or (page_height - y_bottom) < 30:
                     continue
 
                 if b['type'] == 0: