rabin пре 1 месец
родитељ
комит
05bfd13502
1 измењених фајлова са 4 додато и 9 уклоњено
  1. 4 9
      service/extract/docs/pdf.py

+ 4 - 9
service/extract/docs/pdf.py

@@ -30,17 +30,12 @@ class Pdf(Base):
             words = page_obj.get_text("words")
             for w in words:
                 x0, y0, x1, y1, text, *_ = w
-                # 按 scale 缩放
-                x0 *= scale
-                y0 *= scale
-                x1 *= scale
-                y1 *= scale
                 # 转百分比,方便前端高亮
                 rel_bbox = [
-                    (x0 / (page_width * scale)) * 100,
-                    (y0 / (page_height * scale)) * 100,
-                    (x1 / (page_width * scale)) * 100,
-                    (y1 / (page_height * scale)) * 100,
+                    (x0 / (page_width)) * 100,
+                    (y0 / (page_height)) * 100,
+                    (x1 / (page_width)) * 100,
+                    (y1 / (page_height)) * 100,
                 ]
                 result['text'].append({
                     "page": page,