Spaces:

TharaKavin
/

Web-Rag

Sleeping

TharaKavin commited on 18 days ago

Commit

1cc2027

verified ·

1 Parent(s): e008495

Update scraper.py

Files changed (1) hide show

scraper.py CHANGED Viewed

@@ -4,14 +4,11 @@ def scrape_url(url: str) -> str:
     try:
         page = Fetcher.get(url)
-        # Try method 1 (new versions)
-        try:
-            texts = page.css("body *::text").getall()
-        except:
-            # Fallback for older versions
-            texts = [t.get() for t in page.css("body *::text")]
-        cleaned = [t.strip() for t in texts if t and t.strip()]
         return " ".join(cleaned)

     try:
         page = Fetcher.get(url)
+        # ✅ Extract text properly
+        texts = page.css("body *::text").getall()
+        # Clean text
+        cleaned = [t.strip() for t in texts if t.strip()]
         return " ".join(cleaned)