Spaces:

gaurv007
/

ClauseGuard

Sleeping

App Files Files Community

gaurv007 commited on 16 days ago

Commit

be855a6

verified ·

1 Parent(s): d3099a5

Upload app.py

Browse files

Files changed (1) hide show

app.py +1 -8

app.py CHANGED Viewed

@@ -368,7 +368,6 @@ def _classify_regex(text):
 def extract_entities(text):
     entities = []
-    # Dates
     date_patterns = [
         (r'\b(?:January|February|March|April|May|June|July|August|September|October|November|December)\s+\d{1,2},?\s+\d{4}\b', "DATE"),
         (r'\b\d{1,2}/\d{1,2}/\d{2,4}\b', "DATE"),
@@ -378,7 +377,6 @@ def extract_entities(text):
     for pat, etype in date_patterns:
         for m in re.finditer(pat, text, re.IGNORECASE):
             entities.append({"text": m.group(), "type": etype, "start": m.start(), "end": m.end()})
-    # Monetary values
     money_patterns = [
         (r'\$\d{1,3}(?:,\d{3})*(?:\.\d{2})?(?:\s*(?:million|billion|thousand|M|B|K))?', "MONEY"),
         (r'\b\d{1,3}(?:,\d{3})*(?:\.\d{2})?\s*(?:USD|EUR|GBP|dollars|euros)', "MONEY"),
@@ -386,7 +384,6 @@ def extract_entities(text):
     for pat, etype in money_patterns:
         for m in re.finditer(pat, text, re.IGNORECASE):
             entities.append({"text": m.group(), "type": etype, "start": m.start(), "end": m.end()})
-    # Party names
     party_patterns = [
         (r'\b[A-Z][A-Za-z0-9\s&]+(?:Inc\.|LLC|Ltd\.|Limited|Corp\.|Corporation|PLC|GmbH|AG|S\.A\.|B\.V\.)\b', "PARTY"),
         (r'\b(?:Party A|Party B|Disclosing Party|Receiving Party|Licensor|Licensee|Buyer|Seller|Tenant|Landlord|Employer|Employee|Company|Customer|Vendor|Client)\b', "PARTY_ROLE"),
@@ -394,7 +391,6 @@ def extract_entities(text):
     for pat, etype in party_patterns:
         for m in re.finditer(pat, text):
             entities.append({"text": m.group(), "type": etype, "start": m.start(), "end": m.end()})
-    # Jurisdictions
     jurisdiction_patterns = [
         (r'\b(?:State|Laws?) of [A-Z][a-zA-Z\s]+', "JURISDICTION"),
         (r'\b(?:California|Delaware|New York|Texas|Florida|England|Ireland|Germany|France|Singapore|Hong Kong)\b', "JURISDICTION"),
@@ -402,7 +398,6 @@ def extract_entities(text):
     for pat, etype in jurisdiction_patterns:
         for m in re.finditer(pat, text, re.IGNORECASE):
             entities.append({"text": m.group(), "type": etype, "start": m.start(), "end": m.end()})
-    # Defined Terms
     defined_patterns = [
         (r'"([A-Z][A-Z\s]+)"', "DEFINED_TERM"),
         (r'\(([A-Z][A-Z\s]+)\)', "DEFINED_TERM"),
@@ -410,7 +405,6 @@ def extract_entities(text):
     for pat, etype in defined_patterns:
         for m in re.finditer(pat, text):
             entities.append({"text": m.group(1), "type": etype, "start": m.start(), "end": m.end()})
-    # Deduplicate
     entities.sort(key=lambda x: (x["start"], -(x["end"] - x["start"])))
     filtered = []
     last_end = -1
@@ -759,7 +753,6 @@ def run_analysis(text):
     if error:
         err_html = f'<p style="color:#dc2626;padding:16px;">{error}</p>'
         return [err_html] * 7 + [None, None, error]
-    # Save export files
     json_path = "/tmp/clauseguard_report.json"
     with open(json_path, "w") as f:
         json.dump(result, f, indent=2, default=str)
@@ -876,7 +869,7 @@ with gr.Blocks(
     """)
     # ── Main Tabs: Analysis vs Comparison ──
-    with gr.Tabs() as main_tabs:
         # ═══════ TAB 1: Single Contract Analysis ═══════
         with gr.Tab("📄 Single Contract Analysis"):

 def extract_entities(text):
     entities = []
     date_patterns = [
         (r'\b(?:January|February|March|April|May|June|July|August|September|October|November|December)\s+\d{1,2},?\s+\d{4}\b', "DATE"),
         (r'\b\d{1,2}/\d{1,2}/\d{2,4}\b', "DATE"),
     for pat, etype in date_patterns:
         for m in re.finditer(pat, text, re.IGNORECASE):
             entities.append({"text": m.group(), "type": etype, "start": m.start(), "end": m.end()})
     money_patterns = [
         (r'\$\d{1,3}(?:,\d{3})*(?:\.\d{2})?(?:\s*(?:million|billion|thousand|M|B|K))?', "MONEY"),
         (r'\b\d{1,3}(?:,\d{3})*(?:\.\d{2})?\s*(?:USD|EUR|GBP|dollars|euros)', "MONEY"),
     for pat, etype in money_patterns:
         for m in re.finditer(pat, text, re.IGNORECASE):
             entities.append({"text": m.group(), "type": etype, "start": m.start(), "end": m.end()})
     party_patterns = [
         (r'\b[A-Z][A-Za-z0-9\s&]+(?:Inc\.|LLC|Ltd\.|Limited|Corp\.|Corporation|PLC|GmbH|AG|S\.A\.|B\.V\.)\b', "PARTY"),
         (r'\b(?:Party A|Party B|Disclosing Party|Receiving Party|Licensor|Licensee|Buyer|Seller|Tenant|Landlord|Employer|Employee|Company|Customer|Vendor|Client)\b', "PARTY_ROLE"),
     for pat, etype in party_patterns:
         for m in re.finditer(pat, text):
             entities.append({"text": m.group(), "type": etype, "start": m.start(), "end": m.end()})
     jurisdiction_patterns = [
         (r'\b(?:State|Laws?) of [A-Z][a-zA-Z\s]+', "JURISDICTION"),
         (r'\b(?:California|Delaware|New York|Texas|Florida|England|Ireland|Germany|France|Singapore|Hong Kong)\b', "JURISDICTION"),
     for pat, etype in jurisdiction_patterns:
         for m in re.finditer(pat, text, re.IGNORECASE):
             entities.append({"text": m.group(), "type": etype, "start": m.start(), "end": m.end()})
     defined_patterns = [
         (r'"([A-Z][A-Z\s]+)"', "DEFINED_TERM"),
         (r'\(([A-Z][A-Z\s]+)\)', "DEFINED_TERM"),
     for pat, etype in defined_patterns:
         for m in re.finditer(pat, text):
             entities.append({"text": m.group(1), "type": etype, "start": m.start(), "end": m.end()})
     entities.sort(key=lambda x: (x["start"], -(x["end"] - x["start"])))
     filtered = []
     last_end = -1
     if error:
         err_html = f'<p style="color:#dc2626;padding:16px;">{error}</p>'
         return [err_html] * 7 + [None, None, error]
     json_path = "/tmp/clauseguard_report.json"
     with open(json_path, "w") as f:
         json.dump(result, f, indent=2, default=str)
     """)
     # ── Main Tabs: Analysis vs Comparison ──
+    with gr.Tabs():
         # ═══════ TAB 1: Single Contract Analysis ═══════
         with gr.Tab("📄 Single Contract Analysis"):