Spaces:

Ankit74990
/

honeypot-api

Sleeping

App Files Files Community

Ankit19102004 commited on Feb 19

Commit

d218d36

1 Parent(s): d744a7e

final update

Browse files

Files changed (1) hide show

honeypot_api.py +62 -24

honeypot_api.py CHANGED Viewed

@@ -144,9 +144,9 @@ def detect_scam(text):
 def generate_agent_reply(history):
     persona = (
-        "You are a worried bank customer. Be responsive and curious. "
-        "Ask short follow-up questions without mentioning scam or security. "
-        "Keep replies to 1–2 sentences.\n\n"
     )
     convo=""
@@ -188,15 +188,38 @@ def compute_engagement_score(session_id, last_agent_reply):
 def extract_intelligence(text):
     return {
-        "bankAccounts": re.findall(r"\b\d{9,18}\b", text),
-        "upiIds": re.findall(r"[a-zA-Z0-9.\-_]{2,}@[a-zA-Z]{2,}", text),
-        "phishingLinks": re.findall(r"https?://\S+", text),
-        "phoneNumbers": re.findall(r"\+?\d{10,13}", text),
-        "suspiciousKeywords": [
-            w for w in ["urgent","verify","blocked","otp","immediately"]
-            if w in text.lower()
-        ]
     }
 # ============================
@@ -206,18 +229,33 @@ def extract_intelligence(text):
 def send_callback(session_id):
     last_agent_text = ""
-    for m in reversed(conversation_store.get(session_id, [])):
         if m.get("sender") == "agent":
             last_agent_text = m.get("text", "")
             break
     engagement = compute_engagement_score(session_id, last_agent_text)
     payload = {
         "sessionId": session_id,
         "scamDetected": True,
-        "totalMessagesExchanged": len(conversation_store[session_id]),
-        "extractedIntelligence": intelligence_store[session_id],
         "agentNotes": "Scammer used urgency and payment redirection",
-        "engagementScore": round(engagement, 0)
     }
     try:
@@ -262,15 +300,15 @@ def honeypot_message():
     text = data["message"].get("text","")
     if session_id not in conversation_store:
-        conversation_store[session_id]=[]
-        intelligence_store[session_id]={
-            "bankAccounts":[],
-            "upiIds":[],
-            "phishingLinks":[],
-            "phoneNumbers":[],
-            "suspiciousKeywords":[]
         }
-        callback_done[session_id]=False
     conversation_store[session_id].append({
         "sender":"scammer",
@@ -287,7 +325,7 @@ def honeypot_message():
     if scam:
         reply = generate_agent_reply(conversation_store[session_id])
     else:
-        reply = "Okay."
     conversation_store[session_id].append({
         "sender":"agent",

 def generate_agent_reply(history):
     persona = (
+        "You are a worried bank customer. Be responsive and curious and keep the scammer talking. "
+        "Always ask a short follow-up question without mentioning scam or security. "
+        "Keep replies to 1–2 sentences and end with a question.\n\n"
     )
     convo=""
 def extract_intelligence(text):
+    text_str = text or ""
+    bank_accounts = re.findall(r"\b\d{12,18}\b", text_str)
+    phone_numbers = re.findall(r"\+?\d{1,3}[- ]?\d{10}", text_str)
+    upi_or_email = re.findall(r"[a-zA-Z0-9.\-_+]+@[a-zA-Z0-9.\-]+", text_str)
+    upi_ids = []
+    email_addresses = []
+    for value in upi_or_email:
+        parts = value.split("@", 1)
+        domain = parts[1] if len(parts) == 2 else ""
+        if "." in domain and len(domain.rsplit(".", 1)[-1]) >= 2:
+            email_addresses.append(value)
+        else:
+            upi_ids.append(value)
+    phishing_links = re.findall(r"https?://\S+", text_str)
+    def uniq(items):
+        seen = set()
+        result = []
+        for i in items:
+            if i not in seen:
+                seen.add(i)
+                result.append(i)
+        return result
     return {
+        "phoneNumbers": uniq(phone_numbers),
+        "bankAccounts": uniq(bank_accounts),
+        "upiIds": uniq(upi_ids),
+        "phishingLinks": uniq(phishing_links),
+        "emailAddresses": uniq(email_addresses),
     }
 # ============================
 def send_callback(session_id):
     last_agent_text = ""
+    conv = conversation_store.get(session_id, [])
+    for m in reversed(conv):
         if m.get("sender") == "agent":
             last_agent_text = m.get("text", "")
             break
     engagement = compute_engagement_score(session_id, last_agent_text)
+    intel = intelligence_store.get(session_id, {})
+    total_messages = len(conv)
+    duration_seconds = max(60, total_messages * 5)
     payload = {
+        "status": "success",
         "sessionId": session_id,
         "scamDetected": True,
+        "extractedIntelligence": {
+            "phoneNumbers": intel.get("phoneNumbers", []),
+            "bankAccounts": intel.get("bankAccounts", []),
+            "upiIds": intel.get("upiIds", []),
+            "phishingLinks": intel.get("phishingLinks", []),
+            "emailAddresses": intel.get("emailAddresses", []),
+        },
+        "totalMessagesExchanged": total_messages,
+        "engagementMetrics": {
+            "totalMessagesExchanged": total_messages,
+            "durationSeconds": duration_seconds,
+            "engagementScore": round(engagement, 0),
+        },
         "agentNotes": "Scammer used urgency and payment redirection",
     }
     try:
     text = data["message"].get("text","")
     if session_id not in conversation_store:
+        conversation_store[session_id] = []
+        intelligence_store[session_id] = {
+            "phoneNumbers": [],
+            "bankAccounts": [],
+            "upiIds": [],
+            "phishingLinks": [],
+            "emailAddresses": [],
         }
+        callback_done[session_id] = False
     conversation_store[session_id].append({
         "sender":"scammer",
     if scam:
         reply = generate_agent_reply(conversation_store[session_id])
     else:
+        reply = generate_agent_reply(conversation_store[session_id])
     conversation_store[session_id].append({
         "sender":"agent",