File size: 3,373 Bytes
e92bd0b
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [],
   "source": [
    "from ArabicOcr import arabicocr\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 12,
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "Using CPU. Note: This module is much faster with a GPU.\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "[INFO] OCR'ing input image...\n",
      "[INFO] 0.4919: بدأ فيأ حلم عرب ختم فيأ مهرج بحر حلم\n",
      "[INFO] 0.2563: لدعط\n",
      "[INFO] 0.8595: بكر يواصل سيناريو\n",
      "[INFO] 0.6365: عبدالرحمن دخيل تماماًكون متوقعاً ضبط\n",
      "[INFO] 0.4543: أتي مهرج بحر دول للأغنية صور هزيلاً\n",
      "[INFO] 0.6843: فاشلا فيأكلأ شيء نظم سيىء جمل\n",
      "[INFO] 0.6381: جمل حدث دراماتيكية يسعني الاان اقف\n",
      "[INFO] 0.9383: سيناريو تراجيدي\n",
      "[INFO] 0.3568: منتسماً\n",
      "[INFO] 0.2621: ددوا\n",
      "[INFO] 0.7647: عمل فيأ\n",
      "[INFO] 0.5875: فصل منامة . كلأ هتم\n",
      "[INFO] 0.9771: كتب\n",
      "[INFO] 0.9535: للفنانين\n",
      "[INFO] 0.7544: أسي\n",
      "[INFO] 0.9973: حدث\n",
      "[INFO] 0.9826: فني\n",
      "{'Extracted': ['بدأ فيأ حلم عرب ختم فيأ مهرج بحر حلم', 'لدعط', 'بكر يواصل سيناريو', 'عبدالرحمن دخيل تماماًكون متوقعاً ضبط', 'أتي مهرج بحر دول للأغنية صور هزيلاً', 'فاشلا فيأكلأ شيء نظم سيىء جمل', 'جمل حدث دراماتيكية يسعني الاان اقف', 'سيناريو تراجيدي', 'منتسماً', 'ددوا', 'عمل فيأ', 'فصل منامة . كلأ هتم', 'كتب', 'للفنانين', 'أسي', 'حدث', 'فني']}\n"
     ]
    }
   ],
   "source": [
    "image_path='img/a.png'\n",
    "out_image='out/out.jpg'\n",
    "results=arabicocr.arabic_ocr(image_path,out_image)\n",
    "# print(results)\n",
    "words=[]\n",
    "for i in range(len(results)):\t\n",
    "\t\tword=results[i][1]\n",
    "\t\t# print(word)\n",
    "\t\twords.append(word)\n",
    "data = {\"Extracted\":words}\n",
    "print(data)\n",
    "# with open ('file.txt','w',encoding='utf-8')as myfile:\n",
    "# \t\tmyfile.write(str(words))\n",
    "# import cv2\n",
    "# img = cv2.imread('out/out.jpg', cv2.IMREAD_UNCHANGED)\n",
    "# cv2.imshow(\"arabic ocr\",img)\n",
    "# cv2.waitKey(0)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "arabic",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.12.2"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}