I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   1 4 ,   N o .   3 J u n e   20 1 9 ,   pp .   1518 ~ 1524   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 1 3 .i 3 . pp151 8 - 1524             1518       Jou r n al   h o m e pa ge ht t p: / / i ae s c or e . c om / j our na l s / i nde x . php/ i j e e c s   R e c o g n i z e   p r i n t e d   A r a b i c   l e t t e r   u si n g   n e w   g e o m e t r i c a l   f e a t u r e s       H ai d a r   J .   M o h am ad 1 ,   S e h am   A .   H as h i m 2 ,   A n w a r   H .   A l - S al e h 3   1 M us t a ns i r i y a U ni v e r s i t y ,   C o l l e g e   o f   S c i e nc e ,   D e p a r t m e n t   o f   P hy s i c s ,   I r a q   2 M i dd l e   T e c hn i c a l   U ni v e r s i t y ,   T e c hn i c a l   I ns t r uc t o r s   T r a i ni n g   I ns t i t ut e ,   T e c hni c a l   E l e c t r o ni c   D e p a r t m e n t ,   I r a q   3 M us t a ns i r i y a U ni v e r s i t y ,   C o l l e g e   o f   S c i e nc e ,   D e p a r t m e n t   o f   C o m put e r ,   I r a q       A r ti c l e   I n fo     A B S TR A C T     Ar t i c l e   h i s t or y :   R e c e i v e d   D e c   1 0 ,   2018   R e v i s e F e b   11 201 9   A c c e pt e F e b   27 ,   201 9       T he   t a s o f   r e c o g n i z i ng   t he   s ha pe   o f   A r a bi c   l e t t e r s   us i ng   m o di f i e d   a l g o r i t hm s   di s c us s e d   i n   t hi s   p a pe r .   T h e   d i f f i c ul t y   of   r e c o g ni z i ng   t he s e   l e t t e r s   i s   s um m a r i z e i t he   s ha pe   o f   t he   A r a bi c   l e t t e r   w i t h i a   w o r f r o m   a   l a r g e   s e t   o f   l e t t e r s   ha s   a   s i m i l a r   s ha pe .   M o r e o v e r ,   t he   s h a pe   o f   t he   l e t t e r   i s   di f f e r e n t   de pe n di ng   o i t s   po s i t i o b e g i n,   m i dd l e ,   e nd  w i t hi n   a   w o r d .   T h e r e f o r e ,   i t   i s   ne c e s s a r y   t o   i nt r o duc e   ne w   g e o m e t r i c   f e a t u r e s   t o   c a t e g o r i z e   e a c l e t t e r .     T he   s ug g e s t e a l g o r i t hm   w i t 19  f e a t u r e s   i s   us e i t h i s   pa pe r .     T he s e   f e a t u r e s ,   l i k e   de f i n e   po i nt s   f o r   e a c l e t t e r ,   di v i d e   a   l e t t e r   t o   bl o c ks ,   e dg e   de t e c t i o a nd   o t he r   f e a t u r e s   a r e   s ho w i t h e   s ug g e s t e d   a l g o r i t hm .     T he   i nt r o duc e g e o m e t r i c   f e a t ur e s   g i v e   a   h i g a c c ur a c y   t o   r e c o g ni z e   pr i nt e d   A r a bi c   l e t t e r   w i t hi a   w o r o r   t e xt .   M i n i m um   di s t a nc e   c r i t e r i a   us e t o   e s t i m a t e   t h e   e r r o r   o f   t he   r e c og ni t i o p r o c e s s   b e t w e e t h e   da t a ba s e   a nd   t he   t e s t e A r a b i c   l e t t e r .   T hi s   m e t ho i s   g o o t o   e xpl a i n   t he   be h a v i o ur   o f   t he   de s i g ne a l g o r i t hm   c o de   t o   di s t i ng ui s t h e   g e o m e t r i c   pr o pe r t i e s   a n t he   a c c ur a c y   r e a c he s   99 . 8 %   f o r   t he   p r o po s e m e t ho d.   T he   l e t t e r   s i z e   c ha ng e s   g e o m e t r y   de t a i l s   w h e t h e   f o nt   s i z e   i s   c ha ng e d.   T he   s t ud i e d   f o nt   i s   T i m e s   N e w   R o m a w i t h   s i z e   30 ,   3 6,   a nd  39 .   Ke y w or ds :   A ra b i c   l e t t e r   E v a l ua t i o n   o f   c l a s s i f i c a t i o n   F e a t u r e   e xt r a c t i o n   Im a ge   c a t e go r i z a t i o n   C opy r i gh t   ©   201 9   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   H a i da r   J .   M o ha m a d ,   M us t a n s i ri y a h   U ni v e r s i t y ,     Co l l e ge   of   S c i e n c e ,   D e pa r t m e nt   o f   P h y s i c s ,   Ira q .   E m a i l :   h a i da r. m o h a m a d@ uo m us t a n s i r i y a h. e du. i q       1.   I N TR O D U C TI O N     D o c um e n t   i m a ge   a n a l y s i s   (D IA i s   o n e   o f   t h e   m o s t   w a nt e f i e l ds   n o w a da y s   be c a us e   i t   de a l s   w i t c o n v e r t i n t e xt   t o   a i m a ge   t h a t   a ppl i e t o   d i f fe r e nt   a ppl i c a t i o n s .   T h e r e f o r e ,   a   r e c o gn i t i o n   s t e p ,   s h o ul b e   c o n s i de r e t o   a na l y s e s   a   l e t t e r   c o m po n e nt   w i t hi n   t h e   do c um e nt   i m a ge   t o   ge t   i n f o r m a t i o n   a s   a   hum a n   e y e   do e s .   Im a ge   a na l y s i s   c o n s i de r s   do c um e n t   i m a ge   a n a l y s i s   a s   a   s pe c i a l   c a s e   be c a us e   of   s pa t i a l   p r o pe r t i e s   of   t h e   t e xt   w i t h i t h e   w h o l e   i m a ge   w h i c i s   d i f f e r e n t   f r o m   a   s a t e l l i t e   i m a ge .   T h e   de m a n d   for   us i n g   D IA   i n c r e a s e   e ve r y   da y   i n   do c um e n t   s y s t e m   l i ke   w i de   us e   of   O pt i c a l   Cha ra c t e r   R e c o gn i t i o n   (O CR i n   da i l y   r o ut i n e .     F o r   i n s t a n c e ,   do c um e n t s   i n   a   l i b ra r y   c o n v e r t e a n a r c h i v e t o   a n   e l e c t r o ni c   ve r s i o n   t o   b e   us e d   o n l i n e   a n e a s y   t o   s e a r c a   w o r o s ub j e c t   f o r   e v e r y o n e .     T h e   i de a   of   c a pt ur i ng  da t a   f r o m   a   b oo i s   by   u s i n a n   o pt i c a l   s c a nn e r   w h i c h   s t o r e s   da t a   i n   a   f o r m   of  t h e   pi c t u r e   f i l e .   T hi s   pi c t u r e   i s   c o n v e r t e i n   i m a ge   p r o c e s s i ng  t o   a   m a t ri o f   a n v a l ue   (i n   c a s e   o f   a   b i n a r y   i m a ge t o   s t ud y   t h e   i m po r t a n t   i n f o r m a t i o n.   I n   t h e   c a s e   o s t udy   l e t t e r s ,   t h e   i n f o r m a t i o n   i s   t o   r e c o gn i z e   t h e   s h a pe   a n i de n t i f y   t h e   l e t t e r.   T h e r e fo r e ,   i t   i s   i m po rt a nt   t o   do   s o m e   pr e - pr o c e s s i n s t a ge   b e f o r e   pe r fo r m i n t h e   r e c o gn i t i o n   p r o c e s s .   T h e s e   s t e ps   c a n   b e   un de r s t o o a s   e dge   de t e c t i o n ,   t hi nn i ng,   b i n a ri z a t i o n   a n s o   o n ,   de pe n di n g   o t h e   s ugge s t e a l go ri t hm   o r   w h a t   t h e   go a l   o f   us i n g   t h e   i m a ge   p r o c e s s i n g   t e c hni que .     P a t t e rn   r e c o gn i t i o i s   a   b a s i c   kn o w l e dge   of   c r e a t i ng  O CR ,   w h e r e   O CR   i nt e r p r e t s   c ha ra c t e r s   i a a l p ha b e t i c   s ha pe   t o   a n o t h e r   f o r m .   T h e s e   a l p h a b e t i c   c ha ra c t e r s   a r e   ri c h   i n   i n f o r m a t i o n   a nd  s ha pe ,   i . e .   f o n t   t y p e ,   s i z e ,   a n A ra b i c   l e t t e r   po s i t i o n .   T h e   pri n c i p l e   of   O C R   b a s e o n   de v e l o pi n a l go ri t hm s   t o   r e c o gn i z e   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       R e c ogn i z e   pr i nt e d   A r ab i c   l e t t e r   us i ng   ne w   ge om e t r i c al   f e at ur e s   ( H ai dar   J .   Mo ham ad )   1519   a l p ha b e t i c   s h a pe .   T h e r e f o r e ,   i t   i s   i m p o rt a nt   t o   r e a c h   hu m a n   r e c o gn i t i o n   a c c ura c y   w i t h   100%  f o r   t h e   a l p ha b e t i c   s ha pe   t o   b e   r e a c h e d   f o r   O CR .     M a n y   m e t h o do l o gi c a l   a na l y s i s   a n s c h e m e   ha v e   be e n   pr o po s e l i ke   us i n f i v e   s t a ge s   pr e pr o c e s s i n l i ke   b i n a ri z a t i o n,   m e di a f i l t e r ,   H i l di t c t hi nn i ng  m e t ho d ,   a n d   l i n e   s e gm e nt a t i o w i t h   24   f e a t u r e s .     T h e   a c c ura c y   of   t h e   pe r f o r m a n c e   s y s t e m ,   u n f o r t u n a t e l y ,   r e a c h e 48. 3%  [1] .   A n   a l go r i t hm   us e t o   r e c o gn i z e   c a r   pl a t e   l e t t e a n d   n u m b e r s   w i t h   a c c u r a c y   95%.   B ut   t hi s   m e t h o w o r ks   o nl y   w i t h   c a pl a t e   num b e r   a n d   do e s   n o t   f i t   w i t o t h e r   e n v i r o nm e nt s [2] .   A   c h a i n   c o de   a l go ri t hm   us e t o   c o m put e   l e t t e r   f e a t u r e   de pe n di ng  o n e i g h b o urh o o d   f un c t i o n   w i t h   a   n o r m a l i z a t i o n .   A   t hi nn i ng  p r e p r o c e s s i n m e t h o us e w i t h   t hi s   pa pe r   t o   ge t   hi g h   a c c u r a c y [3] .   F o ur   gr o ups   t o   e xt ra c t   l e t t e r   f e a t u r e s   p r e s e nt e i n   t e r m s   o f   m a i n   b o d y ,   b o un da r y ,   s ke l e t o n ,   a n s e c o n da r y   ob j e c t   f e a t ur e .   T hi s   p r o c e s s   i s   c o m pl i c a t e d   t o   i m pl e m e n t   a l l   t h e   s t e ps ,   i n   t h e   s a m e   w a y ,     e ve r y   t i m e   [4] .   A n   a pp r o a c h   b a s e o n   s t r uc t u ra l   f e a t u r e s   a n de c i s i o n   t r e e   l e a rn i ng  t e c hni que s   p r e s e n t e w h i c h   c o n s i s t   o f   t hr e e   pa r t s .   T h e s e   pa r t s   f i r s t l y   s t o r e   l e t t e r   c ha r a c t e r   i n   a n   a rr a y   a f t e r   us e r   w r i t e   i t   i n   a   s pe c i a l   w i n do w ,   s e c o n dl y   ge n e r a t e   b o un di ng  5x b o a r o u n t h e   l e t t e t h e n   l a s t l y   us e   r e c o gn i t i o n   p r o c e s s   t o   a ppl y   t r e e   l e a rni n t e c hn i q ue .   T hi s   m e t h o de pe n ds   o n   a   s pe c i a l   w i n do w   t o   r e c o gn i z e   a   l e t t e r   a n t h e   a c c ura c y   v a r y i n b e t w e e n   70    93%  de pe n d i n o n   t h e   t e s t e l e t t e r   [5 ] .   A   n e u ra l   n e t   r e c o gn i t i o n   m e t h o pr e s e nt e in   t e rm s   o f   s e gm e n t   l e t t e r s   t o   uppe r   a nd  s a m e   l i n e   l e v e l ,   b ut   t he   a c c ur a c y   v a r i e s   b e t w e e n   90 - 98 de pe n di n g   o t h e   s e gm e nt a t i o n   m e t h o d   [6]   W i t h i n   t h i s   pa pe r ,   a   n e w   s t ra t e gy   pr e s e n t e t o   r e c o gn i z e   a n d   de t e c t   A r a b i c   i s o l a t e l e t t e r   de pe n d i n g   o n   n e w   fe a t ur e s .   T h e s e   f e a t ur e s   a r e   s e l e c t e c a r e f ul l y ,   a n i t   w o r ks   w i t a l l   A ra b i c   l e t t e r .   M o r e o ve r ,   i t   i s   o nl y   18  f e a t ur e   a n a c c ur a t e .   T h e   a l go r i t h m   c o de   de s i gn e us i n g   M A T L A B   s o f t w a r e .   T h e   s t e ps   r e qui r e t o   ha v e   a n   i m a ge   t o   t h e   s t ud i e l e t t e r   t h e n   i s   i t   a ut o m a t i c a l l y   r e c o gn i z e   t h e   l e t t e r.   A l l   de t a i l s   a r e   s h o w n   i n   n e x t   s e c t i o n s   c o n s i s t   o f   us i n t h e   a l go r i t hm   a nd  s t a t i s t i c a l   r e s ul t s .           2.   F EA TU R EX TR A C TI O N   In   p a t t e rn   r e c o gn i t i o n,   e xt ra c t   a   f e a t ur e   f r o m   a n y   l e t t e r   de pe n ds   o n   de t e c t i n t h e   e s s e n t i a l   c h a ra c t e ri s t i c s   o f   t ha t   l e t t e r.   T hi s   c o n s i de r e o n e   o f   t h e   d i f f i c ul t   c h a l l e n ge s   o f   pa t t e rn   r e c o gn i t i o n .   T h e r e f o r e ,   t h e   b e s t   w a y   t o   r e c o gn i z e   l e t t e r s   i s   t o   us e   a   f i xe i m a ge   s i z e   o f   e a c h   l e t t e r   a n c o m pa r e   c o m put a t i o na l   a pp r o a c h.   T hi s   a pp r o a c h   i s   n o t   v a l i i f   t h e   l e t t e r   s i z e   e xpe c t i n t o   v a r y .   T h e   n e xt   s t e i s   t o   f i n c e r t a i f e a t ur e s   t ha t   b e   us e f ul   t o   c h a r a c t e r i z e   a n y   l e t t e r   a n i g n o r e   i n s i g n i f i c a n t   de t a i l s .   T hi s   t e c hn i que   of   e xt ra c t i n g   s uc h   f e a t ur e s   f o r   A r a b i c   l e t t e r   i s   di v i de i nt o   t hr e e   gr o u ps   l i ke   po i n t   di s t ri b ut i o n,   s t r uc t u r e ,   a n s e pa r a t e / j o i n t   l e t t e s h a pe .   T h e s e   f e a t ur e s   e v a l ua t e d   w i t h i t h e   i n t r o duc e a l go ri t hm   a n d   upd a t e t o   t h e   n e e o f   r e c o gn i t i o n   A ra b i c   l e t t e r .   T h e   r e s ul t s   o f   r e c o gn i t i o n   e v a l u a t e us i n m i ni m um   di s t a n c e   e rr o m e t h o d.   T hi s   m e t h o de s i g n e t o   b e   w i t hi n   t h e   s e c o n a l go r i t h m ,   b e c a us e   t h e   r e s ul t s   o c om pa ri n b e t w e e n   l e t t e r s   a n e xt ra c t   f e a t ur e s   a r e   w i t h i t h e   s e c o n a l go ri t hm .         3.   A R A B I C   L ETTER   S H A P   T h e   A ra b i c   l e t t e r s   h a v e   a n   i m p r i nt   t ha t   d i f fe r e nt   c o m pa r i ng  w i t h   o t h e r   l a ngua ge s   l e t t e r s .     T h e s e   c h a r a c t e r s   c a n   b e   de s c r i b e a s   l e t t e r   s h a pe   w h i c h   c ha n ge a c c o r di n t o   t h e   l e t t e r   l o c a t i o n   w i t h i n   a   w o r d.   T h e r e f o r e ,   t h e   r e c o gn i t i o n   p r o c e s s   s h o ul s o l ve   t h i s   i s s ue   w i t h   a l l   A ra b i c   l e t t e r s .   F i gu r e   1   s h o w s   t h e   A ra b i c   l e t t e r   G e e m   a l o n e ,   at   t h e   b e gi nni n g ,   m i ddl e ,   a nd  e n d   of   w o r ds .             F i gu r e   1 .   T h e   s h a pe s   o f   t h e   s a m e   A ra b i c   l e t t e r   G e e m   a c c o r di n g   t o   i t s   po s i t i o i a   w o r d       T h e   o t h e r   c ha r a c t e r s   a r e   t h e   s i m i l a ri t y   i n   s h a pe   b e t w e e n   A ra b i c   l e t t e r s .   T h e   o n l y   di f fe r e n c e   i s   a   do t   ov e r   o r   u nde t h e   A ra b i c   l e t t e r ,   a n d   t hi s   do t   c h a nge s   t h e   p r o n u n c i a t i o o f   t h e   l e t t e a n d   m e a ni n g   o f   t h e   w o r d.   T h e   n a t i v e   pe o pl e   w h o   s pe a k   t hi s   l a n gu a ge   c a n   di s t i n g ui s h   b e t w e e n   t h e s e   l e t t e r s .   H ow e v e r ,   i t h e   r e c o gn i t i o pr o c e s s ,   t h i s   i s s u e   s h o ul b e   c o n s i de r e d .   F i g u r e   2   s h o w s   s a m pl e s   o t h e s e   l e t t e r s   w h i c h   a r e   s i m i l a r   i n   s h a pe   w i t a   s m a l l   d i f fe r e n c e                     M i d d l e                 E n d                  B e gi n n i n g         I s o l at e d   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 4 ,   N o .   3 J u n e   20 1 9   :     1518     1524   1520       F i gu r e   2 .   A ra b i c   l e t t e r s   w i t s i m i l a s h a pe   b ut   di f f e r e n t   i a   d o t       4.   A R A B I C   C H A R A C TER   R EC O G N I TI O N   T h e   s ugge s t e A r a b i c   l e t t e r s   a r e   t e s t e w i t hi n   t hi s   w o r a r e   l i s t e i n   t h e   T a b l e   1 ,   w h e r e   t h e   n u m b e r   s e que n c e   i s   SN   a n t h i s   n u m b e r   i s   s h o w n   i n   t h e   r e s ul t s   w h e re   i t   i n di c a t e s   t h e   l e t t e r,   s ha pe   l e t t e r   i s   t h e   p r i nt e s h a pe   i n   t h e   A r a b i c   l a ngua ge ,   p r o nu n c i a t i o n   i s   h o w   t hi s   l e t t e r   c a b e   pr o n o u n c e i n   E n gl i s h .   T h e s e   l e t t e r ha v e   s i m i l a r   p r o pe rt i e s ,   t h e s e   pr o pe r t i e s   a r e   w i t h o ut   do t s   a n i t s   po s i t i o n   i s   i s o l a t e d .   T h e r e   a r e   m a n y   c a s e s   w h e r e   t h e   s a m e   l e t t e r   i s   f o r m e d   i t h e   w o r d,   b ut   w e   c h o o s e   t hi s   f o r m   t o   b e   c h e c ke a n d   t e s t .       T a b l e   1 .   T h e   S t u di e A ra b i c   L e t t e w i t h   I t s   S e que n c e   a nd  P ro n u n c i a t i o n   SN   S h a p e   l e t t e r   P ro n u n c i a t i o n   1   ع   A i n     2   ا   A l e f   3   د   D a l     4   ح   HHA    5   ه   H a   6   ل   L a m   7   م   M e e m     8   ر   Ra a     9   ص   S a a d   10   س   S e e n     11   ط   T a a     12   و   W a w         T h e   s ugge s t e a l go r i t h m s   a r e   de s i g n e c a r e f ul l y   t o   b e   f i t   w i t h   t h e   pu r po s e   of   r e c o gn i z i ng  s ha pe   l e t t e r.   F i r s t ,   a   d a t a b a s e   de s i gn e fo r   a l l   A ra b i c   l e t t e r   w i t h   i t s   pr o pe rt i e s   t o   be   c o m pa r e w i t h   t h e   r e s ul t s   of   t h e   i n put s   l e t t e r s .   T h i s   da t a b a s e   c o n s i s t s   of   l e t t e r s   f e a t ur e s   l i s t e d   a s   a   t a b l e   w i t hi n   t h e   a l go r i t hm   da t a   a n i n de xe w i t h   t h e   f e a t ur e   s e que n c e   a n d   f e a t u r e   num b e r.   T h e   s e c o n d   a l go r i t hm   t e s t   f e a t u r e s   c h a ra c t e r s   o f   t h e   i n pu t   i m a ge   l e t t e r   a n c o m pa r e s   i t   w i t h   t h e   d a t a b a s e   a n f e e d b a c t h e   r e s ul t s .   T h e   e rr o r   a n t h e   m a t c h i n g   b e t w e e n   t h e   da t a b a s e   a n t h e   i n pu t   l e t t e r   i m a ge   c h e c ke us i n m i ni m u m   di s t a n c e   (M D c r i t e ri a   w i t hi n   t h e   s e c o n al go ri t hm .   T h e   i nt r o duc e di a g r a m   s t e ps   t o   r e c o gn i z e   t h e   l e t t e r   s h o w n   i F i gu r e   3 .             F i gu r e   3 .   D i a g ra m   s t e ps   o f   c h a ra c t e r   r e c o gn i t i o n       5.   EX TR A C TI N G   A R A B I C   LETTER   F EA TU R ES     T h e   f i r s t   s t e of   r e c o gn i t i o n   a n y   l e t t e r   c r e a t e s   a   da t a b a s e   c on s i s t   o 19  f e a t ur e s   w h i c h   e xpl a i n e i de t a i l   i n   t h e   T a b l e   2 .   F i r s t ,   c o n v e r t   t h e   i n pu t   i m a ge   t o   a   b i na ry   i m a ge   i . e .   z e r o   a n o n e ,   t h e n   r e m o v e   t h e   b l a c h o l e s   i n s i de   t h e   l e t t e r.   C ha n ge   t h e   i nput   i m a ge   s i z e   t o   (10 0x60)  pi xe l   f o r   a l l   i n pu t   i m a ge s   t o   be   un i f o r m .     In   t hi s   c a s e ,   t h e   l e t t e r   s ha pe   w i l l   f i l l   t h e   i m a ge   t o   t h e   bo r de r   t o   b e   f i t   w i t h o ut   s pa c e s .   E dge   de t e c t i o n   p r o c e s s   us i n t h e   S o b l e   o p e r a t o r   i s   a ppl i e d   t h e   e dge s   of   t h e   i n pu t   i m a ge   us e a s   o n e   of   t h e   fe a t u r e s   a s   s h o w n   i n                                         ط                     د   ر                                                                                                           Cl a s s i f i c a t i o n   o f   A ra b i c   C ha r a c t e r   R e c o gn i t i o T e c hn i q ue s   B ui l a   d a t a b a s e   Cha ra c t e r e c o gn i t i o n   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       R e c ogn i z e   pr i nt e d   A r ab i c   l e t t e r   us i ng   ne w   ge om e t r i c al   f e at ur e s   ( H ai dar   J .   Mo ham ad )   1521   F i gu r e   ( a ) .   T h e   c e n t r e   o f   t h e   t e s t e i m a ge s   i s   de t e r m i n e a n d   di v i de   i t   i n t o   f o ur   s qu a r e   pa rt s   a n e xt ra c t   n u m b e r   o f   pi xe l s   w i t h   255  a n (f o r   t h e   f i l l e l e t t e r   a n e dg e s r e pr e s e nt i n t h e   a r e a   o f   t h i s   s e c t i o n   a s   a   n e w   t w o   f e a t ur e s   a s   s h o w n   i n   F i gu r e   4   (b ).   T h e n   c a l c u l a t e   t h e   n u m b e r   o f   pi xe l s   w h o s e   v a l u e   i s   e qua l   t o   a s   a   f e a t ur e   a dde w i t hi n   t hi s   a l go ri t hm .   D e t e rm i n e   t h e   f i r s t   pi xe l   i n   a   r o w   a n c o l um n   a n d   gi v e   i t   po s i t i o n   x1 ,   y 1,   t h e n   t h e   l a s t   p i xe l   i n   t h e   s a m e   r o w   w i t h   po s i t i o n   x2,   y 2,   t h e t h e   f i r s t   pi xe l   i n   t h e   l a s t   r o w   a n f i r s t   c o l um n   t o   b e   x3,   y pos i t i o n,   f i n a l l y   t h e   l a s t   pi xe l   i t h e   s a m e   r o w   a n l a s t   c o l um n   t o   r e c o r x4,   y 4.     T h e j o i n   t h e s e   po s i t i o n s   w i t h   s t r a i g h t   l i n e s   a n c a l c ul a t e   t he   l e n gt o f   e a c h   l i n e   a s   n e w   f e a t ur e   n a m e l y   L 1,   L 2,   L 3,   a n L a s   s h o w n   i n   F i gu r e   (c ).   T h e   p l o t   a n de t e rm i n e   h o ri z o nt a l   s t ra i g ht   l i n e   f o r   e a c h   c o n t i n uo us   j o i n e w h i t e   pi xe l s   i n   e a c h   r o w   t h e   num b e r   o f   t h e s e   l i n e s ,   t h e   l o n ge s t   a n s h o rt e s t   s t ra i g h t   l i n e   w i t h   i t s   l o c a t i o n   T 1 ,   T 2,   T po 1,   a n T po r e s pe c t i v e l y ,   p r e s e n t s   n e w   fe a t u r e s   a s   s h ow n   i n   F i gu r e   (d).   T h e s e   s t e ps   a r e   s h o w n   i t h e   a l go r i t hm   ( 1).     T h e   n e xt   s t e i s   r e c o gn i z i n t h e   i n pu t   l e t t e us i n g   t h e   a l go ri t h m   (2).   T h e   i n put   i m a ge   o f   t h e   A ra b i c   l e t t e r   c h e c ke w i t h   t h e   f i r s t   a l go ri t hm   t o   e xt ra c t   a l l   t h e   f e a t ur e s   a n c o m pa r e   i t   w i t h   da t a b a s e .   T h e   d a t a b a s e   c o n t a i n s   a l l   A ra b i c   l e t t e r s   f e a t u r e s   a s   a   c o de t a b l e .   T h e n   t h e   r e c o gn i t i o n   s t e p   i m pl e m e n t e i n   t h e   s e c o n a l go ri t hm ,   w h e r e   t h e   m i ni m u m   d i s t a n c e   e qua t i o n   i s   us e d.   T h e   l e t t e f e a t u r e   c o m pa r e w i t da t a b a s e   a nd  t h e   m i ni m u m   d i s t a n c e   c a l c ul a t e   t h e   e rr o pe r c e n t a ge   w i t t h e   da t a b a s e   w h i c h   ha s   a l l   A r a b i c   l e t t e r   f e a t u r e s .     T h e   l o w e r   v a l ue   of   t hi s   c r i t e ri a   m e a n s   t h e   h i g h   m a t c hi n w i t t h e   d a t a b a s e   l e t t e r.   T h e   r e s ul t s   o f   t h e   M D   da t a   s h o w n   i F i gu r e   5   f o r   t h e   i nput   i m a ge s   l e t t e r s .   F i gu r e   5   s h o w s   t h e   t hr e e   s i z e s   us e t o   c o m pa r e   a l go r i t h m   o ut put s   a s   a   f un c t i o n   o f   l e t t e r   s i z e .   T h e r e   i s   a   s m a l l   d i f fe r e n c e   w h e n   t h e   l e t t e r   s i z e   i s   c ha n ge a s   s h o w n   i F i gu r e   (d) .   H ow e ve r ,   t h e   l e t t e r   r e c o gn i t i o s t i l l   e f f e c t i v e   a n d   gi v e s   a   h i g m a t c h i ng.   T h e   M S D   t ha t   us e i t h e   a l go r i t hm   (2)   i s   e f f e c t i v e   a n d   s i m p l e   t o   a c t   a nd  g i v i ng  re s ul t s .   T h e   t i l t   d a s h e l i n e   i F i gu r e   5   s h o w s   t h e   l o w e s t   v a l ue   of   M D   fo r   A r a b i c   l e t t e r   w h i c h   c o n s i s t s   of   t h e   S N   s e que n c e .   T h e   a c c ur a c y   i s   hi g h   t o   m a ke   t h e   e rr o r   pe r c e nt a ge   r e a c h e s   99 . 8% .   W hi l e   o t h e r e s e a r c h e r s   r e a c a c c ura c y   v a l ue   88. 3 8% [7] ,   9 4. 4 4% [8] 95. 64 % [9] ,   96 . 84 % [10] ,   97. 23% [1 1] ,   a nd  9 7. 3 % [12]   T h e   a c c ur a c y   c a n   b e   c a l c ul a t e   us i n (A CC= [ (M D - a v e r a g e   (M D ))]/ M D 100%),   a n t h e   e rr o r   pe r c e n t a ge   E P = (1 00 - A CC) *100% [ 13] T h e r e f o r e ,   fo r   t h e   l e t t e r   H H A   w i t h   f o n t   s i z e   30,   t h e   M D   i s   0. 0265 a n a v e r a ge   (M D e qu a l   0. 02199 ,   a s   a   r e s ul t ,   t h e   E P   i s   99. 8 %.           (a )               (b )                 (c )               (d)             F i gu r e   4 .   T h e   o ut pu t   i m a ge s   o f   t h e   a l go r i t hm   (1)   f o r   t h e   n e w   f e a t ur e s   (a e dge   de t e c t i o (b d i v i di n g   f i l l e l e t t e a n e dge   i m a ge   i n t o   f o ur   p a r t s   (c l e n g t o f   t h e   j o i n e d   pi xe l   ( d)  h o r i z o n t a l   s t ra i g ht   l i n e         Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 4 ,   N o .   3 J u n e   20 1 9   :     1518     1524   1522             F i gu r e   5 .   T h e   M D   f o r   e a c l e t t e w h e r e   t h e   l e t t e r   S N   f r o m   t he   T a b l e   (1)   f o r   di f f e r e n t   f o n t   s i z e   ( a )   30   (b 36   (c 39  a n d   (d)   t h e   l e t t e r   f o n t   s i z e   a s   a   f un c t i o n   o f   M D       A l go r i t h m   (1) :   c r e a t e   a   da t a b a s e   In p ut :   I n s e r t   i m a ge s   o f   t h e   A ra b i c   l e t t e r s .     O ut put :   D a t a b a s e   (D B c o n t a i n s   19   f e a t u r e s   o f   12  l e t t e r s   (D B   (19x1 2))  a t   s i z e   16   o f   T i m e s   N e w   Ro m a n .   A l go r i t h m   S t e ps :   1)   Co n v e r t   t h e   i nput   i m a ge   t o   a   b i n a r y   i m a ge   w i t a n d   1.     2)   R e m o ve   b l a c h o l e s   w i t h   v a l ue s   t h a t   s u rr o u n d   w i t h   1 .   3)   R e s i z e   of   t h e   i n put   i m a ge   t o   10 x   60   pi xe l s .     4)   F i nd  t h e   c e n t r e   o f   t h e   r e s i z e i m a ge   (c x,   cy ).   5)   Ca l c ul a t e   t h e   n u m b e r   o f   pi xe l s   w i t v a l ue   1 .   6)   F o ur   p a r t s   (C1: 4)  d i v i de i m a ge   a nd  t h e   a r e a   i s   c a l c ul a t e   f o r   a l l   p a r t s .     7)   A ppl y   S o b l e   e dg e   de t e c t i o n   m e t h o d.   8)   F o ur   p a r t s   (E 1 : 4)   di v i de i m a ge   e dge s   a nd  t h e   a r e a   i s   c a l c u l a t e   f o r   a l l   pa rt .   9)   F i nd  t h e   f i r s t   pi xe l   o f   i n   t h e   f i r s t   r o w ,   l a s t   c o l um n,   l a s t   r o w   a n f i r s t   c o l um n,   (x1 ,   y 1),   (x2,   y 2),   (x3,   y 3),   a n (x4 ,   y 4),   r e s pe c t i v e l y .   C o n n e c t   t h e s e   po i n t s   t o   ge t   f o ur   l i n e s   L 1,   L 2,   L 3,   a n L t h e n   c a l c ul a t e   t h e   l e n gt o f   e a c h   l i n e .   10)   F o r   a l l   r o w s   f i n d   t h e   f i r s t   a nd  l a s t   p i xe l   t h a t   e qu a l   t o   1 .   P l o t   s t r a i g h t   l i n e   by   c o n n e c t i n g   t h e s e   t w o   po i n t s .   11)   A c c o un t   t h e   n um b e r   o f   l i n e s   t h a t   do   n o t   ha v e   z e r o e s   i n   t he   m i ddl e ,   a nd  t h o s e   t h a t   h a v e   z e r o e s   i n   i t s   m i dd l e .   12)   F i nd  t h e   l o n ge s t   a nd  s h o r t e s t   s t ra i g ht   l i n e   w i t h o ut   z e r o e s   i n   m i dd l e   a n i t s   l o c a t i o n   i n   e v e r y   r ow   n a m e l y   T 1,   T 2,   T po 1,   a n T po r e s pe c t i v e l y .     A l go r i t h m   (2) :   l e t t e r   r e c o gni t i o n   In p ut :   l o a d   l e t t e i m a ge ,   t h e n   l o a d a t a b a s e   D B   (19x12)   f r o m   t h e   a l go r i t h m   (1) .     O ut put :   R e c o gn i z e   t h e   A r a b i c   l e t t e r.     1)   In p ut   t h e   A ra b i c   l e t t e i m a ge .   2)   E xt ra c t   1 ge o m e t r i c   f e a t u r e s   a s   i a l go ri t hm   (1) .   3)   U s e   m i n i m u m   di s t a n c e   t e c hni que   t o   f i n t h e   m a t c h i ng  b e t w e e n   t h e   e xt ra c t e 19  f e a t u r e s   b e t w e e n   t h e   i n put   l e t t e i m a ge   a nd  t h e   D B   a s :                       |        | |        |   4)   E n d.     1 2 3 4 5 6 7 8 9 10 11 12 0 1 2 3 4 5 (a ) MD Le tte r SN   Waw   Ta a   Seen   Saad   Raa   Me em   Lam   Ha   HHA   Dal   Alef   Ain 1 2 3 4 5 6 7 8 9 10 11 12 0 1 2 3 4 5 (b ) MD Le tte r SN   Waw   Ta a   Seen   Saad   Raa   Me em   Lam   Ha   HHA   Dal   Alef   Ain 1 2 3 4 5 6 7 8 9 10 11 12 0 1 2 3 4 5 Le tte r SN   Waw   Ta a   Seen   Saad   Raa   Me em   Lam   Ha   HHA   Dal   Alef   Ain (c ) MD 30 31 32 33 34 35 36 37 38 39 40 0.0 0.2 0.4 0.6 0.8 (d) MD Letter font  siz e   Waw   Ta a   Seen   Saad   Raa   Me em   Lam   Ha   HHA   Dal   Alef   Ain Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       R e c ogn i z e   pr i nt e d   A r ab i c   l e t t e r   us i ng   ne w   ge om e t r i c al   f e at ur e s   ( H ai dar   J .   Mo ham ad )   1523   T a b l e   2 .   G e o m e t ri c   F e a t u r e s   o f   t h e   A r a b i c   L e t t e r   P ro p e rt y     M e a n i n g     D e t a i l s   W     W i d t h   o I m a g e   (1 0 0 )   H   H e i g h t   o f   I m a g e   (6 0 )   Im a g e   s i z e   W * H   (1 0 0 * 6 0 )   Bl a c k   p i x e l s   Co n v e rt   i m a g e   t o   b i n a r y   Co n v e rt   i m a g e   t o   z e r o   o n e   Cl e a r   t h e   b l a c k   s p a c e   T a k e   t h e   c h a ra c t e s h a p e   H o l e s   F i l l   i m a g e   re g i o n s   a n d   h o l e s   T a k e   t h e   l e t t e r   w i t h o u t   s p a c e s   D e t e r m i n e   t h e   c e n t re   o t h e   c h a ra c t e i m a g e   T h e   c e n t r e   o f   c h a ra c t e s h a p e   (c x ,   cy ).   P o i n t s   Ca l c u l a t e   t h e   n u m b e o f   p i x e l s   w h o s e   v a l u e   i s   e q u a l   t o   1   Ca l c u l a t e   t h e   n u m b e o f   w h i t e   d o t s   a s s o c i a t e d   w i t h   t h e   c h a ra c t e r   (o n e   fe a t u re )   D i v i d i n g   i m a g e   i n t o   fo u e q u a l   p a rt s   ( C1 : 4 )   Ca l c u l a t e   t h e   a r e a   o f   t h e   l e t t e i n   e a c h   p a rt   ( fo u fe a t u re s ) .   D e t e c t i o n   t h e   e d g e s   o f   i m a g e .   Ca l c u l a t e   t h e   n u m b e o f   p o i n t s   i n   t h e   e d g e s   o a   c h a ra c t e u s i n g   t h e   S o b e l   c o e ffi c i e n t .   D i v i d i n g   i m a g e   i n t o   fo u e q u a l   p a rt s   ( E 1 : 4 )   Ca l c u l a t e   t h e   l e n g t h   o f   t h e   ri b   d ra w n   b e t w e e n   t h e   fo u p o i n t s   ( fo u fe a t u re s ) .   s t ra i g h t   l i n e   F i n d   t h e   (x 1 ,   y 1 ),   (x 2 ,   y 2 ) ,   ( x 3 ,   y 3 ),   ( x 4 ,   y 4 c o o r d i n a t e s   o f   t h e   f i r s t   p i x e l   t h a t   e q u a l   t o   1   i n   t h e   f i rs t   r o w ,   l a s t   c o l u m n ,   l a s t   ro w   a n d   f i r s t   c o l u m n ,   r e s p e c t i v e l y .   P l o t   s q u a re   s h a p e   a n d   c a l c u l a t e   t h e   l e n g t h   o e a c h   s i d e ,   L 1 ,   L 2 ,   L 3 ,   a n d   L 4   ( fo u fe a t u re s ) .   d e t e r m i n e   t h e   c o o r d i n a t e s   o t h e   f i r s t   a n d   l a s t   p i x e l   t h a t   e q u a l   t o   1   Ca l c u l a t e   t h e   l o n g e s t   s t ra i g h t   l i n e   c o n n e c t e d   a n d   i t s   l o c a t i o n   (o n e   fe a t u r e ).   A c c o u n t   t h e   n u m b e o l i n e s   t h a t   d o n ’t   c o n t a i n   z e ro e s   p i x e l   i n   t h e   m i d d l e ,   a n d   t h o s e   t h a t   c o n t a i n   z e r o e s   i n   i t s   m i d d l e .   Ca l c u l a t e   t h e   s h o rt e s t   s t ra i g h t   l i n e   c o n n e c t e d   a n d   i t s   l o c a t i o n   (o n e   fe a t u r e ).   F i n d   t h e   l o n g e s t   a n d   s h o rt e s t   s t ra i g h t   l i n e   t h a t   d o e s n ’t   c o n t a i n   z e ro e s   i n   m i d d l e   a n d   i t s   l o c a t i o n   i n   a n y   r o w   Ca l c u l a t e   t h e   l o n g e r   a n d   s h o rt e s t ra i g h t   a n d   i n t e r m i t t e n t   l i n e   a n d   p o s i t i o n   T 1 ,   T 2 ,   T p o 1 ,   a n d   T p o 2   ( fo u fe a t u re s ).     A p p l y i n g   t h e   m i n i m u m   d i s t a n c e   t e c h n i q u e   t o   re c o g n i z e   i n p u t   i m a g e   c h a ra c t e r   F i n d   t h e   e rr o r   o t h e   m a t c h i n g   b e t w e e n   t h e   d a t a b a s e   a n d   t h e   r e c o g n i z e d   l e t t e r.       6.   C O N C LU S I O N     T h e   ge o m e t r i c a l   c ha r a c t e r   o f   s o m e   A r a b i c   l e t t e r   c h a n ge w i t h   i n c r e a s e   of   t h e   f o n t   s i z e   i n   t h e   w o r s of t w a r e .   T h i s   c a n   b e   n o t i c e f r o m   F i gur e   (d) ,   t h e   M D   i s   c ha n gi ng  w i t h   t h e   f o n t   s i z e   f o r   s o m e   A r a b i c   l e t t e r   w h i l e   s o m e   of   t h e m   a r e   c o n s t a nt .   T h e   s ugge s t e n e w   f e a t ure s   gi ve   h i g h   a c c ura c y   t o   r e c o gn i z e   A r a b i c   l e t t e de pe n di n g   o n e w l y   de s i gn e t w o   a l go r i t hm s .   T h e   19  f e a t u r e s   ge o m e t r y   s e l e c t e c a r e f ul l y   t o   r e c o gn i z e   s i m i l a r   A ra b i c   l e t t e r   s ha pe s .   T h e   c ri t e r i a   t o   di s t i n gu i s h   b e t w e e n   t h e   r e s ul t s   de pe n ds   o n   m i ni m u m   di s t a n c e .   T h i s   i s   s h o w n   f r o m   t h e   da s h e l i n e   i F i gu r e   5   w hi c l o c a t e   t h e   m i ni m um   v a l ue   o f   t h e   M D .         R EF ER EN C ES   [ 1]   I .   S upr i a na ,   A .   N a s u t i o n,   A r a b i c   C ha r a c t e r   R e c o g ni t i o S y s t e m   D e v e l o pm e nt ,   P r o c e di a   T e c hno l o gy ,   11  ( 20 13)   334 - 341 .   [ 2]   M .   S a r f r a z ,   M . J .   A hm e d,   S . A .   G ha z i ,   S a udi   A r a b i a l i c e n s e   p l a t e   r e c og ni t i o s y s t e m ,   i n:   I nt e r n a t i o na l   C o nf e r e nc e   o G e o m e t r i c   M o de l i ng   a nd   G r a ph i c s ,   20 03,   p p.   36 - 41 .   [ 3]   H e s a m   I z a ki a n ,   S e y e A m i r ha s a n   M o na d j e m i ,   B e h r o uz   T o r L a da ni ,   K .   Z a m a n i f a r . ,   M ul t i - F o nt   F a r s i   /   A r a b i c   I s o l a t e C h a r a c t e r   R e c o g ni t i o U s i ng   C ha i C o de s ,   i C o nf e r e nc e   P r o c e e di ng s ,   W o r l A c a de m y   of   S c i e nc e ,   E ng i ne e r i ng   a nd   T e c hno l o gy   2009,   pp .   58 - 61 .   [ 4]   G . A .   A ba nda h,   M . Z .   K h e dhe r ,   A na l y s i s   o f   H a ndw r i t t e A r a b i c   L e t t e r s   U s i ng   S e l e c t e F e a t u r e   E xt r a c t i o T e c hni qu e s ,   I nt e r na t i o na l   J o ur n a l   o f   C o m put e r   P r o c e s s i ng   o f   L a ng ua g e s ,   22   ( 2009 )   49 - 73 .   [ 5]   A hm a T .   A l - T a a n i ,   S a e e d   Al - H a j ,   R e c o g ni t i o o f   O n - l i ne   A r a bi c   H a n dw r i t t e C h a r a c t e r s   U s i ng   S t r uc t ur a l   F e a t ur e s ,   J o ur na l   O f   P a t t e r n   R e c o g ni t i o R e s e a r c h ,   1   ( 201 0)   23 - 37 .   [ 6]   Z .   A bde l m a l e k,   O M u l t i p l e   T y pe f a c e   A r a bi c   S c r i pt   R e c o g ni t i o n,   R e s e a r c J o ur na l   o f   A ppl i e S c i e nc e s   E ng i ne e r i n g   a nd   T e c hno l o gy ,   ( 2010 )   428 - 43 5.   [ 7]   N e i l a   M e z g ha ni ,   A .   M i t i c he ,   O n - l i n e   r e c o g ni t i o o f   ha ndw r i t t e A r a bi c   c ha r a c t e r s   us i ng   A   K o ho ne ne ur a l   ne t w o r k ,   i E i g ht h   I nt e r na t i o na l   W o r ks ho o F r o nt i e r s   i H a ndw r i t i ng   R e c og ni t i o ( I W F H R 02) ,   I E E E ,   C a na d a ,   2002 ,   pp .   4 90 4 95.   [ 8]   S .   M o z a f f a r i ,   K .   F a e z ,   M .   Z i a r a t ba n ,   S t r uc t u r a l   D e c o m po s i t i o a nd  S t a t i s t i c a l   D e s c r i pt i o o f   F a r s i / A r a b i c   H a ndw r i t t e N um e r i c   C ha r a c t e r s ,   i P r o c e e di ng s   o f   t h e   E i g ht h   I nt e r na t i o na l   C o nf e r e nc e   o D o c um e nt   A na l y s i s   a nd  R e c o g ni t i o n,   I E E E   C o m put e r   S o c i e t y ,   2005 ,   pp .   237 - 241 .   [ 9]   N . B .   A m o r ,   M .   Z a r a i ,   N . E . B .   A m a r a ,   N e u r o - F uz z y   a ppr o a c i n   t h e   r e c o g ni t i o o f   A r a bi c   C ha r a c t e r s ,   i 2006   2n d   I nt e r na t i o na l   C o nf e r e nc e   o I nf o r m a t i o &   C o m m uni c a t i o T e c hno l o g i e s ,   200 6,   pp .   164 0 - 1644 .   [ 10]   H .   M a j i d,   M .   D z ul k i f l i ,   R .   A b do l r e z a ,   D e duc t i v e   m e t ho f o r   r e c o g ni t i o of   o n - l i ne   ha ndw r i t t e P e r s i a n / A r a bi c   c ha r a c t e r s ,   i 201 T he   2nd  I nt e r na t i o na l   C o nf e r e nc e   o C om put e r   a nd  A ut o m a t i o E ng i ne e r i ng   ( I C C A E ) ,   2010,   pp.   79 1 - 795.   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 4 ,   N o .   3 J u n e   20 1 9   :     1518     1524   1524   [ 11]   B . M . F .   B us o f ,   M .   S pa n n,   S e g m e n t a t i o a nd  r e c o g ni t i o o f   A r a bi c   c ha r a c t e r s   by   s t r uc t u r a l   c l a s s i f i c a t i o n,   I m a g e   a nd  V i s i o C o m put i ng ,   15   ( 1997 )   167 - 179 .   [ 12]   S . A .   M a hm o ud,   A . S .   M a hm o ud,   T he   us e   o f   H a r t l e y   t r a ns f o r m   i n   O C R   w i t a pp l i c a t i o t o   pr i nt e A r a b i c   c ha r a c t e r   r e c o g ni t i o n,   P a t t e r n   A na l y s i s   a nd   A ppl i c a t i o ns ,   12   ( 2 008 )   353 .   [ 13]   W .   G ua ng ,   M .   B a r a l do ,   M .   F u r l a nu t ,   C a l c ul a t i ng   p e r c e n t a g e   p r e di c t i o e r r o r :   A   us e r ' s   no t e ,   P ha r m a c o l o g i c a l   R e s e a r c h,   32   ( 199 5)   241 - 24 8.     Evaluation Warning : The document was created with Spire.PDF for Python.