I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   1 6 ,   N o .   3 D e c e m b e r   201 9 ,   pp .   1482 ~ 1489   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 1 6 .i 3 . pp 148 2 - 1489             1482       Jou r n al   h o m e pa ge ht t p: / / i ae s c or e . c om / j our na l s / i nde x . php/ i j e e c s   A   f r a m e w o r k   f o r   s e n t i m e n t   a n a l y si s   i n   A r a b i c   t e x t       A l aa  A b d al q ah a r   Ji h ad   1 A h m e d   S u b h i   A b d al k afo r   2   1 C o m put e r   C e nt e r ,   U ni v e r s i t y   o f   A nba r ,   I r a q   2 C a r e e r   D e v e l o pm e nt   C e n t e r ,   U n i v e r s i t y   o f   A nba r ,   I r a q       A r ti c l e   I n fo     A B S TR A C T     Ar t i c l e   h i s t or y :   R e c e i v e d   F e b   26 ,   2 01 9   R e v i s e J un   1 ,   2019   A c c e pt e J ul   22 ,   201 9       O v e r   t he   l a s t   de c a de   t he r e   ha s   be e a i nc r e a s e   i num be r   o f   E - m a i l s   o r   c om m e nt s   t o   a   c om pa ny   v i a   s o c i a l   m e di a   s i t e s ,   t o   s a t i s f y   t he i r   c us t o m e r s ,   t h e   c om pa ny   m us t   t a ke   i t o   c o ns i de r a t i o t he s e   m e s s a g e s   a nd  c o m m e nt s   a nd   kno w   w he t h e r   t h e   c us t o m e r s   a r e   s a t i s f i e d   w i t w h a t   t h e   c o m pa ny   o f f e r s   o r   no t .   S e v e r a l   t e c hni que s   ha v e   be e p r o po s e t o   a na l y z e   t he   s e n t i m e nt   o f   t he   c om m e nt   w r i t e r .   D e a l i ng   w i t t he   A r a b i c   l a ng ua g e   i s   f a c e w i t m a ny   c ha l l e ng e s ,   s uc a s   i t   i s   a   m o r pho l o g i c a l l y   r i c l a ng ua g e   a nd  ho w   t o   r e t u r n   t he   w o r d   t o   i t s   o r i g i na l   r o o t .   I t h i s   pa p e r   t h e   c ha l l e ng e s   o f   de a l i n g   w i t t he   A r a bi c   l a ng ua g e   w e r e   r e v i e w e a nd  a   f r a m e w o r w a s   a l s o   e s t a bl i s he t o   a na l y z e   t he   c o m m e nt s   i A r a bi c   a nd  c l a s s i f y   i t   i nt o   po s i t i v e ,   n e g a t i v e   o r   ne ut r a l   s e n t i m e n t .   T he   f r a m e w o r w a s   t r a i n e d   a nd   t e s t e d   a nd  t h e t he   c o n - c l us i o ns   w e r e   dr a w ba s e d   o i t s   w o r k .     Ke y w or d s :   A ra b i c   t e xt   c l a s s i f i c a t i o n   B a o f   w o r ds   N a t u ra l   l a n gu a ge   p r o c e s s i n g   S e n t i m e n t   a na l y s i s   T e xt   m i ni n g   C opy r i gh t   ©   201 9   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   A l a a   A b da l q a h a J i ha d ,   Co m put e Ce n t e r ,   U n i v e r s i t y   of   A n b a r ,   A n b a r ,   I r a q .   E m a i l :   i t . a l a a . h e e t y @ uo a n b a r . e du . i q       1.   I N TR O D U C TI O N     T h e   f l ow   of   i n f o r m a t i o n   o v e r   t h e   I n t e rn e t   i s   t o o   l a r ge   t o   s e a r c h   f o r   a n   a ut o m a t i c   a na l y s i s   o f   ve r y   i m po rt a nt   do c um e n t s   a nd  t e xt s   [1].   A n   a na l y s i s   o f e e l i ngs   o r   o pi n i o n s   i s   t h e   us e   of  n a t u r a l   l a ngua ge   pr o c e s s i n g,   t e xt u a l   a na l y s i s   a nd  c o m put e r   l i n gu i s t i c s   f o r   t h e   pu r po s e   of   de t e c t i n f e e l i n gs   t ha t   a r e   us e f ul   o r   n e ut ra l   t o w a r ds   t h e   s ub j e c t   of   t h e   t e xt .   A n o t h e r   c o n c e pt   i s   t o   i de nt i fy   t h e   s e n s o r y   t o n e   of   a   s e r i e s   o f   w o r ds   f o r   t h e   pur po s e   of   un de r s t a n di ng  o p i ni o n s   a n e m o t i o n s ,   w h e t h e r   t h e y   a r e   s a o r   ha ppy .   E m o t i o n a l   a na l y s i s   ge n - e r a l l y   a i m s   t o   i de n t i f y   t h e   f e e l i n gs   o a   s pe a ke r   o r   w r i t e r   a b o ut   a   s ubj e c t   o r   t o   i de n t i fy   t h e   pr e do m i n a nt   f e e l i n gs   o f   a   do c um e n t   w r i t e r.   T h e s e   f e e l i ngs   c a n   e xp r e s s   t h e   a ut h o r ' s   o pi ni o o r   hi s   e m o t i o n a l   s t a t e   [ 2] ,   t h e   da t a   i s   c l a s s i f i e i nt o   po s i t i v e ,   n e g a t i v e   o r   m i xe A s   w e l l   a s   t h e   t e nde n c i e s   o f   t h e   pe r s o n   i n   t e rm s   o ps y c h o l o gi c a l   o de pr e s s i o n   a n a n xi e t y   [3 - 4].   E m o t i o n   a na l y s i s   i s   us e i n   a r e a s   o m a rke t i n g ,   c us t o m e r   s e r v i c e ,   a n d   o t h e a r e a s .   T h e   o r ga ni z a t i o na l   p r o c e s s e s   o f   kn ow l e dge   m a na ge m e nt   s y s t e m s   s uc h   a s   a c a de m i c   l i b ra r i e s   t hr o ug h   t h e   c l a s s i f i c a t i o n   o f   s c i e n t i f i c   pub l i c a t i o n s ,   w h i c h   h e l r e s e a r c h e r s   t o   f i nd  us e f ul   i n f o r m a t i o n   a n qu i c a c c e s s   t o   us e f ul   a rt i c l e s   a m o ng  m i l l i o n s   o a r t i c l e s .     T h e r e   a r e   m a n y   s t udi e s   a n p r a c t i c a l   a ppl i c a t i o n   t o   t h e   a n a l y s i s   of  t h e   t e xt ,   o r   c l a s s i f i c a t i o n   o n   E n gl i s h   l a ngua ge   a n d   o t h e r   l a ngua ge s   [5 - 7] s e ve r a l   s t u di e s   h a v e   be e n   s ugge s t e i n   S e n t i m e nt   A na l y s i s   of   A r a b i c   T e xt ,   t h e   c o n t r i b u t i o n s   t o   t h e   e x i s t i ng  s t u di e s   a r e   t h e   f o l l o w i n g:   M o h a m m a e t   a l   [8] .   T h e   s t udy   i n c l ude a   d i s c us s i o n   o f   t he   pr o b l e m   o f   c l a s s i fy i n t h e   A ra b i c   t e xt   us i n t hr e e   a l go ri t hm s :   N a ï v e   B a y e s   (N B ),   S uppo r t   v e c t o r   m a c h i n e   (S V M a n N e u r a l   N e t w o r (N N a nd  t h e a p pl i e d   a   c o m pa r a t i v e   s t udy   o n   a   l a r ge   A ra b i c   da t a b a s e .   I t hi s   s t udy ,   a   s t e a dy   n u m b e r   o f   A r a b i c   do c um e n t s   w e r e   us e i n   t h e   t ra i ni n g   p ha s e .   T h e   s t udy   i nc l ude s e ve r a l   s t a ge s .   F i r s t ,   P r e p r o c e s s i n t h e   purpo s e   of   t h i s   s t a ge   i s ,   t o   e a s i l y   h a ndl e   do c u - m e nt s   a nd  r e duc e   c o m pl i c a t i o n s   s uc h   a s   de l e t i n g   u nn e c e s s a r y   w o r ds   s uc h   a s   s t o w o r ds   a n d   t a gs .   T hi s   p r o c e s s   i s   fo l l ow e by   t h e   r e p r e s e n t a t i o n   o f   t h e   do c um e n t   w h e r e   i t   i s   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A   f r am e w or k   f or   s e nt i m e n t   an al y s i s   i A r abi c   t e x t   ( A l aa   A bd al qahar   J i had)   1483   c o n v e r t e t t h e   v e c t o r   a r e a   a nd  t h e n   t h e   r e duc t i o n   o f   di m e n s i o n s   i s   c h o s e n   s o   t h a t   t h e   t e xt   b e c o m e s   f r e e   f r o m   t h e   c o m pl e xi t i e s   a n r e a dy   t o   e xt r a c t   p r o pe r t i e s ,   t h i s   p ro c e s s   i n c l ude s   c l e a ni n t h e   t e xt   a nd  s t e m m i n t o   b e   pr e s e n t e i n   c l e a r   f o r m a t   a n t h e n   i de n t i fy   t h e   m o s t   i m po r t a nt   f e a t u r e s   a pp r o pr i a t e   t o   t h e   o r i gi na l   t e xt .   A f t e r   c o n duc t i ng  t h e   t r a i n i ng  a n t e s t i ng  o f   t h r e e   a l go ri t hm s   a n c o m pa ri n t h e m .   T h e   r e s ul t s   s h o w e t h a t   t h e   S V M   a l go ri t hm   s uppo rt s   t h e   b e s t   r e s ul t s .   Al - A n z i   a n A b uZ e i na   [9] .   I n   t hi s   s t udy ,   t h e   t e c hn i q ue   of   c os i n e   s i m i l a ri t y   w a s   us e fo r   t h e   pu r po s e   of   v e r i fy i n t h e   pe r f o r m a n c e   o t h e   c l a s s i f i c a t i o n   o f   t h e   A ra b i c   t e xt .   T h e   s i n g l e   v a l ue   a na l y s i s   m e t h o (S V D )   w a s   us e t o   i n de t h e   u n de r l y i n s i g ni f i c a n c e   (L S I)  t o   e xt ra c t   t h e   t e xt ua l   p r o pe r t i e s .   T h e   S L t e c hn i q ue   i s   t r e p r e s e n t   t h e   t e xt   i n   a   b e t t e r   w a y   be c a us e   i t   m a i nt a i n s   t h e   s e m a nt i c   i n f o r m a t i o n   b e t w e e n   t h e   w o r ds .   A   n um b e of   c l a s s i f i c a t i o n   m e t h o ds   h a v e   be e n   a ppl i e (C l a s s i f i c a t i o n   T r e e   (CT ),   N e ura l   N e t w o r (N N ),   N a ï v e   B a y e s   (N B ),   R a n do m   F o r e s t   (R F ),   S uppo r t   V e c t o r   M a c hi n e   (S V M a nd  K - N e a r e s t   N e i g h b o r s   (K N N ))  ove r   4, 000   do c um e n t s   f o r   10   t o pi c s   (400   do c um e n t s   pe t o pi c ).   I n   t h i s   s t udy ,   t h e   m e t h o (T F . ID F w a s   us e t o   e xt ra c t   f e a t ur e s .   A f t e r   a n a l y s i s   a n t e s t i ng,   t h e   r e s ul t s   s h o w e t h a t   t he   us e   of   (L S I)  i s   s upe r i o r   t o   (T F . ID F a n t h e   K - N e a r e s t   N e i g h b o r s   (K N N )   m e t h o o f   c l a s s i f i c a t i o i s   t h e   b e s t   a m o n t h e   m e t h o ds   o f   c l a s s i f i c a t i o us e i t h i s   s t udy .     B a h a s s i n e   e t   a l   [ 1] .   T hi s   p r o po s e s t ud y   i n c l ude t w o   m a i n   a s pe c t s ;   t h e   f i r s t   a s pe c t   i n c l ude t h e   de ve l o pm e n t   o f   n e w   a l go r i t hm s   t o   r e p r e s e nt   e a c h   t e rm   o f   a   pa r t i c ul a r   do c um e n t   a t   i t s   r o o t .   T h e   o t h e r   s i de   of  t h i s   s t u dy   w a s   t h e   s t u dy   of   t h e   c o m pa r i s o n   o f   t h e   t w o   a l go ri t hm s   ( n e w   s t e m m e a n K h o j a ’s   s t e m m e r o 5070  do c u m e n t s   c l a s s i f i e i n de pe n de n t l y   i n t o   s i c a t e go r i e s   e n t e rt a i n m e nt ,   M i d dl e   E a s t ,   s po r t ,   s w i t c h   a nd  w o r l o n   W E K A   t o o l ki t   a   b us i n e s s ).   P r e c i s i o n   m e a s u re s   a n f - m e a s u r e   w e r e   us e t o   c o m pa r e   t h e   pe r f o r m a n c e   o f   m o de l s .   T h e   e xpe ri m e n t a l   r e s ul t s   o f   t h i s   s t udy   s h o w e t h e   s upe r i o r i t y   of   t h e   pr o po s e d   a l go ri t hm   t o   c l a s s i f y   t h e   t e xt ;   i t   r e a c h e 89 . 1%   i t h e   b us i n e s s   c a t e go r y   a n d   92 . 9%   i t h e   s po rt s   c a t e go r y .   Al - S a b a h i   e t   a l   [10] .   In   t hi s   s t udy ,   a   m e t h o of  s e m a n t i c   a na l y s i s   of   A r a b i c   do c um e n t s   w a s   i m p r o v e d,   w h e r e   s t a t i s t i c a l   a n l i n e a r   m e t h o ds   w e r e   us e t ov e r c o m e   r e s t ri c t i o n s   t ha t   r e duc e   pe r f o r m a n c e .   A   pa rt   o t h e   s pe e c h   c l a r i f i c a t i o n   t o o l   w a s   us e t o   m i ni m i z e   di m e n s i o n s   (L S A ).   F o r   t h e   pu r po s e   of  c o n s i de r i ng  t h e   o r de r   o f   w o r ds   a n g ra m m a t i c a l   r e l a t i o n s hi p s   dur i ng  t h e   c a l c ul a t i o n   o f   t h e   m a t ri x,   t h e   w e i ght   of   t h e   t e rm   w a s   a d de i f o ur   s e nt e n c e s   t o   w e i gh t i ng  s c h e m e s .   A l s o ,   t o   m a ke   t h e   s u m m a r y   t ha t   w a s   c r e a t e m o r e   us e f ul ,   t h e   de s c r i pt i o n   o t h e   t e rm   a n t h e   de s c r i p t i o n   of   t h e   s e n t e n c e   w e r e   c o m b i n e fo r   e a c h   s ub j e c t .   A n   e xt e n s i v e   t ri a l   o f   fo ur   s e t s   of   da t a   ha s   b e e n   a ppl i e t o   b o t h   E n gl i s h   a nd  A ra b i c   t o   e n s ur e   t h e   e ff e c t i v e n e s s   of   t h e   p r o po s e a l go r i t h m .   T h e   r e s ul t s   s h o w e t h e   b e s t   r e s ul t s   c o m pa r e d   t o   t h e   l a t e s t   t e c hn o l o g y .   A l ow a i di   e t   a l   [1 1] .   I n   t hi s   s t udy ,   a   m o de l   h a s   de v e l o pe a   m o de l   fo r   a   s e m a n t i c   A ra b i c   t e xt   b a s e d   o n   t h e   a pp l i c a t i o o f   T w i t t e r   us i n g   s e m a nt i c   a n a l y s i s   a n d   m a c h i n e   l e a rn i ng.   T h e   s y n o n y m s   t h a t   a ppe a i t h e   T w i t t e r   a ppl i c a t i o n   a r e   r e p r e s e nt e a s   di f fe r e nt   i n de pe n de nt   f e a t ur e s .   T o   ov e r c o m e   t h e s e   l i m i t a t i o n s ,   t h e   t w e e t s   w e r e   r e pr e s e nt e by   a e xt e rna l   k n o w l e dge   b a s e   (A ra b i c   W o r dN e t   (A W N )).   I n   t h i s   s t udy ,   m e t h o ds   of  r e p r e s e n t i n a nd  e v a l ua t i ng  di f f e r e n t   c o n c e pt s   w e r e   de v e l ope us i n a l go ri t hm s   S V M   a nd  N B   c l a s s i f i e r s .   T h e   e xpe r i m e nt a l   r e s ul t s   s h o w e a n   i m p r o v e m e n t   i n   t h e   pe r f o r m a n c e   o f   t h e   pr o po s e m o de l   c o m pa r e t o   t h e   b a s i c   m o de l   w h e r e   t h e   ra t i o s   w e r e   r e a c h e 5. 78%  i n   N B   c l a s s i f i e r   w h i l e   t h e   ra t i o   r e a c h e 4. 48 i n   S V M   c l a s s i f i e r .   F r o ud  a n O ua t i [12] .   T h i s   pa pe r   a i m s   t o   a ut o m a t i c a l l y   c o m pi l e   s i m i l a r   do c um e nt s   i n t o   o n e   c l us t e r .   T h i s   p a pe r   a i m s   t o   a ut o m a t i c a l l y   c o l l e c t   s i m i l a do c um e n t s   i n   o n e   do c um e n t   c l us t e r   a nd  r e duc e   t h e   n o i s e   i t h e   do c um e n t   i n f o r m a t i o t o   e nha n c e   t h e   pe r f o r m a n c e   of   do c um e n t s   c l us t e ri n g .   I n   t h i s   s t udy ,   t h e   e f fe c t   o s um m a r i z i n g   t h e   t e x t   w a s   e v a l ua t e us i ng  t h e   l a t e nt   a na l y s i s   m o de l   f o r   t h e   u n de r l y i n s i g n i f i c a n c e   o f   t h e   c o m pi l a t i o n   A ra b i c   do c um e n t s   us i n t h e   f o l l ow i n m e t h o d s :   J a c c a r d   Co e ff i c i e n t   (J C),   E uc l i de a D i s t a n c e   (E D ),   P e a r s o n   Co rr e l a t i o n   Co e f f i c i e n t   (P CC) ,   Co s i n e   S i m i l a ri t y   (CS a n A v e r a ge K ul l b a c k - L e i b l e r   D i v e r ge n c e   (A K D ).   T h e   e xpe ri m e n t a l   r e s ul t s   s h o w e t ha t   t h e   p r o po s e s o l ut i o n s   s o l v e   t h e   pr o b l e m s   of   t h e   l e n g t h   o f   d o c um e n t s   a s   w e l l   a s   t h e   n o i s e   i n f o r m a t i o n   t h us   a   hi g h   i m p r o v e m e n t   i n   t h e   pe r f o r m a n c e   o do c um e n t s   c l us t e r i ng.   B i l a l   a n R a s h a   [13] .   I n   t h i s   p a pe r ,   a   g r o up  o f   o pi n i o n s   o n   r e s t a u ra n t s   a n t h e   c o n c l us i o n   o l i n gu i s t i c   c ha r a c t e r i s t i c s   w a s   a n a l y z e t o   b e   us e i n   t h e   s i m i l a ri t y   m e a s ur e s .   T h e   m o s t   i m po rt a nt   f e a t ur e s   w e r e   e xt ra c t e b a s e o n   t h e   kn o w l e dge   b a s e   a n t h e   di s t ri b ut i o na l   s i m i l a ri t y   be t w e e n   t h e   a s pe c t s   o f   r e v i s i o n s   a n s pe c i f i c a t i o n s .   T h e   r e s ul t s   s h o w e h i g h   pe r f o r m a n c e   of   t h e   a ppl i c a t i o n   a f t e r   a pp l y i n t hi s   pr o po s a l   t h e l a c a de m i c   c h a l l e n ge s   da t a s e t .   T h e r e   i s   v e r y   l i t t l e   of   t h i s   r e s e a r c h   h e a de t o w a r ds   t h e   A r a b i c   l a ngua ge   a n t h e r e f o r e   t h e r e   a r e   s e ve r a l   r e a s o n s   f o r   t hi s ,   i n c l udi ng  t he   r ul e s   of   A r a b i c   l a ngua ge   a n t h e   fo r m a t i o n   of  l e t t e r s   w h e r e   t h e y   a r e   c o nn e c t e a n n o t   s e pa r a t e ,   o n e   pu n c h,   e a c h   l e t t e r   o f   t h i s   l a n g ua ge   e n t e r s   i n t o   s e v e r a l   pri m i t i v e ,   i n t e rm e di a t e ,   f i ni t e   a n d   s e pa r a t e g r o ups   a s   w e l l   t he r e   a r e   di f f e r e n t   f o r m s   o f   w o r ds .           Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 6 ,   N o .   3 D e c e m be r   2 01 9   :     1 4 8 2   -   1 4 8 9   1484   1. 1 .   A p p l i c at i o n s   o Te x A n al ys i s     M a s s i v e   a m o un t   o f   da t a   i s   i n c r e a s i ng  d a y   by   da y   s o   w e   n e e t o   m a i n t a i a n d   a na l y z e   da t a   f o r   e ffe c t i ve   pr o c e s s .   T h e r e   i s   gr e a t   i m po rt a n c e   i n   t h e   p r o c e s s i ng  of   t e xt   m i n i n a n h i g h e r   c o m m e r c i a l   po t e n t i a l   of   da t a   e xt ra c t i o n ,   t e xt   a na l y s i s   c a b e   us e i m a n y   a ppl i c a t i o n s   i n c l udi ng  [ 14 - 19] :   1)   Cl a s s i f i c a t i o n   o f   t e xt s   t o   s pe c i f i c   r a n ge s .   2)   S e n t i m e n t   a na l y s i s .   3)   S um m a r i z e   t h e   do c um e n t   t o   p r o v i de   t h e   m o s t   i m po rt a nt   po i nt s   i t h e   o r i gi na l   do c um e n t .   4)   L e a rn   a b o ut   r e l a t i o n s hi ps   b e t w e e n   s pe c i f i c   e n t i t i e s .   5)   S e a r c h   f o r   i n f o r m a t i o n   i n   t h e   t e x t .   6)   Ca t e go ri e s   t o   m a ke   t h e m   e a s i e f o r   po t e nt i a l   us e r s   t o   i de n t i fy .   7)   O r g a n i z e   t e xt s   s o   t h a t   t h e   us e r   c a e a s i l y   a c c e s s   t h e m .   8)   T h e   o pi n i o n s   c a n   b e   a n a l y z e fo r   ob t a i ni n c o n s i de r a t i o n   o f   t h e   de c i s i o n - m a ki ng  i n   a n y   o r ga ni z a t i o n .     1. 2 .   A r ab i c   C h al l e n g e s   D e a l i n g   w i t h   t e xt s   i n   A ra b i c   i n c l ude s   m a n y   c ha l l e n ge s   [ 20 - 23 ]   :   1)   A ra b i c   i s   m o r p h o l o gi c a l l y   r i c l a n g ua ge .   2)   R e t urn   t h e   w o r t o   i t s   o r i g i n a l   r o o t   (S t e m m e r).   3)   Co n t a i w o r ds   i c o l l o qui a l   t e r m s .   4)   T e xt s   c o n t a i E n gl i s h   w o r ds   w r i t t e i A r a b i c   l e t t e r s .   5)   Wr i t i n g   c h a ra c t e r s   i p l a c e   o f   o t h e c ha r a c t e r s .   6)   A ddi t i o n s ,   p r e f i xe s ,   m i dd l e   a nd  e n di ngs .   7)   T h e   n u m b e r   o f   w o r ds   i s   h uge .   8)   S pe l l i n g   a nd  g ra m m a t i c a l   e rr o r s   i t e xt s .   9)   H i gh l y   us e   of   A r a b i c   p r o n o un s .   10)   Co n s o n a nt   do ub l e ( ّ   ـ ).       2.   TH E   P R O P O S ED   F R A M EW O R K   T h e   p r o po s e f r a m e w o r c o n s i s t s   of   t w o   pa r t s ;   p a rt   f o r   t r a i n i n a n p a r t   f o r   t e s t i n g.   T h e   m o de l   us e i s   b a o f   w o r ds   a n t r y   t o   m a ke   t h e m   e f f i c i e n t   m e t h o by   a ddi ng  w e i gh t   f o r   e a c h   w o r d,   t hi s   w e i gh t   w a s   a dde b a s e o n   r e pe a t i ng  t h e   w o r i n   t e x t s   w h e n   t r a i n i ng .   W h a t   di s t i n gu i s h e s   t h e   f r a m e w o r i s   t ha t   t h e   da t a b a s e   w a s   b ui l t   w i t h o ut   s t e m m e r,   i n c l udi n a   da t a b a s e   o f   po s i t i v e   w o r ds   a n a   d a t a b a s e   of   n e ga t i v e   w o r ds   a s   i T a b l e   1   a n d   T a b l e   2   s h o w   e xa m p l e   o t h e   s t o a n d   n e g a t i o n   w o r ds .       T a b l e   1 .   E xa m p l e   O n   T h e   P o s i t i v e   a n d   N e ga t i v e   W o r ds        P o s i t i v e         N e g a t i v e   W o r d   W e i g h t     W o r d   W e i g h t   ن يز   62     شم   57   د مح ل ا   36     سب   39   ر يخ   28     م ا ر ح   19   م عن   15     وم   16   ل يمج   13     ن يو   15   ى ل ح ا   12     شيل   15   ع ئا ر   11     فس ل   11   حص   10     ل يل ق   11   ع ئا ر   9     ل كا ش م   9   و ل ح   8     يل ا كت ف   9       T a b l e   2 .   E xa m p l e   o t h e   s t o a n d   n e ga t i o w o r ds   S t o p   w o r d s     N e g a t i o n   w o r d s   نا     س يل   د ع ب     ت سيل   ى ل ا     ر يغ   يف       نم       (Co l l o q u i a l   t e r m وم       F i gu r e   i l l us t r a t e s   t h e   t ra i ni n s t e ps   i t h e   f ra m e w o r k,   a n F i gu r e   s h o w s   t h e   s t e ps   o f   t e s t i ng  a nd   a n a l y z i n g   t h e   c o m m e n t s .     Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A   f r am e w or k   f or   s e nt i m e n t   an al y s i s   i A r abi c   t e x t   ( A l aa   A bd al qahar   J i had)   1485       F i gu r e   1 .   T r a i n i ng  s t e ps           F i gu r e   2 .   T e s t i n g   s t e ps   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 6 ,   N o .   3 D e c e m be r   2 01 9   :     1 4 8 2   -   1 4 8 9   1486   2. 1 .   D atas e D e s c r i p ti o n   T h e   da t a s e t   us e f r o m   c o m m e r c i a l   s i t e   (f o r   s e l l i n p r o duc t s w h e r e   t h e   c o m m e nt   i s   w r i t t e n   d i r e c t l y   i n   t h e   s i t e   o r   t hr o ug h   s o c i a l   m e d i a   s i t e s   o E m a i l   o f   t h e   c o m pa n y .     2. 2 .   Tr ai n i n g   T h e   f o l l ow i n a r e   t h e   t r a i n i ng  s t e ps ,   t h e   i n pu t   i s   a   s e t   o f   c o m m e n t s   a n o ut pu t   i s   a   d a t a b a s e   c o n t a i ni n g   n e ga t i v e   a n d   po s i t i v e   w o r ds   w i t t h e i w e i gh t s :   1)   S e l e c t   t y pe   of   s e n t i m e nt   (P o s i t i v e   o r   N e g a t i v e a nd  i t s   o w n   C o m m e n t s   s e t .   2)   A ppl y   t h e   f o l l ow i n g   t o   e a c h   Co m m e nt   i t h e   Co m m e n t s   s e t :   a.   B r i n g   t h e   Co m m e n t .   b.   P r e p r o c e s s i n g:   de l e t i n g   e xt r a   s pa c e s ,   s y m bo l s   a n d   dup l i c a t e   l e t t e r s .   c.   D i v i de   i n t o   w o r ds   (T o ke n s )   a nd  s t o r e   i a n   a rra y .   d.   D e l e t e   t h e   s t o w o r ds .   e.   S a v e   n e w   w o r ds   t ha t   a r e   n o t   i t h e   da t a b a s e   w i t h   a   w e i g h t   e qua l   t o   1 .   f.   O upd a t e   t h e   w e i gh t   o f   t h e   w o r ds   i t h e   d a t a b a s e   by   o n e   i n c r e m e n t .   g.   S o r t   t h e   d a t a b a s e   i a   de s c e n d i n pa t t e rn   b a s e o t h e   w e i gh t .   h.   T a k i n t h e   b e gi nni n o f   t h e   l i s t   t ha t   h a v e   t o w e i gh t ,   a nd  m a n ua l l y   f i l t e r i ng  i t   a n s a v e   i nt o   a   s e l e c t e t y pe   o f   s e n t i m e n t .     2. 3 .   Te s ti n g   T h e   f o l l ow i n a r e   t h e   s t e ps   o f   t e s t i n a n y   c o m m e nt ,   t h e   i n p ut   i s   t h e   c o m m e n t   a nd  t h e   o ut put   i s   e v a l ua t i n g   t h e   c o m m e nt   w h e t h e i t   i s   n e ga t i v e   o r   po s i t i v e   o r   n e ut ra l :   1)   L e t :   P o s i t i v e   =   0   a nd  N e ga t i v e   =   0.   2)   B r i n g   t h e   Co m m e n t .   3)   P r e p r o c e s s i n g:   de l e t i n g   e xt r a   s pa c e s ,   s y m bo l s   a n d   dup l i c a t e   l e t t e r s .   4)   D i v i de   i n t o   w o r ds   (T o ke n s )   a nd  s t o r e   i a n   a rra y .   5)   D e l e t e   t h e   s t o w o r ds .   6)   F o r   e a c w o r i t h e   a rra y :   a.   S e a r c h   i n   t h e   N e ga t i v e   w o r ds   da t a b a s e ,   i f   t h e   w o r e xi s t s ,   i n c r e a s e   N e ga t i v e   by   t h e   w e i gh t   o f   t h e   w o r d.   b.   S e a r c h   i n   t h e   P o s i t i v e   w o r ds   da t a b a s e ,   i f   t h e   w o r e xi s t s :     Ch e c t h e   w o r b e fo r e   i t ,   i f   i t   i s   n e g a t i o i n c r e a s e   N e ga t i v e   by   t h e   w e i gh t   o f   t h e   P o s i t i v e   w o r d.     O t h e r w i s e   i n c r e a s e   po s i t i v e   by   t h e   w e i gh t   o f   t h e   w o r d.   7)   E v a l ua t i ng  t h e   r e s ul t .   If   t h e   r e s ul t   i s   N e ut ra l   (P o s i t i v e   r e s ul t s =   N e ga t i v e   r e s ul t s s h ow   a dv a n c e o pt i o n s   fo r   m a n u a l   c l a s s i f i c a t i o i f   t h e   us e w a nt s .       3.   R ES U LTS   A ND  D IS C U S S I O N     T h e     pr o po s e d   f r a m e w o r w a s   c r e a t e us i n C#  l a ngua ge .   T h e   t e s t   r e s ul t s   o t h e   f r a m e w o r w e r e   s a t i s f a c t o r y ,   F i g u r e   3   s h o w s   t h e   c o m m e n t   t e s t   ( م كم ل س ي ّ يب ر ّ ة ن ي ز ّ ر ا عس ا w h e r e   t h e   r e s ul t   (P o s i t i v e   =   51   a n N e ga t i v e   =   0) ,   t h e   F i g u r e   i l l us t r a t e s   t h e   e xa m pl e   o f   t he   pr e p r o c e s s i n a nd  t e s t   s t e p .   W h e t e s t i ng  a   c o m m e n t   ( د ي ج ّ ر ي غ ّ ز ا هج ل ا i F i g u r e   5   n o t e   t h a t   a l t h o ug t h e re   i s   a   w o r ( د ي ج b ut   t h e   r e s ul t   w a s   (P o s i t i v e   =   0   a n N e ga t i v e   =   9)  b e c a us e   t h e r e   i s   a   n e ga t i v e   w o r ( ر ي غ b e fo r e   i t .   F i gu r e   s h o w s   t h e   c o m m e n t   t e s t   ( ّ ىل ا ّ جا ت ح أ ّ ل ي د ومل ل ّ ر ا ي غ ّ ة عطق 0011 w h e r e   t h e   r e s ul t   (P o s i t i v e   =   a n d   N e ga t i v e   =   0 i s   n e ut ra l   s o   a dv a n c e us e o pt i o n s   ha v e   b e e n   s h o w n .   T h e   c l a s s i f i c a t i o n   us e i n   t h e   a na l y s i s   o f   fe e l i n i s   di v i de i n t o   t w o   t y pe s .   T h e   f i r s t   o n e   i s   t h e   c l a s s i f i c a t i o n   o f   da t a   by   s u b j e c t   t de t e r m i n e   t h e   a c c ura c y   of  da t a   b o t h   i n   t ra i ni n o r   i n   t h e   t e s t i n p ha s e ,   a n d   t h e   s e c o n t y pe   i s   t h e   c l a s s i f i c a t i o n   o f   da t a   by   t h e   a n a l y s i s   of   s e n t i m e nt .   T h e   pe r f o r m a n c e   of   t h e   s y s t e m   h a s   b e e n   a c hi e v e a   h i g h   s pe e i n   i m pl e m e n t a t i o n   a nd  h i g a c c ur a c y   i n   r e s ul t s   by   us i n t h e   f i r s t   t y pe   of  c l a s s i f i c a t i o n.       Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A   f r am e w or k   f or   s e nt i m e n t   an al y s i s   i A r abi c   t e x t   ( A l aa   A bd al qahar   J i had)   1487       F i gu r e   3 A   c o m m e nt   T e s t         F i gu r e   4 E xa m p l e   o f   t h e   p r e p r o c e s s i n a n d   t e s t   s t e p           F i gu r e   5 A   t e s t   o f   a   c o m m e n t       F i gu r e   6 A   c o m m e nt   t e s t   a nd  r e s ul t   i s   n e ut ra l           Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 6 ,   N o .   3 D e c e m be r   2 01 9   :     1 4 8 2   -   1 4 8 9   1488   4.   C O N C LU S I O N     T h i s   pa pe r   de a l s   w i t h   t h e   c o m m e n t s   i n   A r a b i c   a n t h e   m a i di ff i c ul t y   i n   de a l i ng  w i t h   t h i s   l a n gu a ge   i s   t h a t   i t   i s   m o rp h o l o gi c a l l y   r i c h   l a ngua ge ;   t h e   c o m pa n y   r e a c h e s   (e s pe c i a l l y   i f   i t   ha s   a   w e b   s i t e   a nd  s o c i a l   c o n t a c t   s i t e h u nd r e ds   o f   c o m m e nt s   a n m e s s a ge s .   T h e   c om pa n y   c a n   i m p r o v e   t h e   pe r f o r m a n c e   t hr o ug h   t h e   de ve l o pm e n t   o f   s y s t e m s   t o   h e l t h e   c o m pa n y   t o   a n a l y z e   c u s t o m e r   r e qui r e m e nt s   a n d   a na l y z i n t h e   v i e w s   o c us t o m e r s .     U s i n t h e   b a w o r h e l pe t h e   a c c u r a c y   of   t h e   c l a s s i f i c a t i o n .   E na b l e   t h e   us e r   us i ng  a dv a n c e o pt i o n s   w h e t h e   t e s t   r e s ul t   a ppe a r s   ' N e ut ra l '   h e l pe t o   s t re n gt h e n   t h e   da t a b a s e   o f   w o r ds   a n d   a pp r o p r i a t e   w e i ght s ,   a t   t h e   s a m e   t i m e   t h i s   f e a t u r e   i s   o pt i o na l .   E n t e r i ng  t he   l a r ge s t   a m o unt   o f   da t a   i n   t h e   t r a i n i ng  s t a ge   c a i m p r o v e   t h e   pe r f o r m a n c e   a n d   a c h i e v e   h i g a c c u r a c y   r e s ul t s   b ut   l o w e r   i t h e   e xe c ut i o n   t i m e .       R EF ER EN C ES     [ 1]   B a ha s s i ne   S . e t   a l . ,   A r a b i c   t e xt   c l a s s i f i c a t i o us i ng   ne w   s t e m m e r   f o r   f e a t ur e   s e l e c t i o a n de c i s i o t r e e s ,   J our na l   of   E ng i ne e r i ng   Sc i e nc e   an T e c h nol ogy v o l .   12 ,   pp .   1475 - 14 87 ,   20 17.   [ 2]   F r o ud  H . e t   a l . ,   A r a b i c   t e x t   s um m a r i z a t i o ba s e o l a t e nt   s e m a nt i c   a na l y s i s   t o   e nha n c e   a r a bi c   do c um e nt s   c l us t e r i ng ,   ar X i v   p r e pr i nt   ar X i v : 1 302 . 161 2 ,   20 13 .   [ 3]   H .   G .   H a s s a n ,   e t   a l . ,   A   F r a m e w o r f o r   A r a bi c   C o nc e pt - L e v e l   S e n t i m e nt   A na l y s i s   us i ng   S e nt i c Ne t ,   I nt e r n at i ona l   J our nal   o f   E l e c t r i c a l   a nd   C om pu t e r   E ngi ne e r i ng v o l .   8 p p.   40 15,   2018 .   [ 4]   S .   B udi y a nt o e t   a l . ,   D e pr e s s i o a nd  A nxi e t y   D e t e c t i o T hr o ug t he   C l o s e d - l o o M e t ho us i ng   D A S S - 21 ,”   T E L K O M N I K A   T e l e c om m u ni c at i o n,   C om pu t i ng ,   E l e c t r on i c s   and   C ont r ol v o l .   17 ,   201 9.   [ 5]   A .   S .   A bda l ka f o r ,   D e s i g ni ng   O f f l i ne   A r a bi c   H a ndw r i t t e I s o l a t e d   C ha r a c t e r   R e c o g ni t i o S y s t e m   us i ng   A r t i f i c i a l   N e ur a l   N e t w o r k   A ppr o a c h , ”  I nt e r na t i ona l   J ou r na l   of   T e c hn ol o gy v o l .   8 pp .   528 - 538 201 7 .   [ 6]   A .   S .   A bda l ka f o r   a n A .   S a de q ,   A r a bi c   O f f l i n e   H a ndw r i t t e I s o l a t e C h a r a c t e r   R e c o g ni t i o S y s t e m   U s i ng   N e u r a l   N e t w o r k , ”  I n t e r na t i o na l   J our na l   o f   B us i ne s s   a nd  I C T v o l .   2 p p.   41 - 50,   2016 .   [ 7]   A .   S .   A bda l ka f o r ,   e t   a l . ,   P r e di c t i ng   T he   S uc c e s s   R a t e s   o f   S c h o o l s   U s i ng   A r t i f i c i a l   N e ur a l   N e t w o r k , ”  J o ur n al   o f   T he or e t i c al   an A ppl i e I n f or m a t i on   T e c hno l og y v o l .   96,   p p.   63 39 - 6348 ,   2018 .   [ 8]   M o ha m m a A H . e t   a l . ,   A r a bi c   t e x t   c a t e g o r i z a t i o us i ng   s up po r t   v e c t o r   m a c hi ne , ”  N v e   B ay e s   and  ne ur al   ne t w or k .   G ST F   J ou r na l   on   C om pu t i ng   ( J oC ) v o l .   5 ,   2018 .   [ 9]   Al - A nz i   F .   S .   a nd   D .   A buZ e i n a ,   T o w a r a e nh a nc e A r a b i c   t e x t   c l a s s i f i c a t i o us i ng   c o s i ne   s i m i l a r i t y   a nd  L a t e n t   S e m a n t i c   I n de xi ng ,   J o ur n al   o f   K i n Saud  U n i v e r s i t y - C om pu t e r   a nd  I n f or m a t i on  S c i e nc e s v o l .   29,   pp .   189 - 19 5,   2017 .   [ 10]   K .   Al - S a ba h i ,   e t   a l . ,   A E n ha nc e d   L a t e n t   S e m a n t i c   A na l y s i s   A ppr o a c f o r   A r a bi c   D o c um e nt   S um m a r i z a t i o n ,   A r ab i an   J o ur n al   f or   Sc i e nc e   and   E n gi ne e r i ng ,   p p.   1 - 16 ,   2018 .   [ 11]   A l o w a i di   S . e t   a l . ,   S e m a nt i c   S e n t i m e nt   A na l y s i s   o f   A r a bi c   T e x t s , ”  I nt e r n at i on al   J ou r na l   o f   A dv anc e C om put e Sc i e nc e   a nd   A pp l i c at i o ns v o l .   8,   p p.   25 6 - 262 ,   2 017 .   [ 12]   F r o ud  H . e t   a l . A r a b i c   t e x t   s um m a r i z a t i o ba s e o l a t e nt   s e m a nt i c   a na l y s i s   t o   e nha nc e   a r a bi c   do c um e nt s   c l us t e r i ng ,”   ar X i v   p r e pr i nt   ar X i v : 1 302 . 161 2 ,   20 13   [ 13]   B i l a l   G .   A .   a nd   N .   R a s h a ,   S e m a nt i c   A na l y s i s   ba s e d   C us t o m e r   R e v i e w s   F e a t u r e   E xt r a c t i o n ,”   J ou r na l   of   U ni v e r s i t y   of   B aby l o n v o l .   2 5,   pp .   802 - 81 3,   20 17 .   [ 14]   N .   K s h e t   a l . ,   D o c um e nt   r e pr e s e nt a t i o t e c hn i qu e s   a nd  t he i r   e f f e c t   o t he   do c um e nt   C l u s t e r i n g   a nd  C l a s s i f i c a t i o n:   A   R e v i e w ,   I n t e r na t i ona l   J ou r na l   of   A d v anc e d   R e s e ar c h   i C om put e r   Sc i e nc e v ol .   8,   p p.   17 80 - 1784 ,   201 7.   [ 15]   I s m a i l   H . e t   a l . ,   A ut o m a t i c   A r a bi c   T e xt   C a t e g o r i s a t i o n:   A   C o m pr e he ns i v e   C o m pa r a t i v e   S t udy ,   J our na l   of   I nf or m a t i on  Sc i e nc e ,   v o l .   41 ,   pp.   1 14 - 11 2 015 .   [ 16]   F .   L e i l a ,   e t   a l .,   T he m e   C l a s s i f i c a t i o o f   A r a bi c   T e xt :   A   S t a t i s t i c a l   A ppr o a c h , ”  C onf e r e nc e   pape r ,   T e r m i no l ogy   and   K now l e dge   E ngi ne e r i n g,   B e r l i n ,   G e r m an y ,   p p.   10 ,   201 4.   [ 17]   M.   F i kr i   a nd  R .   A .   S a r no ,   “C o m pa r a t i v e   s t udy   of   s e nt i m e nt   a na l y s i s   us i ng   S V M   a nd  S e nt i W o r dN e t ,   I ndo ne s i an   J our nal   o f   E l e c t r i c a l   E ngi ne e r i ng   and   C om p ut e r   Sc i e nc e v o l .   13 ,   p p.   902 - 90 9,   20 19.   [ 18]   A .   S .   A bda l ka f o r ,   e t   a l . ,   A   N o v e l   D a t a ba s e   f o r   A r a bi c   H a n dw r i t t e R e c o g ni t i o ( N D A H R )   S y s t e m ,   2 s t   I nt e r n at i on al   C on f e r e nc e   on   C om pu t e r   A pp l i c at i on s   &   I nf o r m a t i o Se c ur i t y   ( I C C A I S) ,   2019 .   [ 19]   H .   K .   A l da y e l   a nd  A .   M .   A z m i ,   A r a b i c   t w e e t s   s e n t i m e n t   a n a l y s i s a   hy br i s c he m e ,   J o ur na l   o f   I nf or m a t i on   Sc i e nc e ,   v o l .   4 2,   pp .   782 - 79 7,   20 16 .   [ 20]   M i l o s   R .   a nd   M i r j a na   I . ,   T e x t   M i n i ng :   A ppr o a c he s   A nd  A ppl i c a t i o ns , ”  N ov i   Sad  J .   M a t h v o l .   38 ,   pp .   227 - 23 4 2008 .   [ 21]   A .   S .   A bda l k a f o r ,   S ur v e y   f o r   D a t a b a s e s   o A r a bi c   O f f - l i ne   H a ndw r i t t e n   C ha r a c t e r s   R e c o g ni t i o S y s t e m ,”   1 s t   I nt e r n at i on al   C on f e r e nc e   on   C om pu t e r   A pp l i c at i on s   &   I nf o r m a t i o Se c ur i t y   ( I C C A I S) ,   I E E E ,   pp .   1 - 6 ,   201 8.   [ 22]   M .   A .   A hm e d ,   e t   a l . ,   T he   c l a s s i f i c a t i o o f   t he   m o de r a r a b i c   po e t r y   us i ng   m a c hi ne   l e a r n i ng ,   T E L K O M N I K A   T e l e c om m uni c at i on   C om p ut i ng   E l e c t r oni c s   an C o nt r ol v o l .   1 7,   pp .   2667 - 26 74,   2 019 .   [ 23]   A.   M.   F .   A l   S bo u ,   A   S u r v e y   o f   A r a bi c   T e x t   C l a s s i f i c a t i o M o de l s ,”   I n t e r na t i o nal   J our n al   o f   E l e c t r i c al   an d   C om put e r   E ng i ne e r i ng   ( I J E C E ) v o l .   8,   p p.   43 52 - 4355 ,   201 8.         Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A   f r am e w or k   f or   s e nt i m e n t   an al y s i s   i A r abi c   t e x t   ( A l aa   A bd al qahar   J i had)   1489   B I O G R A P H I ES   O F   A U T H O R S           A l a a   A bda l qa ha r   J i ha d   w a s   bo r i A nba r - I r a i 1985.   H e   r e c e i v e hi s   B . S c .   f r o m   F a c ul t y   o f   C o m put e r   S c i e nc e   a t   A nba r   U ni v e r s i t y ,   I r a i 2009 .   T he   M S c .   de g r e e   F a c ul t y   o f   C om put e r   S c i e nc e   a t   A nba r   U ni v e r s i t y ,   I r a 2012.   H i s   r e s e a r c i n t e r e s t s   a r e ,   D a t a   W a r e ho us e ,   D a t a   M i n i ng ,   A r t i f i c i a l   I nt e l l i g e nt ,   M a c hi ne   L e a r n i ng   a nd  N a t ur a l   L a ng ua g e   P r o c e s s i ng .     A hm e S ubh i   A bda l ka f o r   w a s   bo r n   i n   A nba r - I r a i 1 988 .   H e   r e c e i v e hi s   B . S c .   f r o m   F a c u l t y   o f   C o m put e r   S c i e nc e   a t   A nba r   U ni v e r s i t y ,   I r a i 20 10.   T he   M S c .   de g r e e   f r o m   C o m put e r   S c i e nc e   D e pa r t m e n t   i M i dd l e   E a s t   U n i v e r s i t y ,   J o r da n   i 20 16.   H i s   r e s e a r c i nt e r e s t s   a r e ,   I m a g e   P r o c e s s i ng ,   P a t t e r C l a s s i f i c a t i o n,   A r t i f i c i a l   I nt e l l i g e nt ,   N e u r a l   N e t w o r k,   C l o ud  C o m put i ng ,   M a c hi n e   L e a r n i ng   a n D a t a   M i ni ng .     Evaluation Warning : The document was created with Spire.PDF for Python.