I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   1 8 ,   N o .   1 A p r i l   20 20 ,   p p.   544 ~ 548   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 1 8 .i 1 . pp 544 - 548       544       Jou r n al   h o m e pa ge ht t p: / / i j e e c s . i a e s c or e . c om   Id e n t i f i c a t i o n   o f   l a n g u a g e   i n   a   c r o ss   l i n g u i st i c   e n v i r o n m e n t       M e r i n   Th o m as 1 L ath a   C .   A 2 ,   A n to n P u th u s s e r y 3   1 R e s e a r c h   S c ho l a r ,   R e g i o na l   R e s e a r c C e nt e r ,   V i s v e s v a r a y a   T e c hno l og i c a l   U n i v e r s i t y ,   I ndi a   2 H e a o f   t h e   D e pa r t m e nt   ( C S E ) ,   A M C   E ng i ne e r i ng   C o l l e g e ,   V i s v e s v a r a y a   T e c hno l og i c a l   U n i v e r s i t y ,   I ndi a   3 A s s i s t a n t   P r o f e s s o r ,   D e pa r t m e nt   o f   S c i e nc e   a nd   H um a n i t i e s ,   C H R I S T   ( D e e m e d   t o   be   U n i v e r s i t y ) ,   I ndi a       A r ti c l e   I n fo     A B S TR A C T   Ar t i c l e   h i s t or y :   R e c e i v e d   J ul   3 0,   20 19   R e v i s e S e pt   4 ,   2 019   A c c e pt e O c t   1 2 ,   2 01 9       W o r l ha s   be c o m e   v e r y   s m a l l   due   t o   s o f t w a r e   i n t e r na t i o na t i o na l i s m .   A ppl i c a t i o ns   o f   m a c hi ne   t r a ns l a t i o ns   a r e   i nc r e a s i ng   da y   b y   da y .   U s i n g   m ul t i p l e   l a ng ua g e s   i n   t he   s o c i a l   m e d i a   t e x t   i s   a   de v e l o pi ng   t r e nd .   A v a i l a bi l i t y   of   f o nt s   i t h e   na t i v e   l a ng ua g e   e nh a nc e d   t h e   us a g e   o f   na t i v e   t e x t   i i nt e r n e t   c om m uni c a t i o ns .   U s a g e   o f   t r a n s l i t e r a t i o ns   o f   l a ng ua g e   h a s   b e c o m e   qui t e   c om m o n.   I I ndi a n   s c e na r i o   c ur r e nt   g e ne r a t i o ns   a r e   f a m i l i a r   t o   t a l k   i n   na t i v e   l a ng ua g e   but   no t   t o   r e a d   a n w r i t e   i n   t he   na t i v e   l a ng ua g e ,   he nc e   t h e y   s t a r t e d   us i ng   E ng l i s h   r e pr e s e nt a t i o o f   na t i v e   l a ng ua g e   i t e xt u a l   m e s s a g e s .   T h i s   pa pe r   d e s c r i be s   t h e   i de nt i f i c a t i o o f   t he   t r a n s l i t e r a t e t e x t   i c r o s s   l i ng ua l   e nv i r o nm e nt .   I n   t h i s   pa pe r   a   N e ur a l   ne t w o r k   m o de l   i d e n t i f i e s   t h e   pr o m i ne n t   l a ng ua g e   i n   t h e   t e xt   a n h e nc e   t he   s a m e   c a b e   u s e d   t o   i d e nt i f y   t he   m e a ni ng   o f   t he   t e xt   i t he   c o nc e r ne l a ng ua g e .   T h e   m o de l   i s   b a s e upo R e c ur r e nt   N e u r a l   N e t w o r ks   t ha t   f o und  t o   be   t he   m o s t   e f f i c i e nt   i m a c h i ne   t r a ns l a t i o ns .   L a ng ua g e   i de n t i f i c a t i o c a n   s e r v e   a s   a   ba s e   f o r   m a ny   a pp l i c a t i o ns   i n   m u l t i   l i ng ui s t i c   e nv i r o nm e nt .   C ur r e n t l y   t he   S o u t I ndi a L a ng ua g e s   M a l a y a l a m ,   T a m i l   a r e   i de n t i f i e d   f r o m   g i v e n   t e xt .   A a l g o r i t hm i c   a p pr o a c o f   S t o w o r ds - ba s e d   m o de l   i s   de p i c t e d   i t h i s   pa pe r .   M o de l   c a b e   a l s o   e nh a nc e t o   a ddr e s s   a l l   t he   I ndi a L a ng ua g e s   t ha t   a r e   i n   us e .   Ke y w or d s :   Cr o s s   l i n gui s t i c   M ul t i l i ngui s t i c     S e n t i m e n t a l   a na l y s i s   C opy r i gh t   ©   2020   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   M e r i T h o m a s ,   R e s e a r c S c h o l a r ,   R e gi o n a l   R e s e a r c Ce n t e r ,   V i s v e s v a r a y a   T e c hn o l o gi c a l   U n i v e r s i t y ,   I n d i a .   E m a i l :   m e r i n. j i s s o @ gm a i l . c o m       1.   I N TR O D U C TI O N     N a t u ra l   l a n gu a ge   p r o c e s s i n ha s   b e e n   a n   i n t e r e s t i n g   a r e a   o f   r e s e a r c i m a c h i n e   l e a rni n g.   A r t i f i c i a l   i n t e l l i ge n c e   pr o v i de t o   t h e   m a c h i n e s   e na b l e s   t h e m   t o   c o pe   u w i t h   t h e   n a t i v e   l a n gu a ge s   us e by   t h e   hum a n s .   Co m pl e xi t y   of   t h e   na t i v e   l a ngua ge s   i s   o n e   o f   t h e   m o s t   c ha l l e ngi n g   p r o b l e m s   t o   de a l   w i t t h e   N a t u r a l   L a ngua g pr o c e s s i n g.   T o   de s i g i nt e l l i ge nt   m a c h i n e s   m a c h i n e   l e a rn i ng  t e c hn i q ue   n e ura l   n e t w o r c a n   b e   us e [1].   U n l i ke   c o m put e r   l a n gu a ge   ke y w o r ds ,   m e a ni n o f   t h e   ke y w o r c ha n ge s   w i t h   s e nt e n c e s   i n   na t i v e   l a n gu a ge s   w h e r e   a m b i gui t y   i s   a t   t h e   pe a k .   S e m a n t i c   a na l y s i s   c a b e   do n e   w i t h   t h e   h e l p   o f   c o r pus   a s s o c i a t e w i t t h e   l a ngu a ge .   In d i a   i s   a   m u l t i l i ngui s t i c   Co un t r y   w h e r e   i e a c s t a t e   s pe a ks   di f fe r e nt   l a ngua ge .   L a ngu a ge   b o un da r y   a n d   c ul t u r a l   di f f e r e n c e s   m a ke   i t s   b e a ut y   i d i v e r s i t y .   W i t 2 m a j o l a n g ua ge s ,   w ri t t e i 13   d i f f e r e n t   s c ri pt s ,   w i t o v e r   72 0   di a l e c t s ,   I ndi a   s t a nds   t o   b e   o n e   o f   t h e   l a rge s t   m ul t i l i ngui s t i c   c o unt r i e s   i A s i a .   M a l a y a l a m ,   T a m i l   a n T e l ugu   a r e   t h e   p r o m i n e n t   l a n gu a ge s   i S o ut h   I ndi a .   M a l a y a l a m   i s   na t i v e   l a n gu a ge   o f   t h e   s t a t e   K e ra l a   s po ke n   by   38  m i l l i o n   pe o pl e ,   K a nna d a ,   t h e   na t i v e   l a n gu a ge   o f   K a rna t a k a   a n d   T a m i l ,   na t i v e   l a n gu a ge   o f   T a m i l   N a du   a n d   a l s o   o ff i c i a l   l a ngua ge   o f   t w o   o t h e c o un t ri e s   S i n g a po r e   a nd  S ri   L a n k a .   T a m i l   i s   s po ke by   a   t o t a l   70  m i l l i o n   pe o pl e .   A p a r t   f r o m   t h e s e   l a n gu a ge s ,   E n g l i s h a s   b e c o m e   t h e   c o m m o n   l a ngua ge   s po ke n   i n   I ndi a .   In  t h e   e a rl i e r   s t a ge s   o f   c o m put e r s   o n l y   E n gl i s h   l a ngua ge   w e re   w i de l y   us e i n   t h e   do c um e n t s ,   e m a i l s   a n d   m e s s a ge s .   T o   m a ke   c o m put e a da pt a b l e   t o   a l l   s e c t o r s   of   pe o pl e ,   e v e n   s o m e bo d y   w h o   do e s   n o t   k n o w   E n gl i s h ,   o nl y   w a y   o ut   w a s   t o   m a ke   c o m put e r   e na b l e w i t h   na t i v e   l a n gu a ge s .   I nt r o duc t i o o f   fo n t s   i n a t i v e   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Ide nt i f i c a t i o o f   l angu age   i n   a   c r os s   l i n gui s t i c   e nv i r onm e n t   ( Me r i n   T hom as )   545   l a n gu a ge s   e n a b l e d   i t s   us a ge   w i de l y .   U s a ge   of   Co m put e r s   a n d   M o b i l e   A pps   b e c a m e   w i de s pr e a d.   M a c hi n e s   T r a n s l a t i o n s   pl a y e a   v i t a l   r o l e   i n   c o n v e r t i n a n y   l a n gu a ge   t o   a n y   o t h e l a n gu a ge .   T ra n s l a t i o n s   a r e   do n e   w i t t h e   h e l o f   di c t i o n a ri e s   o r   w o r d n e t   o f   l a n gua ge ,   e xa c t   w o r by   w o r t ra n s l a t i o n s   m a y   e n i c h a n g i n t h e   e n t i r e   m e a n i ng  o f   t h e   c o n t e xt .     i s   t h e   M a l a y a l a m   w o r t ha t   r e p r e s e n t s   a   k i n d   o f   b r e a kf a s t   i S o ut h   I n di a ,   m a n y   o f   t h e   t r a n s l a t o r s   a v a i l a b l e   t o   p r o v i de   t ra n s l a t i o t o   E ngl i s h   i n t e r p re t   t h e   w o r a s   s ub h e a d i n g   o up ri g ht   f l o ur.   T h e   m a j o C h a l l e n ge   de a l i ng  w i t t h e   na t i v e   l a n gu a ge   i s   t h e   de gr e e   o f   a m b i gu i t y   t ha t   a dd   o t o   e v e r y   c o n t e xt   m a k i n t h e   a c c ur a c y   t o   f a l l   b e l ow   c o n s i de r i ng  w o r by   w o r t r a n s l a t i o n s .   D i f fe r e nt   a r c hi t e c t u r e s   f o r   pe r f o r m i ng  t r a n s l a t i o t a s i s   R ul e   B a s e M a c h i n e   T ra n s l a t i o n   a nd  S t a t i s t i c a l   M a c h i n e   t ra n s l a t i o n   [ 2].     Cu rr e nt   ge n e r a t i o n   s a w   t h e   n e e o f   t ra n s l i t e r a t i o t h a t r a n s l a t i o n.   P e o pl e   w e r e   a c c us t o m e t o   E ngl i s W r i t i n g   a nd  R e a di n g   t ha n   t h e i r   na t i v e   l a n gu a ge ,   w h e r e   i n   E n g l i s w o r ds   t o o m o s t   i t s   pl a c e .   P r o m i n e n c e   of  E n gl i s h   w o r ds   i n   o ur  da y   t o   da y   l i f e   i s   s o   h i g h   t ha t   i t   b e c a m e   c o n v e n i e n t   i n   s ub s t i t ut i n t h e   w o r ds   i n   na t i v e   l a n gu a g e .   B ut   pe o pl e   w h o   w e r e   w e l l   v e r s e i n   s pe a ki n na t i v e   l a n gu a ge   b ut   n o t   t h a t   w e l l   v e r s e i n   w ri t i n o r   r e a d i n g   s t a rt e us i n g   n a t i v e   l a n gu a ge   t y pe i n   E n g l i s w h i c i s   c a l l e a s   T r a n s l i t e ra t i o n s   f o r   e a s e   o c o m m uni c a t i o n .   F a c t   t h a t   h u m a n s   a r e   m o r e   c o m fo r t a b l e   i t he i r   N a t u ra l   L a n gu a ge   w h e i t   c o m e s   t o   e xpr e s s i o n   of   w o r ds   ha s   i t s   a ppl i c a t i o i t hi s   c o n t e xt .   T h e r e   a r e   b a s i c a l l y   t hr e e   a pp r o a c h e s   f o r   t r a n s l i t e ra t i o n .   T h e y   a r e   b a s e o n   g ra p h e m e ,   P h o n e m e   a n d   H y b r i A p p r o a c h e s .   I n   g r a ph e m e   a pp r o a c h ,   i t   di r e c t l y   t r a n s f o r m s   g r a p h e m e   f r o m   s o ur c e   t o   t a rge t .   I P h o n e m e   m o de l   t h e   ke y   i s   pr o nu n c i a t i o n   o f   s o ur c e   l a n gu a ge .   H y b r i m o de l   us e s   bo t h   t h e   g r a p h e m e   a n p h o n e m e   m o de l   i n f o r m a t i o n.   T r a n s l i t e ra t i o c a b e   da t e d   b a c t o   1 994   w h e r e   m a j o r   w o r k   w a s   i n   t h e   a r e a   o f   A r a b i c - En gl i s [3 ].   ge n e ra t i v e   m o de l   f o r   b a c t ra n s l i t e r a t i o f r o m   E ngl i s t o   J a pa n e s e   w a s   p r o po s e i 1997 [4]. M a t h e m a t i c a l   a pp r o xi m a t i o t e c hn i q ue   us i n g   s t a t i s t i c a l   m o de l   w a s   us e d   i E n gl i s K o r e a T ra n s l i t e ra t i o i t h e   y e a r   2000   [5].   A a ut o m a t i c   c h a ra c t e r   a l i g n m e nt   m e t h o f o r   E n g l i s w o r a nd  K o r e a n   t r a n s l i t e ra t i o n   i s   d i s c us s e i [6] .   In  y e a 2002 ,   a   h y b r i m o de l   [ 7]   w a s   b ui l t   o p h o n e t i c   a n d   s pe l l i n g   m a pp i n gs   us i ng   F i ni t e   s t a t e   m a c h i n e s .   T r a n s l i t e ra t i o n   o f   A ra b i c   n a m e s   i t o   E n gl i s h   w a s   do n e   by   t hi s   m e t h o d.   I 20 04,   a   n e w   f r a m e w o r a l l o w i n g   di r e c t   o r t h o g r a p h i c   m a p pi n g   (D O M b e t w e e n   t w o   di ff e r e n t   l a n gu a ge s ,   t hr o ug a   j o i n t   s o ur c e - c h a nn e l   m o de l ,   a l s o   c a l l e n - g r a m   t r a n s l i t e ra t i o n   m o de l   (T M w a s   i nt r o du c e [8].   It   ge n e ra t e s   p r o b a b i l i s t i c   o rt h o gra p h i c   t r a n s f o r m a t i o n   r u l e s   us i n a   d a t a   d ri v e n   a pp r o a c h.   P h o n e m i c   i n t e r p r e t a t i o n,   l e v e l   i s   s ki ppe d ,   s o   t h a t   t h e   e rr o r   ra t e   i n   t r a n s l i t e ra t i o n   i s   r e duc e s i g ni f i c a n t l y .     S a m p l e   T ra n s l i t e r a t i o n :       w i l l   b e   t y pe i E n gl i s h   a s   U ppum a v u.     Cr o s s   L i n gu i s t i c   i s   t h e   us a ge   o f   m u l t i pl e   l a ngua ge s   i t h e   s a m e   t e xt .   T h i s   e f fe c t   i s   due   t o   t h e   i n f l ue n c e   of   o t h e l a n gu a ge s   e s pe c i a l l y   E n g l i s i t h e i na t i v e   l a n gu a ge .   C r o s s   l i n gui s t i c   a n T ra n s l i t e ra t i o n s   a r e   t h e   t w i s s ue s   t ha t   ha v e   t o   b e   a dd r e s s e i t h e   a na l y s i s   o f   S oc i a l   m e di a   t e xt .   W h e i t   c o m e s   t o   da t a   a n a l y s i s   t ha l a n gu a ge   b o un d a r i e s   m e a ni n g   o f   t h e   d a t a   m a t t e r s .   I a pp l i c a t i o l i ke   a na l y s i n t h e   r e v i e w   of   t h e   p r o duc t s ,   o n   m i ni n t h e   w e b ,   w e   m a y   h a v e   t o   a n a l y z e   r e v i e w s   i n   d i f fe r e nt   l a n gu a ge s ,   t ra n s l i t e r a t i o n s   a b o ut   t h e   s a m e   p r o duc t   e t c .   S o   i t   i s   i m po rt a nt   t o   i de n t i fy   t o   w h i c h   l a n g ua ge   t h e   t e xt   b e l o n gs   t o   i o r de t o   u n de r s t a n m e a ni n i n   t h e   t e xt .   Ide nt i f i c a t i o n   o f   t h e   l a ngua ge   i n   t h e   I n d i a s c e n a ri o   i s   o n e   o f   t h e   t o ug h e s t   j o bs   w h e n   c o n c e rn e w i t h   n u m b e r   o f   e xi s t i ng  l a n g ua ge s .   U s a ge   o f   t ra n s l i t e ra t i o i t h e   s o c i a l   m e di a   t e xt   ha d   m a de   t h e   p r o b l e m     e ve n   w o r s e .       2.   A LG O R I T H M   F O R   LA N G U A G I D EN TI F I C A T I O N   I N   C R O S S   LI N G U A L   A N D   TR A N S LI TER A TI O N   T EX T   In  t hi s   pa pe w e   de s c r i b e   a l go ri t hm i c   s t o w o r ds   b a s e m o de l   fo r   t h e   i de nt i f i c a t i o o f   pa r t i c ul a l a n gu a ge   i a   t e x t   o f   c o n v e r s a t i o n .   S t o p   w o r ds   a r e   b a s i c a l l y   t h e   m o s t   c o m m o w o r ds   us e i n s i de   a   l a n gu a ge .   P r o c ur i ng   o f   t h e   a pp r o pri a t e   da t a   s e t ,   i s   a c h a l l e n gi ng  t a s k .   S o c i a l   m e di a   t e xt   c a n   b e   e i t h e r   t r a n s l i t e ra t e o r   i t   c a b e   m i xt u r e   o f   m u l t i pl e   l a ngua ge s .   T h e   a l go r i t hm   i de n t i f i e s   t h e   l a n gu a ge   w i t r e s pe c t   t o   t hr e e   l a ngua ge s   us e i n s i de   t h e   t e xt ,   M a l a y a l a m ,   T a m i l   a n d   E ngl i s h. S e v e r a l   m a c h i n e   l e a rni n g   a l go ri t hm s   a r e   us e d   f o r   t h e   c a t e go r i z a t i o o f   l a ngua ge s   i n   a   m ul t i l i n g ui s t i c   a pp r o a c h. Ca t e go r y   of   t h e   c l a s s i f i c a t i o a l go r i t hm   ra n ge s   f r o m   t h e   s i m pl e   n a i v e   b a y e s i a a pp r o a c h   t o   c o m pl e de e l e a rni n g   a l go ri t hm s . H y b r i d   m e t h o do l o g y   i s   a l s o   f o l l ow e d   t o   b r i n o ut   b e s t   f e a t u r e s   a m o n s upe r v i s e a l go r i t h m   a n d   u n s upe r v i s e a l go r i t h m . S t o w o r b a s e m o de l   i s   s i m pl e   m e t h o t h a t   d i v i de s   t h e   t e xt   i n   t o   l a n gu a ge   b a gs   b a s e o t h e   s t o w o r ds .     A l go r i t h m   f o r   S t o w o r d - b a s e d   L a n gu a ge   D e t e c t i o n   M o de l     Evaluation Warning : The document was created with Spire.PDF for Python.
            IS S N :   2 502 - 47 52   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 8 ,   N o .   1 A p r i l   20 20  :   544   -   548   546   1. R e m ov e   t h e   c o n t e nt   E   f r o m   I ,   W h e r e   i s   t h e   i nput   t e xt   a n E = { ; , : , < , < , > , . , ? , / , { , } , { , [, ] , | , \ , ! , @ , # , $ , %, ^ , & , *, (, ) , _ , - , , = , + , e m o t i o n a l   i c o n s }     2. D i v i de   t h e   s e nt e n c e   S   i n   t o   s e t   W ,   w h e r e   W   i s   s e t   o f   uni que   w o r ds   i S     3. I n v e r t   t h e   c a s e   o f   W   t o   fo r m   s e t   w ,   w h e r e   w     l o w e r c a s e (W )     4.   F o e a c h   w e l e m e n t   o f   w,   s i   e l e m e nt   o f   S ,   w h e r e   S   i s   t h e   s e t   o f   t r a n s l i t e ra t e d   s t o pw o r ds   o f   a l l   l a n gu a ge s     fo r   i =   t o   n   s t r c m (w i S i =   k i ,   k i s   t h e   m a t c f o r   e a c h   l a ngua ge   L i .     4.   F i n d   K =   k i   5.   If   K =   c o un t   (Z i ),   Z i s   t h e   c o unt   o f   m a t c h e d   s t o pw o r ds   o f   l a n gu a ge   L i     6.   F i n d   M = m a x   (K i )     7. L a n gu a ge   L   i s   i de nt i f i e a s   t h e   o n e   w i t l a rge s t   M   v a l ue .       3.   D A TA   S ET   T r a n s l i t e ra t e d   t e xt   o f   s t o w o r ds   o f   l a ngua ge s   T a m i l ,   M a l a y a l a m ,   E ngl i s w e r e   c o l l e c t e d.   S a m pl e   of  m o r e   t h a 1 000   s t o w o r ds   i n   e a c l a n gu a ge s   w e r e   us e d.   T ra n s l i t e r a t i o o f   s t o w o r ds   a r e   us e t o   t r a i t h e   m o de l .   C r o s s   l i n gui s t i c   i n pu t   t e xt   w a s   c o l l e c t e f r o m   T w i t t e r,   F a c e boo a nd  W ha t s a p p.       T a b l e   1 .   S a m p l e   s t o w o r s a m pl e s   o f   E n gl i s h ,   T a m i l   a n M a l a y a l a m         4.   EX P ER I M EN TA R ES U L TS   P r o gra m   w a s   e xe c ut e f o r   b a s i c a l l y   t w o   ki n ds   o f   i n pu t .   O n e   i nput   w i t pu r e   M a l a y a l a m   a n d   T a m i l   t e xt   w r i t t e n   i n   E ngl i s h   o r   c a n   b e   c a l l e a s   t r a n s l i t e ra t e t e xt   o f   E n g l i s h   a n T a m i l .   O t h e r   o n e   w i t c o m b i n a t i o of   t w o   l a n gu a ge s .   O ut pu t   w a s   c o m pa r e d   w i t h   a c t ua l   r e s ul t s   t o   r e c o r t h e   pe r f o r m a n c e   i nde x.     Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Ide nt i f i c a t i o o f   l angu age   i n   a   c r os s   l i n gui s t i c   e nv i r onm e n t   ( Me r i n   T hom as )   547           F i gu r e   1 .   T r a n s l i t e ra t e i n pu t   t e xt   o f   pu r e   M a l a y a l a m   F i gu r e   2 .   T r a n s l i t e ra t e i n pu t   t e xt   o f   pu r e   T a m i l               F i gu r e   3 .   T r a n s l i t e ra t e i n pu t   t e xt   w i t E n gl i s h   w i t T a m i l   F i gu r e   4 .   T r a n s l i t e ra t e i n pu t   t e xt   w i t E n gl i s h   m i xe w i t M a l a y a l a m       5.   C O N C LU S I O N   P e r f o r m a n c e   o f   t h e   a l go ri t hm   i s   s a t i s f a c t o r y   s i n c e   80%   o f   a c c ur a t e   r e s u l t s   p r e di c t e p r o v e c o r r e c t .   P e r f o r m a n c e   o f   t h e   a l go ri t hm   de pe n ds   o n   e xt e n s i v e   l i s t   o f   s t op  w o r ds .   I n   Co m b i na t i o na l   s e n t e n c e s   c o rr e c t n e s s   pr o v e t o   be   t h e   l e a s t   s i n c e   l a n g ua ge   de t e c t i o n   i s   pu r e l y   b a s e o n   w h e t h e r   w o r i s   p r e s e nt   i s t o w o r l i s t   o r   n o t .   W i t h   t h e   l i s t   o f   a ppr o p r a i a t e   s t o ps   w o r ds   t hi s   w o r c a b e   e xt e n de t o   o t h e r   na t i v e   l a ngua ge s   i n   I n di a .       R EF ER EN C ES   [ 1]   M i s hr a ,   C ha ndr a ha s ,   a nd   D .   L .   G up t a .   " D e e p   M a c hi ne   L e a r n i ng   a n N e u r a l   N e t w o r ks :   A O v e r v i e w . " I nt e r na t i ona l   J our nal   o f   A r t i f i c i a l   I n t e l l i ge nc e   (IJ - A I ) ,   6 . ( 20 17) :   66 .     [ 2]   A l quds i ,   A r w a ,   N a z l i a   O m a r ,   a nd   R a bha   W .   I br a h i m .   " R u l e   B a s e a nd   E xpe c t a t i o M a xi m i z a t i o n   a l g o r i t hm   f o r   A r a bi c - E ng l i s h   H y br i M a c hi n e   T r a ns l a t i o n. "   I n t e r na t i ona l   J ou r na l   of   A r t i f i c i a l   I n t e l l i ge nc e   ( I J - A I )   5 . ( 20 16) .     [ 3]   A r ba bi ,   M . ,   F i s c ht ha l ,   S .   M . ,   C h e ng ,   V .   C . ,   A nd  B a r t ,   E .   A l g o r i t hm s   f o r   A r a bi c   N a m e   T r a n s l i t e r a t i o n” .   I B M   J o ur n al   of   R e s e ar c h   and   D e v e l opm e nt ,   38 ,   2 ,   183 ,   199 4.     [ 4]   K ni g ht ,   K e v i n   a nd  G r a e hl ,   J o na t ha n .   M ac h i ne   T r an s l i t e r a t i on .   I P r o c e e di ng s   o f   t he   35 t h   A nnua l   M e e t i ng   o f   t he   A s s oc i a t i o n   f o r   C o m put a t i o na l   L i ng ui s t i c s .   19 97 ,   p p.   12 8 - 135 .     [ 5]   J ung ,   S .   Y . ,   H o ng ,   S . ,   &   P a e k,   E.   E ng l i s t o   K o r e an  t r an s l i t e r at i on   m ode l   o f   e x t e nde d   m ar k ov   w i ndow .   I P r o c e e di ng s   o f   t he   18 t h   c o nf e r e nc e   o C o m put a t i o na l   l i ng ui s t i c s ,   2 000,   p p.   38 3 - 389.     [ 6]   K a ng ,   B .   J . ,   &   C ho i ,   K .   S .   A u t om a t i c   t r an s l i t e r a t i on   an bac k - t r ans l i t e r a t i on   by   de c i s i on   t r e e   l e ar n i ng .   I n   P r o c e e di ng s   o f   t he   2nd   I nt e r n a t i o na l   C o nf e r e nc e   o L a ng ua g e   R e s o ur c e s   a nd   E v a l ua t i o n, 2 000 ,   pp .   1 135 141 1.     [ 7]   Y .   A l - O na i z a a nd  K .   K ni g ht , " M ac h i ne   T r ans l i t e r a t i o o f   N am e s   i A r a bi c   T e x t " ,   P r o c .   o f   A C L   W o r ks ho o n   C o m put a t i o na l   A ppr o a c he s   t o   S e m i t i c   L a ng ua g e s ,   200 2.     [ 8]   J o ng - H oo O K e y - S un  C ho i   M a c hi ne   L e a r ni ng   B a s e d   E ng l i s h - to - K o r e a T r a ns l i t e r a t i o us i ng   G r a p he m e   a n P ho ne m e   i nf o r m a t i o n”   I e i c e   T r ans . I nf . &   Sy s t . ,   V O L . E 88 - D ,   N O . 7 ,   j ul y b 2005 ,   p p   1737 - 17 48.     [ 9]   A l i ,   A a s i m ,   S ha h i S i d di q ,   a nd   M uha m m a d   K a m r a M a l i k .   " D e v e l o pm e nt   o f   pa r a l l e l   c o r pus   a nd   e ng l i s h   t o   u r du   s t a t i s t i c a l   m a c hi ne   t r a n s l a t i o n. "   I n t .   J .   of   E n gi ne e r i n &   T e c hno l og y   I J E T - I J E N S   1 ( 20 10) :   31 - 33 .     Evaluation Warning : The document was created with Spire.PDF for Python.
            IS S N :   2 502 - 47 52   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 8 ,   N o .   1 A p r i l   20 20  :   544   -   548   548   [ 10]   D E E P ,   K a m a l ;   K U M A R ,   A j i t ;   G O Y A L ,   V i s h a l .   D e v e l o pm e n t   o f   P un j a b i - E ng l i s h   ( P u nE ng )   P a r a l l e l   C o r p us   f o r   M a c hi n e   T r a ns l a t i o n   S y s t e m .   I nt e r n at i on al   J our nal   o f   E ng i ne e r i n &   T e c hno l og y ,   [ S . l . ] ,   v .   7,   n .   2 ,   pp .   690 - 693 ,   m a y   2018 .   I S S N   222 7 - 524X .     [ 11]   D u,   J i a l i ,   P i ng f a ng   Y u,   a nd   M i ng l i L i .   " M a c hi n e   L e a r ni ng   f r o m   G a r d e P a t S e n t e nc e s :   T he   A ppl i c a t i o o f   C o m put a t i o na l   L i ng ui s t i c s . "   I n t e r na t i o nal   J o ur na l   of   E m e r gi ng  T e c h no l og i e s   i n   L e ar n i ng   ( i J E T ) ,   9. 6     ( 201 4) :   58 - 62.     [ 12]   P r a b hu   P a l a n i s a m y ,   V i n e e t   Y a da v   a n d   H a r s ha   E l c hur i ,   ( 2 013 ) .   Se r e ndi o   S i m pl e   and   P r a c t i c a l   L e x i c on   B as e appr o ac h   t Se nt i m e nt   an al y s i s ,   V o l um e   2:   S e v e nt h   I nt e r na t i o na l   W o r ks ho o S e m a n t i c   E v a l ua t i o n,   A t l a n t a ,   G e o r g i a ,   pa g e s   54 3 - 548.     [ 13]   I . H e m a l a t h a ,   D r . G .   P   S a r a dh i   V a r m a ,   D r . A .   G o v a r dha n   ( 2 013 ) ,   S e nt i m e n t   a na l y s i s   t o o l   us i ng   m a c hi ne   l e a r n i ng   a l g o r i t hm ,   v o l um e   2 ,   I s s ue   2 ,   I n t e r na t i ona l   j ou r na l   of   e m e r gi ng   T r e nds   an T e c h nol ogy   i C om pu t e r   [ 14]   P e t e r   D .   T ur ne y ,   ( 2002 ) ,   T hum bs   up   and   t hum b s   dow n?   Se m ant i c   O r i e nt a t i on   A p pl i e t o   U n s upe r v i s e d   C l as s i f i c a t i o n ,   P r o c e e di ng s   o f   t he   40 t A nnua l   M e e t i ng   o f   t he   A s s o c i a t i o f o r   C o m put a t i o na l   L i ng ui s t i c s ,   P hi l a d e l p hi a ,   P e nns y l v a ni a ,   4 1 7 - 424 .     [ 15]   B o   P a ng ,   L i l l i a n   L e e ,   a nd   S h i v a kum a r   V a i t hy a na t ha n.   2002 .   T hu m bs   up? :   s e nt i m e nt   c l as s i f i c a t i on   us i n m ac h i ne   l e ar ni ng  t e c hn i que s .   I P r o c e e di ng s   o f   t h e   A C L - 02  c o nf e r e nc e   o E m p i r i c a l   m e t ho ds   i na t ur a l   l a ng ua g e   pr o c e s s i ng - V o l um e   10 ,   pa g e s   7 9 - 86.     [ 16]   A m o l i k,   A ks h a y ,   e t   a l .   " T w i t t e r   s e n t i m e nt   a n a l y s i s   o f   m o v i e   r e v i e w s   us i ng   m a c hi ne   l e a r n i ng   t e c hni que s " ,   I nt e r n at i on al   J o ur n al   o f   E ngi ne e r i ng  and   T e c hno l o gy ,   7 . 6   ( 2016 ) :   1 - 7.     [ 17]   S i da   W a ng   a nd   C hr i s t o phe r   D   M a nn i ng .   201 2.   B as e l i ne s   and   bi gr am s :   S i m pl e ,   g ood   s e nt i m e nt   and   t op i c   c l a s s i f i c a t i on .   I P r o c e e di ng s   o f   t h e   50t A nnua l   M e e t i ng   o f   t he   A s s oc i a t i o n   f o r   C o m put a t i o na l   L i ng ui s t i c s :   S ho r t   P a pe r s - V o l um e   2,   p a g e s   9 0 - 94.     [ 18]   Y o s hua   B e ng i o ,   R e j e a D uc ha r m e ,   P a s c a l   V i nc e nt ,   a nd   ´   C hr i s t i a n   J a nv i n.   20 03.   A   ne ur a l   p r o ba bi l i s t i c   l a ng ua g e   m o de l .   T he   J ou r na l   of   M ac h i ne   L e ar ni n R e s e ar c h ,   3:   113 7 - 1155 .     [ 19]   R o na C o l l o be r t ,   J a s o W e s t o n,   L e o B o t t o u,   M i c ha e l   ´   K a r l e n ,   K o r a y   K a v uk c uog l u,   a nd  P a v e l   K uks a .   201 1.   N a t u r a l   l a ng ua g e   p r o c e s s i ng   ( a l m o s t )   f r o m   s c r a t c h” .   T he   J ou r na l   of   M ac hi ne   L e ar ni ng   R e s e ar c h   12:   2493 - 2537 .     [ 20]   S a t y a na r a y a na   P ,   C ha r i s hm a   D e v i ,   S o w j a ny a   P ,   S a t i s B a bu,   S y a m   K um a r ,   I m pl e m e n t a t i o o f   c o n v e nt i o na l   c om m uni c a t i o n   s y s t e m   i n   d e e p   l e a r n i ng .   I n t e r na t i o na l   J ou r na l   o f   E ngi ne e r i n &   T e c h nol ogy ,   v . 7   ( 1. 1)   pp .   69 6 - 698 ,   2018 .   I S S N   222 7 - 524X .         B I O G R A P H I ES   O F   A U T H O R S       M r s   M e r i n   T ho m a s ,   c ur r e n t l y   w o r ki ng   a s   A s s i s t a n t   P r o f e s s o r   i n   C H R I S T   ( D e e m e d   t o   be   U ni v e r s i t y )   i t h e   de p a r t m e n t   o f   C o m put e r   S c i e nc e   a n E ng i ne e r i ng .   S h e   ha s   c o m pl e t e d   he r   m a s t e r s   f r o m   V i s v e s w a r y a   T e c hni c a l   U n i v e r s i t y ( V T U ) . S h e   i s   p u r s u i ng   h e r   R e s e a r c un de r   V i s v e s w a r a y a   T e c hno l o g i c a l   U ni v e r s i t y .           D r   L a t h a   C   A ,   i s   a   do c t o r a t e   f r o m   A nna   U ni v e r s i t y ,   C he n na i .   S he   h a s   do ne   he r   po s t - g r a dua t i o f r o m   N I T K   S ur a t k a l   a nd  G r a d ua t i o f r o m   M y s o r e   U ni v e r s i t y   i 1991.   S i nc e   t h e n ,   i h e r   v a s t   a c a de m i c   e xp e r i e nc e ,   s he   i s   c o nt r i bu t i ng   t o   t e c hn i c a l   e d uc a t i o i n   m o s t   o f   t h e   c a p a c i t i e s .   D r   L a t ha   ha s   f i l e d   f o r   a n   U S   p a t e nt   f o r   o ne   o f   he r   r e s e a r c h   w o r ks .   S he   ha s   a u t ho r e d   a   bo o o n   P r o g r a m m i ng   i C   w h i c i s   w i de l y   a ppr e c i a t e a nd  us e by   t he   s t ud e n t s .   S he   w a s   B o E   f o r   V T U   i n   201 a nd   c ur r e n t l y   f o r   D a y a na nd   S a g a r   U n i v e r s i t y .   B e i ng   a   R e v i e w e r   a nd   T e c hni c a l   P r o g r a m   C o m m i t t e e   m e m be r   f o r   m a ny   o f   t he   I E E E   I nt e r n a t i o na l   C o nf e r e nc e s   a nd   r e p ut e J o ur na l s ,   s he   i s   a l s o   be e a w a r de d ,   O ut s t a nd i ng   R e v i e w e r   a w a r d”   by   r e pu t e d   E l s e v i e r   publ i s he r s         A nt o n y   put hus s e r y   i s   a   c ur r e n t l y   w o r ki ng   a s   A s s i s t a n t   P r o f e s s o r   i C H R I S T   ( D e e m e d   t o   be   U ni v e r s i t y )   i t h e   d e pa r t m e nt   o f   S c i e nc e   a nd   H um a ni t i e s . H i s   a r e a   o f   e xp e r t i s e   i nc l ud e s   m a t he m a t i c a l   m o de l i ng   a n T h e o r e c t i c a l   G r a ph  T he o r y .   H e   ha s   s e v e r a l   j o ur na l   a nd  c o nf e r e nc e   publ i c a t i o ns   t o   h i s   c r e d i t   e s pe c i a l l y   i t he   a r e a   o f   m a t he m a t i c a l   m o d e l i ng   us i ng   g r a p h.     Evaluation Warning : The document was created with Spire.PDF for Python.