I n te r n ati o n al   Jo u r n al   o El e c tr i c a l   an d   C o m p u te r   En gi n e e r i n g   (I JEC E )   V o l .   10 ,   N o .   2 A p r i l   2020 ,   p p.   2023 ~ 203 0   IS S N :   2088 - 8708 D O I :   10. 1 1591 / i j e c e . v 10 i 2 . pp2023 - 2030             2023       Jou r n al   h o m e pa ge ht t p: / / i j e c e . i ae s c or e . c om / i nd e x . php / IJ E CE   Im p r o v i n g   a c c u r a c y   o f   p a r t - of - sp e e c h   ( POS )   t a g g i n g   u s i n g   h i d d e n   m a r k o v   m o d e l   a n d   m o r p h o l o g i c a l   a n a l y s i   f o r   M y a n m a r   L a n g u a g e       D i m   Lam   C i n g K h i n   M a r   S o e   N a t u r a l   L a ng ua g e   P r o c e s s i ng   L a b ,   U n i v e r s i t y   of   C o m put e r   S t udi e s ,   M y a nm a r       A r ti c l e   I n fo     A B S TR A C T     Ar t i c l e   h i s t or y :   R e c e i v e S e p   23 ,   2 019   R e v i s e O c t   2 5 ,   20 19   A c c e pt e N o v   2 ,   20 19       I N a t ur a l   L a ng ua g e   P r o c e s s i ng   ( N L P ) ,   W o r s e g m e n t a t i o a n P a r t - of - S pe e c ( P O S )   t a g g i ng   a r e   f unda m e n t a l   t a s ks .   T he   P O S   i nf o r m a t i o i s   a l s o   ne c e s s a r y   i N L P s   pr e pr o c e s s i ng   w o r a pp l i c a t i o ns   s uc a s   m a c hi ne   t r a ns l a t i o ( M T ) ,   i nf o r m a t i o r e t r i e v a l   ( I R ) ,   e t c .   C ur r e nt l y ,   t he r e   a r e   m a ny   r e s e a r c e f f o r t s   i w o r d   s e g m e n t a t i o a nd  P O S   t a g g i ng   de v e l o pe s e pa r a t e l y   w i t h   di f f e r e n t   m e t ho ds   t o   g e t   hi g p e r f o r m a nc e   a nd  a c c ur a c y .   F o r   M y a nm a r   L a ng ua g e ,   t he r e   a r e   a l s o   s e pa r a t e   w o r s e g m e nt o r s   a nd  P O S   t a g ge r s   ba s e d   o s t a t i s t i c a l   a pp r o a c he s   s uc a s   N e ur a l   N e t w o r ( N N )   a nd  H i d de M a r ko M o de l s   ( H M M s ) .   B u t ,   a s   t he   M y a nm a r   l a ng ua g e ' s   c o m pl e m o r pho l o g i c a l   s t r uc t ur e ,   t h e   O O V   pr o bl e m   s t i l l   e x i s t s .   T o   ke e a w a y   f r o m   e r r o r   a nd   i m pr o v e   s e g m e nt a t i o n   by   ut i l i z i ng   P O S   da t a ,   s e g m e nt a t i o n   a n l a be l i ng   s ho ul be   po s s i b l e   a t   t h e   s a m e   t i m e . T h e   m a i g o a l   of   de v e l o pi ng   P O S   t a g g e r   f o r   a n y   L a ng ua g e   i s   t o   i m p r o v e   a c c ur a c y   o f   t a g g i ng   a nd  r e m o v e   a m bi g ui t y   i s e n t e nc e s   due   t o   l a ng ua g e   s t r uc t ur e .   T hi s   p a pe r   f o c us e s   o de v e l o pi ng   w o r s e g m e nt a t i o a nd   P a r t - of -   S pe e c ( P O S )   T a g g e r   f o r   M y a nm a r   L a ng ua g e T hi s   pa p e r   pr e s e nt e t he   c o m pa r i s o o f   s e pa r a t e   w o r d   s e g m e n t a t i o n   a nd  P O S   t a g g i ng   w i t j o i nt   w o r d   s e g m e n t a t i o a nd   P O S   t a g g i ng .   Ke y w or d s :   N a t u ra l   l a n gu a ge   p r o c e s s i n hi dde n   m a rko v   m o de l   M o r p h o l o gi c a l   a na l y s i s   C opy r i gh t   ©   2020   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e   A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   D i m   L a m   Ci ng,   N a t u ra l   L a n gu a ge   P r o c e s s i n L a b ,   U n i v e r s i t y   of   Co m put e S t ud i e s ,   N o . 4,   M a i R o a d,   S h w e P y i T h a T o w n s hi p ,   Y a n go n,   M y a nm a r .   E m a i l :   di m l a m c i ng@ uc s y . e du. m m       1.   I N TR O D U C TI O N     In   n u m e r o us   us e s   o c h a r a c t e r i s t i c   l a n gu a ge   ha n d l i n g ,   P a rt - of - S pe e c h   (P O S l a b e l i n i s   a n   e s s e n t i a l   a s s i g n m e nt   f o r   e a c h   l a ngu a ge .   S o ,   to   ha v h i g h   p r e c i s i o n   t a gge r   i s   o n e   of  t h e   i m po r t a n c e   t a s ks   f o r   N L P   a ppl i c a t i o n s H a n dl i n a m b i guo us   a n u nk n o w n   w o r ds   a r e   t h e   c h a l l e n ge   o f   P O S   t a ggi n [ 1 ,   2] F o r   e v e r y   N L P   a ppl i c a t i o s uc a s   m a c h i n e   t r a n s l a t i o n,   i n f o r m a t i o e xt r a c t i o n,   s pe e c h   r e c o gn i t i o n ,   g ra m m a c h e c ki n g   a n w o r s e n s e   di s a m b i gu a t i o n ,   e t c   a r e   n e e de t o   do   w o r s e gm e nt a t i o n   a nd  P a rt - of - s pe e c h   (P O S t a g gi n g   o a   f un da m e n t a l   p r o c e s s   of   n a t u ra l   l a n gu a ge   p r o c e s s i n a p pl i c a t i o n T h e r e   a r e   m a n y   m e t h o ds   fo r   de v e l o pm e n t   of   P O S   t a gge r s .   T h e   m o s t   us i n t e c hn i que s   a r e   r u l e   b a s e d   m e t h o d ,   s t a t i s t i c a l   b a s e m e t h o a n n e u r a l   n e t w o r b a s e m e t h o d .   I n   t h e   r u l e - b a s e a ppr o a c h ,   r u l e s   a r e   de ve l o pe d   a c c o r di ng  t o   t h e   n a t u r e   o f   t h e   l a n gu a ge   t o   de f i n e   pr e c i s e l y   h ow   a n w h e r e   t o   a s s i gn   t h e   v a r i o us   P O S   t a gs   [3 - 5] .   T h i s   m e t h o do l o g y   h a s   j us t   b e e n   ut i l i z e t o   b ui l d   up  t h e   P O S   t a gge f o r   M y a nm a L a n gu a ge .   I t h e   f a c t ua l   m e t h o do l o g y ,   m e a s ur a b l e   l a n gu a ge   m o de l s   a r e   m a nuf a c t u r e d,   r e f i n e a n us e t o   P O S   l a b e l   t h e   i n f o   m e s s a ge   n a t u r a l l y .   M o s t   c o m m o n l y   us e d   s t a t i s t i c a l   a p p r o a c h e s   a r e   H i dde n   M a r ko v   M o d e l s   b a s e a ppr o a c h,   S uppo r t   v e c t o r   m a c h i n e   b a s e d,   Co ndi t i o na l   R a n do m   F i e l d   b a s e a nd  M a xi m um   E n t r o py   b a s e a ppr o a c h   [ 6,   7] .   T h i s   p a pe r   de s c r i b e s   H i dde n   M a r ko v   M o de l s   ( H M M )   a n t h e   p r o po s e s y s t e m   fo r   w o r s e gm e n t a t i o n   a nd  pa rt - of - s pe e c h   t a ggi ng  f o r   M y a n m a r   l a n gua ge .   M y a n m a r   L a n gu a ge   i s   m o r p h o l o gi c a l l y   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2088 - 8708   Int   J   E l e c   &   Co m E n g ,   V o l .   10 ,   N o .   2 A p ri l   2020   :     2023   -   2030   2024   ri c h,   c o m pl e x,   a n a g gl u t i na t i v e   i n   na t u r e ,   e xpr e s s i o n s   of   w h i c h   a r e   a r c h e w i t h   n u m e r o us   l i n gu i s t i c   hi g h l i g ht s .   P O S   l a b e l i n [8]  i s   a   s i g ni f i c a nt   i s s ue   i n   t h e   f i e l of   N L P   a n o n e   o t h e   f un da m e nt a l   pr e p a r i n g   v e n t u r e s   fo r   a n y   l a n gu a ge   i n   N L P .   i . e . ,   t h e   c a pa b i l i t y   of  a   c o m put e r   t o   a u t o m a t i c a l l y   P O S   t a a   g i v e n   s e n t e n c e .   N o r m a l l y ,   t h e   f i r s t   s t e o f   pr o c e s s i n i s   t o   di v i de   t h e   i nput   t e xt   i nt o   u n i t s   c a l l e t o ke n s   w h e r e   e a c h   i s   e i t h e r   a   w o r o r   s o m e t hi n e l s e   l i ke   a   n um b e r.   T h e   m a i n   c l ue   us e i n   s p a c e - de l i m i t e l a ngua ge   l i ke   E n gl i s h   i s   t h e   w hi t e   s pa c e .   I n   m a j o r   E a s t - A s i a n   l a n gu a ge s   s uc h   a s   J a p a n e s e C h i n e s e ,   T ha i   a n M y a nm a r,   t h e r e   i s   n o   s pa c e s   b e t w e e n   w o r ds .   M y a n m a r   l a n gu a ge ,   i t s   w r i t i n s t y l e   doe s   n o t   us e   a n y   d e l i m i t e r   b e t w e e n   w o r ds .   In   w o r s e gm e n t a t i o n   a n P O S   t a ggi n g ,   t h e   s t r uc t u r e   o m or p h o l o gi c a l   w o r ds   i s   t h e   m a i n   s o ur c e   of  i n f o r m a t i o n   t o   ge t   t h e   c o r r e c t   p r o c e s s   of   t a ggi ng.   B y   us i n g   t h e   m o r p h o l o gi c a l   s t r uc t u r e   o f   w o r ds e l i m i na t e   i rr e l e v a n t   t a gs   c a n   b e   r e m ov e a n f i n t h e   s ui t a b l e   t a f o r   t h e   w o r d   [9 - 11] S o ,   m o r p h o l o gi c a l   a na l y s i s   i s   a n   i m po rt a nt   p a r t   o f   l a n g ua ge   e n gi n e e r i n a pp l i c a t i o n s   e s p e c i a l l y   fo r   m o r p h o l o gi c a l l y   r i c h   a n c o m pl e l a n gu a ge   l i ke   M y a nm a r.     T h e r e   h a s   b e e n   ve r y   f e w   r e s e a r c h   c o n duc t e o n   v a r i o us   l a n gu a ge   pr o c e s s i n t a s ks   i n c l ud i n g   m o r p h o l o gi c a l   a na l y s i s   f o r   M y a n m a r   l a ngua ge   c o m pa r e   t o   E n gl i s h ,   F ra n c e ,   Chi n e s e ,   Indi a ,   a nd  T ha i . ,   e t c .   S i n c e   h i g h   l e v e l   l a n gu a ge   p r o c e s s i n t a s ks   s uc h   a s   P O S   t a ggi ng,   m a c hi n e   t ra n s l a t i o n,   s e m a n t i c   a na l y s i s ,   s y n t a c t i c   a n a l y s i s ,   s e n t i m e n t   a na l y s i s ,   i n f o r m a t i o r e t r i e v a l ,   c l a s s i f i c a t i o n,   c l us t e ri n s y s t e m ,   e t c .   a l l   p r o c e s s   o n   s m a l l e s t   l a ngu a ge   uni t ;   w o r ds .   T h e   m o r p h o l o gy   of   t h e   l a n gu a ge   t hr o ugh   a   s y s t e m a t i c   l i n gu i s t i c   s t udy   i s   i m po rt a nt   i o r de r   t o   r e v e a l   w o r ds   t h a t   a r e   s i g ni f i c a n t   t o   us e rs   s uc a s   hi s t o r i a n s ,   l i ngui s t s ,   e t c .   M o s t   of   t h e   c ur r e nt   r e s e a r c h e s   o n   M y a nm a r   l a n gu a ge   do n e   us e a   l e xi c o n   o r   di c t i o na r y   o r   c o r pus   w h i c h   l i s t s   a l l   t h e   w o r ds   f o r m s   f o r   w o r s e gm e n t a t i o n   a s   a n   i ni t i a l   s t a ge   o f   pr o c e s s i n g.   T o   ge t   c o r r e c t   s e gm e n t a t i o n ,   w e   n e e a n   e x h a us t i v e   l e xi c o n   o c o r pus M y a n m a r   l a ngua ge [12 - 16]   ha s   b e e n   c l a s s i f i e d   by   l i n gu i s t s   a s   a   m o n o s y l l a b i c   o r   i s o l a t i n g   l a ngua ge   w i t h   a gg l ut i na t i v e   f e a t ur e s .   I t s   w r i t i n s t y l e   d o e s   n o t   us e   a n y   de l i m i t e r   b e t w e e n   w o r ds   a n s o   t h e r e   i s   n o   w a y   of   kn o w i n w h e t h e r   a   w o r f o r m   o f   s y l l a b l e s   i s   gr o up,   o r   i s   j us t   s e pa ra t e   g r o up  o f   m o n o s y l l a b i c   w o r ds .   E v e r y   s y l l a b l e   h a s   a   m e a n i ng  o f   i t s   ow n .   T h e   M y a n m a r   L a n g ua ge   h a v e   c o m pl e m o r p h o t a c t i c   s t r uc t u r e s   a nd  h a s   t h e   a m b i guo us   w o r s e gm e nt a t i o n .   T h e r e f o r e ,   s e gm e n t   t h e   s e nt e n c e   t o   ge n e ra t e   l e xi c a l   a n s e m a nt i c   o f   w o r s e que n c e s   i s   a   c h a l l e n g i n t a s k.   T h us ,   t h i s   pa pe r   a i m   t o   a dd r e s s e s   t h i s   s h o r t c o m i n by   pr o pos i n g   a   l a n gu a ge   m o de l   t ha t   c o n s i de r   j o i n t   w o r s e gm e n t a t i o n   a n P O S   t a gg i n g .   T h e   r e s t   o t h i s   pa pe r   i s   or g a n i z e a s   fo l l ow s .   In   S e c t i o n   2,   w e   di s c us s e d   L i t e ra t u r e   R e v i e w .   S e c t i o n   de s c r i b e A s pe c t   of   M y a n m a r   L a n gu a ge .   S e c t i o n   p r e s e n t e D e s i gn   o P r o po s e S y s t e m .   S e c t i o p r o v i de s   t h e   E v a l u a t i o n .   F i na l l y ,   w e   de s c r i b e t h e   c o n c l us i o n   o f   t h e   p a pe r.       2.   LI TER A TU R R EV I EW   P a rt - of - S pe e c h   T a gge r   t ha t   us i n s upe r v i s e l e a rn i n g   a pp r o a c h   f o r   M y a n m a L a n gu a ge   i s   p r e s e nt e i n   [17] .   F o r   di s a m b i gu o us   of   t h e   P O S   t a gs ,   B a um - W e l c h   a l go r i t hm   a nd  V i t e r b i   a l go r i t h m   w i t h   H M M   m o de l   i s   us e fo r   t r a i n i ng  a nd  de c o di n g.   F o r   t a ggi ng  a   w o r d ,   M y a n m a r   l e xi c o n   i s   us e w i t h   i t s   a l l   po s s i b l e   t a gs .     T h e   e xa m i n a t i o n   r e s ul t s   s h o w   t ha t   t h e   s t ra t e gy   g o t   hi g h   pr e c i s i o (o v e r   90%)  f o r   v a ri o us   t e s t i n i n pu t .   M y a n m a r   W o r S e gm e nt a t i o n   [ 18]   us ed   H y b r i A pp r o a c h   a n t h e   s e n t e n c e s   a r e   s e g m e n t e i n   s y l l a b l e   a n m a t c h e d   by   l o n ge s t   w o r ds I n   t h e   us i n g   of   L o n ge s t   m a t c hi n m e t h o d ,   t h e   w o r ds   t h a t   a r e   k n o w n   f r o m   a   di c t i o n a r y   a r e   f i r s t   s e gm e n t e a nd   t h e   u n k n o w n   w o r ds   a re   gue s t   f r o m   a n - g ra m   m o de l   [19 ].   T h e   m a j o r   i s s ue   o t h i s   t e c hni que   i s   c o m e s   f r o m   t h e   v a gue n e s s   i n   t h e   l o n ge s t   c oo r di na t i n p r o c e dur e ,   s i n c e   w o r ds   c a n   b e   s h o w e up  i n   num e r o us   s t r uc t u r e s .   T h e   po r po s e of   Y .   Z h a n a n S .   C l a r k   [20] ,   t ha t   go t   a   l o w e r   m i s t a ke   ra t e   c o n t ra s t e w i t h   a   t w s t a ge   b a s e l i n e   s y s t e m .   T h e   l a rge   c o m b i n e s e a r c s pa c e   f o r   t h i s   m e t h o i s   a   c h a l l e n ge   a nd  i t   i s   v e r y   h a r d   i de c o di n g .   F o r   r e a s o n   f o r   a t   t h e   s a m e   t i m e   w o r di v i s i o n   a n P O S   l a b e l i n g,   a   s o l i t a r y   s t r a i g h t   m o de l   i s   ut i l i z e d ,   a nd  f o r   j o i n t   p r e pa ri n a n d   pi l l a r   s e a r c h   o f   unra v e l i n g,   t h e   s u m m e up   pe r c e pt r o n   c a l c u l a t i o i s   pi c ke d.   T h e   j o i n t   m o de l   l e s s e n s   a   m i s t a ke   pa c e   o f   e xa c t n e s s   fo r   d i v i s i o n   t o   14 . 6%   a nd  a   b l u n de r   de c l i n e   i l a b e l i n p r e c i s i o n   o f   12. 2%,   c o n t r a s t e w i t h   t h e   c o n v e n t i o n a l   p i pe l i n e   s t ra t e gy .   A   P e r s i a n   P O S   t a gge r ,   t h e   P e r s i a n   s e nt e n c e s   a r e   t a gge by   i m pl e m e n t i n b l e nd   of   m e a s ur a b l e   a n p r i n c i p l e - b a s e t e c h ni que .   T o   t a g   u n k n o w n   w o r d s ,   a   m o r p h o l o gi c a l   a na l y s i s   pr o b a b i l i s t i c   m e t h o d   i s   us e d .   P e r s i a n   m o rp h o l o gi c a l   r u l e s   t h a t   a r e   kn o w l e dge   b a s e   a n t h a t   t h e   p r o b a b i l i t i e s   i s   w o r ke by   a   c o r pus   is   t h e   s e c o n r e s ul t   o f   t h e   r e s e a r c h T r i a l   r e s ul t s   s h o w   t h a t   t h e i r   a pp r o a c h   i n c r e a s e   t h e   l a b e l i n g   e xe c ut i o n   a n d   e xa c t n e s s   [ 11 ].       3.   A S P EC O F   M Y A N M A R   LA N G U A G E   M y a n m a r   l a n gu a ge   i s   h i g hl y   a ggl ut i na t i v e   a n i s   m o r p h o l o gi c a l l y   r i c h   a nd  c o m pl e x.   M o r e ov e r ,   t o   s e pa r a t e   e a c h   w o r d,   t h e   M y a n m a r   w ri t i ng  s t y l e   d o   n o t   us e   s pa c e s   a n t h e r e   i s   n o   c h a n c e   t o   ge t   of   kn ow i n g   w h e t h e r   a   g a t h e ri n g   o f   s y l l a b l e s   s t r uc t u r e   a   w o r d,   o r   i s   o n l y   a   gr o up  o f   s e pa r a t e   m o n o s y l l a b i c   w o r ds .   Evaluation Warning : The document was created with Spire.PDF for Python.
Int   J   E l e c   &   Co m E n g     IS S N :   2088 - 8708       Im pr ov i ng   a c c ur a c y   o f   par t - of - s pe e c h   ( P O S)   t aggi ng   us i ng   h i d de n   m ar k ov   m ode l   and   . . .   ( D i m   L am   Ci ng )   2025   E v e r y   s y l l a b l e   h a s   i t s   o w n   m e a n i ngs I n   M y a nm a r   w o r ds   c o n s i s t   o f   o n e   o r   m o r e   s y l l a b l e s   w h i c h   a r e   c o m po un d   i n   di f f e r e n t   w a y s .   D e pe n d   o n   t h e   w a y   of   t h e   w o r ds   s t r uc t u r e s   f r o m   s y l l a b l e s ,   th e s e   c a n   b e   c l a s s i f y   i n t o   t hr e e   t y pe s   s i n gl e   s i m p l e   w o r ds ,   c o m pl e w o r ds   a nd  r e dup l i c a t i v e   w o r ds   [21,   22] .   F o r   e xa m pl e ,   ေ  ါင     (s t e a m )   +   အ   (po t = > ေ  ါင   အ     ( ri c e   c oo ke r ),     (f i r e +   ပူ   (h o t = >       (i r o n ) ,     (f l ow e r +           ( c a rr y = >           (pa i nt i n g ),   a l l   ha v e   t h e i r e f e r e n t i a l   m e a n i n g   a nd  e a c h   m o n o s y l l a b l e   w i t h i n   w o r ds   a l s ha s   t h e i r   o w n   m e a n i ng.   I M y a n m a r   m o r p h o l o gy   pr o c e s s e s   i n c l ude   i n f l e c t i o n ,   de r i v a t i o n,   a n d   c o m po un di ng.     3. 1 .   I n fl e c t i o n   m o r p h o l o gy   M y a n m a r   i n f l e c t i o n   m o r p h o l o g y   of   n o un s ,   v e r b s   a n a dj e c t i v e s   i s   m o s t l y   a c h i e v e d   by   s u f f i xa t i o n .   T h e   i n f l e c t i o n   m o r p h o l o g y   r e m a i n s   t h e   s a m e   P O S   t a gs   w i t t h e   o r i gi na l   w o r ds   b ut   by   a ddi ng  t h e   i n f l e c t i o m o r p h e m e   -     -       c a m a ke   t h e   p l u ra l   o n o un s   a nd   t h e   i n f l e c t i o n a l   m o r p h e m e   -     m a ke   t h e   p a s t     t e n s e   o n   v e r b s .   F o r   e xa m pl e :   ေ  က               (s t ude n t s - ေ  က           (s t ude n t +               (w e n t -       (go +     .     3. 2 .   D e r i v ati o n   m o r p h o l o gy   M y a n m a r   m o r p h o l o g y   de r i v a t i o n   o c c ur s   by   m e a n s   of   pr e f i xa t i o n   or   s uf f i xa t i o n.   D e r i v a t i o n   c a c h a nge   t h e   P O S   t a g   o f   w o r f o r m s .   D e r i v a t i o o f   n o un s ,   v e rb s   a n d   a dj e c t i v e s   a r e   a l s o   a c h i e v e by   s u ff i xa t i o n   b ut   a   c i r c um f i a l s o   o c c ur s   i n   t h e   M y a n m a r   l a n gu a ge .   F o r   e x a m p l e :   အလ       (w o r k)  -   (P r e f i x)  +    ပ     (do );                               ြ     ြ       ( r u nni n g)  - >    ြ     (ru n +   ြ       (S uff i x).   B ut   -   i s   n o t   p r e f i b o un m o r p h e m e   i n   s o m e   n o u n s   a n d   v e r b s   a nd  c a nn o t   b e   s pl i t t e d ;   f o e xa m pl e :   i f   t h e   w o r ds   ေအ ( m o t h e r )   i s   s p l i t t e d ,   i t   ha s   n o t   m e a n i ng .     3. 3 .   C om p ou n d i n g   M y a n m a r   w o r ds   c o n t a i m a n y   c o m po un w o r ds .   T h e y   a r e   n o u n   c o m po un w o r ds ,   v e r b   c o m po un w o r ds ,   a dj e c t i v e   c o m po un w o r ds   a nd  a l s o   n o un,   v e r b   a n d   a dj e c t i ve   a r e   c o m po un d .   F o r   e xa m pl e :   c o m po un d   n o u n :   ေ      (p r i c e ) - ေ  ဈ (m a r ke t )   +     (ra t e );   c o m pound  v e r b :   ြ              (v o uc h e r - ြ     (c ut +        (di v i de );   c o m po un d   a dj e c t i v e :     င       (f i rm -   င   (f i rm +   မ  (ri gi d) ;   c o m po un d   n o un, v e r a n a dj e c t i v e :   ူန    က   (a m b ul a n c e - လူ (h u m a n)  +   န  (pa i n f ul )   +     (pl a c e d)  +   က   (c a r ) .   B y   c o m po un di n g   t h e   w o r ds   s o m e   w o r ds   P O S   i s   t h e   s a m e   t o   t h e   o r i g i n a l   a n d   s o m e   w o r ds   go t   a   n e w   P O S   t a g .       4.   D ES I G N   O F   P R O P O S ED   S Y S TE M     T h e   s t r uc t u r e   o t h e   pr o po s e f r a m e w o r i s   s h ow n   i n   F i gu re   1.   T h e r e   a r e   t w m o dul e s :   pr e pa r i ng   a n t e s t i ng  m o dul e s .   I n   t h e   t ra i ni n p ha s e ,   t h e   c o l l e c t i o n   of   s e gm e n t e a n t a gge d - s e n t e n c e s   a r e   us e t de ve l o t h e   pr o po s e H M M   m o de l .   T hi s   m o de l   i s   us e i n   t h e   t e s t i n p ha s e .   I n   t e s t i n p ha s e ,   t h e   i n p ut   M y a n m a r   s e nt e n c e s   a r e   i de n t i f i e d   i nt o   e a c h   s e nt e n ce   us i ng   t h e   s e n t e n c e   e n m a r ke r   c a l l e d   po t e - m a   ’.     A f t e r   t ha t ,   w o r s e gm e nt a t i o a nd  P O S   t a ggi n g   i s   pe r f o r m e d     4. 1 .   C o r p u s   c r e at i o n   P a rt - of - S pe e c h   t a gge c o r po r a   a r e   o n e   of  t h e   e s s e n t i a l   r e s o ur c e s   fo r   de v e l o pi n s t a t e - of - t h e - a r t   P O S   T a gge r   i n   M y a nm a r.   T h e r e   a r e   s e ve r a l   s t e ps   t o   c r e a t e   t a gge c o r pus .   T h e   f o l l ow i n l i s t   de m o n s t r a t e s   s t e ps   n e e de c o r pus   b ui l di n g .     Co l l e c t i n g   ra w   t e xt     H a n d - a nn o t a t i n g   a n d   p r e p a r i n g   t ra i n i n g   d a t a   W e   c o l l e c t   a n n o rm a l i z e   ra w   t e xt   f r o m   o n l i n e   j o ur na l s ,   n e w s pa pe r s   a n e - b oo ks .   S i n c e ,   do c um e n t s   us e v a r i o us   M y a n m a r   f o n t   s t y l e s ;   t h e s e   a r e   c o n v e r t e d   t o   s t a n d a r d   U n i c o de   fo r m a t   a n d   a n d   m a ke   c l e a ni n g   s uc h   a s   s pe l l i ng  c h e c ki n g .   W e   a s s i gn   t a gs   i n   u n - a nn o t a t e t e xt   m a n ua l l y   a n f i n a l l y ,   w e   h a v e   g o t   t h e   t ra i ni n da t a   f o r   s t a t i s t i c a l   m e t h o d.   If   t h e   n u m b e r   o f   t a gs   i s   l a r ge ,   t h e   c o m pl e xi t y   w i l l   b e   i n c r e a s e a n d   t h e   pe r f o r m a n c e   w i l l   b e   de c r e a s e d.   A c c o r di n t o   M y a n m a r   g ra m m a r   b oo ks   a n di c t i o n a r y   boo [12 - 16],   t h e r e   a r e   n i n e   P a rt - of - S pe e c h   t a gs   i n   M y a n m a r   l a n gu a ge .   W e   h a v e   a nn o t a t e e ve r y   w o r w i t h   a p p r o p r i a t e   b a s i c   P O S   t a gs   a nd  c r e a t e a   P O S   t a Co r pus .   M o r e o ve r ,   w e   a dde a n o t h e r   t hr e e   P O S   t a gs   N um b e r ,   S y m bo l   a n A b b r e v i a t i o n   i n   o u r   r e s e a r c h .   T h e   t a gs e t   i s   de s c r i b e i T a b l e   1 .     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2088 - 8708   Int   J   E l e c   &   Co m E n g ,   V o l .   10 ,   N o .   2 A p ri l   2020   :     2023   -   2030   2026       F i gu r e   1 .   F ra m e w o r o f   t h e   p r o po s e s y s t e m       T a b l e   1 .   T a gs e t   N o .   T a g   D e s c ri p t i o n   E x a m p l e   1.   NN   N o u n     (fl o w e r)   2.   PN   P ro n o u n   က   (I)   သင   (y o u )   3.   V   V e r b     (b u y )     (e a t )   4.   A d j   A d j e c t i v e     ပူ (h o t )   5.   A d v   A d v e r b   ေ         (r e s p e c t f u l l y )   6.   P P M   P o s t p o s i t i o n a l   M a rk e r   က   က      7.   Co n j   Co n j u n c t i o n   ထ  အခ     8.   P a rt   P a rt i c l e s             9.   In t e rj   In t e rj e c t i o n   အ ၊   အမ  ေ   10.   N u m b e r   N u m b e r         11.   S y m b o l   S y m b o l   /   %   +   -        12.   A b b r e v   A b b r e v i a t i o n   အထက ဖဆ   အဘ အမ         4. 1 . 1.   C o r p u s   s tati s ti c   F o r   o ur   e xpe r i m e n t s ,   t h e   c o r p us   c o n s i s t s   o f   s e n t e n c e s   f r o m   M y a n m a r   g r a m m a b oo ks ,   M y a n m a t e xt   bo o k s ,   s o m e   M y a n m a r   hi s t o r y   a n w e b s i t e s .   Co r pus   i n f o r m a t i o n s   a r e   de s c r i b e i n   T a b l e   2.   T h e   fo n t   us e fo r   t h i s   r e s e a r c i s   U ni c o de .   T h e r e   a r e   t o t a l   3971 s e nt e n c e s   c ov e r i n 69 0258  w o r ds   a nd  e a c h   s e nt e n c e   ha s   a a v e r a ge   o f   18  w o r ds .   T h e   v o c a b ul a r y   s i z e   i s   2 7043   w o r ds .         T a b l e   2 D i s t r i b ut i o n   o f   P O S   t a gs   P O S   T a g s   N o .   o f   w o r d s   NN   25%   PN   4%   V   15%   A d j   2%   A d v   2%   P P M   17%   Co n j   5%   P a rt   22%   In t e rj   0 . 0 3 %   N u m b e r   1%   S y m b o l   7%   A b b r e v   0 . 0 9 %     Evaluation Warning : The document was created with Spire.PDF for Python.
Int   J   E l e c   &   Co m E n g     IS S N :   2088 - 8708       Im pr ov i ng   a c c ur a c y   o f   par t - of - s pe e c h   ( P O S)   t aggi ng   us i ng   h i d de n   m ar k ov   m ode l   and   . . .   ( D i m   L am   Ci ng )   2027   4. 2 .   Tr ai n i n h i d d e n   m ar k o v   mo d e l   T o   ge t   t ra i ni n g   da t a ,   w e   ha v e   t o   c o m put e   pr o b a b i l i t i e s   f o r   e a c t a i n   t h e   t a gge c o r pus .   S i n c e   w e   ha v e   de v e l o pe a   m o de l ,   i t   p r o duc e s   t w o   r e s ul t s .   T h e   r e s ul t s   of   t h e   t r a i n i ng  p ha s e   a r e   t ra n s i t i o n   p r o b a b i l i t i e s   a n e m i s s i o p r o b a b i l i t i e s .     4. 2 . 1.   Es ti m ati n p r o b ab i l i ti e s     P O S   t a gg i n us i n H M M ,   t h e   p r o b a b i l i t i e s   a r e   c a l c ul a t e f ro m   a   t a gge t r a i n i ng  c o r pus   i n s t e a o us i n t h e   f ul l   po w e r   of   H M M   l e a rn i n g .   T h e   p r o b a b i l i t i e s   o t a t ra n s i t i o n   P ( t i |t i - 1 )   i s   t h e   p r o b a b i l i t y   of   a   t a gi v e n   i n   t h e   pr e v i o us   t a g.   E s t i m a t i o n   o f   t r a n s i t i o n   p r o b a b i l i t y   i s   c o m put e by   c o un t i n t h e   t i m e s   t ha t   t h e   f i r s t   t a g   i a   t a gge d   c o r pus ,   h o w   of t e n   t h e   f i r s t   t a i s   f o l l ow e by   t h e   s e c o n d .         T h e   e m i s s i o n   pr o b a b i l i t i e s ,   P (w i |t i )   gi v e n   a   t a g,   i t   w i l l   b e   a s s oc i a t e w i t h   a   gi v e n   w o r [23].   T h e   e m i s s i o n   pr o b a b i l i t y   i s         4. 3 .   Jo i n M yan m ar   w o r d   s e gm e n tat i o n   an d   P O S   t aggi n g   T h e   i n put   s e n t e n c e s   a r e   f i r s t l y   s e pa ra t e by   p o t e - m a   .   T h e   w o r ds   i n   e a c h   s e n t e n c e   i s   s e gm e n t e a n a s s i g n e P O S   w i t h   t h e   p r o po s e t a gs e t s   i n   T a b l e   1   by  us i n H M M   pr o b a b i l i s t i c   m o de l s .   I n   M y a n m a L a n g ua ge ,   s i n c e   w o r ds   a r e   f o r m e by   c o m b i n i n g   m o r e   t h a o n e   s y l l a b l e   t ha t   i s   o n e   w o r c a h a v e   o n e   o m o r e   s y l l a b l e s   a n d   o n e   s y l l a b l e   ha s   m o r e   t ha o n e   c h a ra c t e r,   s y l l a b l e   i d e nt i f i c a t i o n   m us t   b e   do n e   b e fo r e   w o r d   l e v e l   s e gm e n t a t i o [2 4].   F o e xa m pl e ,   t h e   i n pu t   i s   a s   f o l l ow s   i n   T a b l e   3 :     ြ  ကာ   ွည   က သ   ။   (L o t us   g r o w s   i w a t e r . )     A f t e r   S y l l a b l e   Ide n t i f i c a t i o n,   t h e   ri g ht   o ut pu t   i s   c o m e   o ut   a s   f o l l ow s :       ြ  ကာ | |   | ေ  | ထဲ | ွ  | ေ  ါက |         T a b l e   3 .   N - g ra m   w o r s e gm e n t a t i o f o r   i n pu t   s e n t e n c e   N - g ra m   (N = 1 , 2 , 3 , 4 , 5 )   W o r d   S e g m e n t a t i o n   U n i g ra m   ြ  ကာ | | သ  | ေ  | ထဲ | ွ  | ေ  က | သ    Bi g ra m s   ြ  ကာ သ  ၊ သည   ရ၊   ရထဲ၊ ထဲတ ွ  ၊ ွည   က ၊   က သ    T ri g ra m s   ြ  ကာ   ၊ သည   ရ၊ သည   ထဲ၊   ရထဲတ ွ  ၊ ထဲတ ွည   က ၊ ွည   က သ    4 - g ra m s   ြ  က သည   ရ၊ သည   ရထဲ၊ သည   ရထဲ ွ  ၊   ရထဲတ ွည   က ၊ ထဲတ ွည   က သ     5 - g ra m s   ြ  ကာ သည   ရထဲ၊ သည   ရထဲ ွ  ၊ သည   ရထဲတ ွည   က ၊   ရထဲ ွည   က သ         A   t y pi c a l   s t ra t e gy   t do  w o r di v i s i o n   a n P O S   s i m ul t a n e o us l y   i s   t o   ut i l i z e   t h e   N - g r a m   (5 - g ra m s )   w h i c h   s w e e ps   a n   i n f o r m a t i o n   s e nt e n c e   f r o m   l e f t   t r i g ht ,   a nd  r e c ov e r   t h e   w o r w i t h   i t s   e v e r y t h i ng  po t e n t i a l   l a b e l s   w i t h   t h e   l i ke l i h o o f r o m   e m a na t i o n   r e c o r d.   If   a l l   5 - g r a m s   w o r ds   h a v e   n o t   b e e n   c o n t a i n e i n   t h e   e m i s s i o n   p r o b a b i l i t y   f i l e ,   t h e   s y s t e m   us e 4 - gr a m s ,   t ri g ra m s ,   b i g ra m s   a n u ni g r a m .   W o r s e gm e nt a t i o fo r   i nput   s e nt e n c e   a s   pe r   t h e   l o n ge s t   N - g r a m   t e c hni que     ြ  ကာ     ွ    ါက       W o r pr o b a b i l i t i e s   a n l a n g ua ge   m o de l   p r o b a b i l i t i e s   i s   c a l c ul a t e by   us i n r e l a t i v e   f r e que n c y   c o un t .   If   t h e r e   a r e   m o r e   t ha n   o n e   P O S   o pt i o n s   f o r   w o r d,   t h e   s y s t e m   s e l e c t e P O S   o pt i o n   w i t h   h i g h e s t   w o r pr o b a b i l i t y   a s   de s c r i b e i n   T a b l e   4 .       Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2088 - 8708   Int   J   E l e c   &   Co m E n g ,   V o l .   10 ,   N o .   2 A p ri l   2020   :     2023   -   2030   2028   T a b l e   4 .   A l l   po s s i b l e   w o r d,   t a g   a nd  p r o b a b i l i t y   W o r d   S e g m e n t a t i o n   P O S   L a n g u a g e   M o d e l   P ro b a b i l i t y   S e l e c t e d   P O S   ြ  ကာ   (L o t u s )   NN   1   NN   သ    ( n u l l )   P P M   0 . 4   P P M   P a rt   0 . 3     PN   0 . 2     A d j   0 . 1     ည    ( w a t e r )   NN   0 . 6   NN   V   0 . 2     P a rt   0 . 2     ထဲတ ွ    (i n )   P P M   1   P P M   ည  က (g ro w )   P a rt   0 . 2     V   0 . 7   V   NN   0 . 1     သ  ( n u l l )   P P M   0 . 4   P P M   P a rt   0 . 3     PN   0 . 2     A d j   0 . 1         4. 4 .   M o r p h o l o gi c al   r u l e s   ap p r o ac h   T h e   i n t e rna l   s t ruc t u r e s   o f   w o r ds   a r e   de f i n e b y   us i n m o r p h o l o gi c a l   r u l e s   [11].   T h e s e   r u l e s   c o m pr i s e   o f   t hr e e   s e c t i o n s :   p r e f i ( ),   s t e m   a nd  s uf f i (     ).   T h e   c o m m o n   s y n t a x   i s   a s   f o l l ow s :   pr e f i +   s t e m   +   s uf f i   P O S   t a g     In  t h e   a b o ve   s y n t a x,   s o m e t i m e   b o t h   o f   pr e f i a n s uf f i a re   c o n t a i n   i n   t h e   s t r i ng.   I s o m e   s y n t a x ,   o n e   o pr e f i o r   s uf f i i s   e m p t y   s t r i n g .   T h e r e   a r e   t hr e e   t y pe s ’  m o r p h o l o gi c a l   r ul e s   f o r   M y a n m a L a n gu a ge :   i n f l e c t i o n a l ,   de ri v a t i o n a l   r u l e s   a nd  c o m po un di n g .   I n   t h i s   s y s t e m ,   m o r p h o l o gi c a l   r ul e s   (68  rul e s a r e   c h a ra c t e ri z e [25]  a nd  ut i l i z e d.   T h e   r ul e s   a r e   dra w n   o ut   f r o m   M y a nm a r   G ra m m a r   b o o k   [12 - 16].   T h e   us e s   o i n f l e c t i o n a l ,   de ri v a t i o n a l   a n d   c o m po un di n g   a r e   de s c r i b e i S e c t i o n   3.       5.   EV A LU A TI O N   T o   a ppra i s e   t h e   t e s t i n r e s ul t   f o r   P O S   l a b e l i n g ,   t h e   f r a m e w o r ut i l i z e t h e   pa r a m e t e r s   o f   R e c a l l ,   P r e c i s i o a n d   F - s c o r e .   T h e s e   pa ra m e t e r s   a r e   c h a ra c t e ri z e a s   pu r s ue s :     , =                                             , =                                               , = 2  +     5. 1 .   Ex p e r i m e n tal   s e tu p   F o r   t e s t i ng  t h e   pr o po s e m o d e l ,   w e   di v i de o ur   c o r pus   i n t o   t w o   c o r pus e s   a s   fo l l ow s   i n   T a b l e   5 .   W e   c o l l e c t   500  n e w   s e n t e n c e s   fo r   o pe n   t e s t i n g .   I o ur   e xpe r i m e nt s ,   w e   c o m pa r e   t h e   s e pa ra t e   w o r s e gm e n t a t i o n   a n P O S   t a gg i n us i n H M M   ,   j o i n t   w o r s e gm e n t a t i o n   a n P O S   t a gg i n us i n H M M   a n j o i n t   w o r s e gm e n t a t a i o n   a nd  P O S   t a ggi n us i ng  H M M   w i t h   m o r p h o l o gi c a l   r ul e s   i n   T a b l e   6 .   F o r   t h e   c o m pa ra t i v e   pur po s e ,   w e   us e B i gr a m   P a rt - of - S pe e c h   T a gge r   f o r   M y a nm a r   L a ngua ge   [17]  a s   b a s e d   l i n e   s y s t e m .   T h e   p r o po s e s y s t e m   a n d   b a s e   l i n e   s y s t e m   us e s a m e   t ra i ni n g   c o r pus   a n d   t e s t   da t a .       T a b l e   5 .   S t a t i s t i c   o f   t h e   d a t a s e t   D a t a   N o . o f   S e n t e n c e   N o .   o f   w o r d s   Co r p u s   1   2 9 6 8 0   5 4 7 9 6 9   Co r p u s   2   3 9 7 1 6   6 9 0 2 5 8       Evaluation Warning : The document was created with Spire.PDF for Python.
Int   J   E l e c   &   Co m E n g     IS S N :   2088 - 8708       Im pr ov i ng   a c c ur a c y   o f   par t - of - s pe e c h   ( P O S)   t aggi ng   us i ng   h i d de n   m ar k ov   m ode l   and   . . .   ( D i m   L am   Ci ng )   2029   T a b l e   6 .   A c c ura c y   of   s y s t e m   o n   di f f e r e n t   t e s t   c a s e s   us i n g   H M M   a n d   m o r p h o l o gi c a l   r ul e s   Co r p u s   S i z e   (s e n t e n c e s )   S e p a ra t e   w o r d   S e g m e n t a t i o n   a n d   P O S   t a g   J o i n t   w o r d   s e g m e n t a t i o n   a n d   P O S   t a g   J o i n t   w o r d   s e g m e n t a t i o n   a n d   P O S   t a g   +   m o r p h o l o g i c a l   ru l e s   P re c i s i o n   Re c a l l   F - s c o r e   P re c i s i o n   Re c a l l   F - s c o r e   P re c i s i o n   Re c a l l   F - s c o r e   2 9 6 8 0   68%   67%   67%   78%   76%   77%   90%   88%   89%   3 9 7 1 6   77%   75%   76%   85%   83%   84%   94%   92%   93%       5. 2 .   R e s u l ts   an d   d i s c u s s i o n   T a b l e   s h o w s   t h e   e xpe r i m e n t   r e s ul t s   f o r   M y a n m a r   w o r s e gm e n t a t i o n   a nd  P O S   t a g gi n w i t di f fe r e nt   t ra i ni n d a t a   s i z e s .   Co n f o r m i n t o   t h e   t a b l e ,   t h e   p ro pos e t e c h n i q ue   s t a rt s   t o   ge t   a   f e w   pr o gr e s s i o n s   ov e r   t h e   c o r r e l a t i o n   s t a n da rd.   W h e n   t h e   m e a s u r e   of   pr e pa r i ng  i n f o r m a t i o n   s e nt e n c e s   i s   i n c r e a s e a n us i n o m o r p h o l o g y   r ul e s   a l s o   h a s   go o d   i n c r e a s e c o m pa r e w i t t h e   c o r r e s po n d i n b a s e l i n e s .   T h e   a c c u r a c y   of   t h e   t a gge i s   a pp ra i s e b y   us i n t e s t i n g   da t a   w h i c h   c o nt a i n s   di f f e r e n t   ki n ds   o f   w o r ds .   T e s t i ng  w o r ds   c a n   b e   de f i n e a s   k n o w n   w o r ds ,   u nk n o w n   w o r ds   a nd  a m b i guo us   w o r ds   f o r   t h e   t a gge r.   K n o w n   w o r ds   a r e   t h e   w o r ds   c o n t a i n   i n   t h e   t ra i ni n c o r pus   a n U n k n o w n   W o r ds   a r e   t h e   w o r ds   w h i c h   a r e   n o t   c o n t a i ni n i n   t h e   t ra i ni n c o r pus .   A m b i guo us   w o r ds   a r e   t h e   k n o w n   w o r ds   w h i c h   a r e   t a gge w r o n b e c a us e   o s e gm e n t a t i o n   e rr o r   a nd  i t   i s   n e e df ul   t s o l ve   fo r   di s a m b i gu a t i ng  t h a t   t a i s   t h e   c o r r e c t   t a f o r   t h e s e   w o r ds .   In  p r o po s e s y s t e m ,   m o s t   U n kn o w n   W o r ds   o c c ur   i n   P ro pe r   N o un   ( na m e   o f   pe r s o n ,   na m e   o f   l oc a t i o n ),   di f fe r e nt   po s i t i o n   o f   P a rt i c l e   a n P o s t po s i t i o na l   m a r ke r   i s e gm e nt a t i o c a c a us e   a m b i guo us   i n   P O S   t a gg i n g .   T h e r e   i s   n o   t ra i ni n d a t a   t o   c ov e r   a l l   P r o pe r   N o un s .   In c l udi n g   o f   di s a m b i guo us   w o r ds   a n u n k n o w n   w o r ds   m a ke   de c r e a s e   i t h e   pe r f o r m a n c e   o f   t h e   t a gge r .   T o   s o l v e   t h e   d i s a m b i gua t i o o f   a m b i guo us   w o r ds   i s   t us e   t h e   m o r p h o l o gi c a l   r ul e s .   By   us i n m o r p h o l o gi c a l   r ul e s ,   t h e   s y s t e m   r e duc e a m b i guo us   i n   P a rt i c l e   a n d   P o s t pos i t i o n a l   m a r ke r s .         6.   C O N C LU S I O N     T h i s   p a pe r   p r e s e n t s   a   j o i nt   w o r s e gm e n t a t i o n   a n P O S   t a gg i n i n   M y a n m a r   us i ng  H M M   a nd  m o r p h o l o gi c a l   r u l e s .   I n   o ur   e xpe r i m e nt s ,   w e   c o m pa r e   t h e   s e pa r a t e   w o r s e gm e nt a t i o n   a n P O S   t a ggi ng  w i t o ur   p r o po s e j o i n t   w o r s e gm e nt a t i o n   a nd  P O S   t a ggi ng   us i n H M M .   T h e n,   w e   fo un t ha t   t h e r e   i s   a   s i g ni f i c a nt   i m p r o v e m e n t   i j o i n t   w o r s e gm e n t a t a i o a n d   P O S   t a gg i n us i ng  H M M   w i t h   m o r p h o l o gi c a l   r u l e s .   W e   a l s o   de s c r i b e   t h e   d i s t r i b ut i o n   o f   w o r ds   i t h e   c o rpus .   Un t i l   n o w ,   t h e r e   a r e   u n k n o w n   w o r ds   i o ur  e xpe r i m e nt s .   T h e   f ut u r e   w o r w i l l   b e   t o   i m p r o ve   t h e   e xa c t n e s s   o f   w o r s e gm e nt a t i o a nd  P O S   t a ggi ng.     W e   a l s o   n e e a   l a r ge r   c o r pus   fo r   t r a i n i ng.   By   us i n a   l a r ge   t ra i ni n a nd  m o r p h o l o gi c a l   r u l e s ,   t h e   a s s i g nm e nt   of   P O S   t a w i l l   b e   m o r e   a c c ur a t e   a n d   w i l l   b e   r e duc e t h e   u n k n o w n   w o r ds ,   i n c o rr e c t   t a a n a m b i guo us   w o r ds .   T h e   pa pe r   ha s   s h o w n   t ha t   w o r s e gm e n t a t i o n   a n d   P O S   t a gg i n i n   M y a nm a c a n   b e   i m p r o v e by   us i n g   l a ge r   t r a i n i ng  c o r pus   a nd  c o m b i ni n g   t h e   m o r p h o l o gi c a l   a na l y s i s   o f   M y a n m a L a n g ua ge .       R EF ER EN C ES   [ 1]   T .   M i ko l o v ,   A .   D e o r a s ,   D .   P o v e y ,   L .   B ur g e t ,   J .   H .   C e r no c k y ,   " S t r a t e g i e s   f o r   t r a i ni ng   l a r g e   s c a l e   ne u r a l   ne t w o r k   l a ng ua g e   m o de l s , "   I E E E   A ut om at i c   Spe e c R e c o gni t i on   an U n de r s t and i ng   W or k s hop ,   pp.   1 96 - 201 ,   2011 .   [ 2]   A . J . P . M . P .   J a y a w e e r a ,   N.   G.   J .   D i a s ,   " H i dde m a r ko v   m o de l   ba s e pa r t   o f   s pe e c t a g g e r   f o r   s i nh a l a   l a ng ua g e ,"   I nt e r n at i on al   J o ur n al   on   N a t ur al   L an guage   C om pu t i ng  ( I J N L C ) ,   v ol 3 ( 3 ) ,   201 4 .   [ 3]   S i r a j u d d i Y .   H a l a ,   S a g a r   H .   V i r a n i ,   " I m pr ov e   a c c ur a c y   o f   p a r t s   o f   s pe e c t a g g e r   f o r   G uj a r a t i   l a ng ua g e , "   I nt e r n at i on al   J o ur n al   o f   A dv an c e   E ng i ne e r i ng   a nd  R e s e ar c h   D e v e l opm e nt v ol .   2 ( 5 ) ,   2 015 .   [ 4]   P . M   B h a t t ,   A .   G a na t r a ,   " A na l y z i ng   &   e nha nc i ng   a c c ur a c y   o f   pa r t   o f   s pe e c t a g g e r   w i t t he   us a g e   o f   m i xe a ppr o a c he s   f o r   G uj a r a t i ,"   I n t e r nat i on al   J o ur na l   of   R e c e nt   T e c hn ol ogy   a nd  E ng i ne e r i ng  ( I J R T E )   I SSN :   22 77 - 3878 ,   v ol 8 ( 1 ) ,   2 019 .   [ 5]   K .   M o hno t ,   N .   B a n s a l ,   S . P .   S i ng h,   A .   Ku m a r ,   " H y br i a ppr o a c f o r   pa r t   o f   s pe e c t a g g e r   f o r   H i ndi   l a ng ua g e , "   I nt e r n at i on al   J o ur n al   o f   C om put e r   T e c hno l o gy   and   E l e c t r oni c s   E ng i ne e r i ng   ( I J C T E E ) ,   v ol .   4 ( 1 ) ,   2014 .   [ 6]   S .   A l G a ht a n i ,   J .   M c N a ug ht ,   " J o i nt   A r a b i c   S e g m e nt a t i o a n P a r t - of - S pe e c T a g g i ng ,"   P r oc e e di ngs   o f   t he   Se c ond   W or k s hop  on  A r ab i c   N at ur a l   L ang uage   P r oc e s s i ng   © 2014  A s s oc i at i on   f or   C om pu t a t i o na l   L i ngu i s t i c s ,     pp.   10 8 - 117,   2 015 .   [ 7]   A .   F .   W i c a ks o no ,   A .   P ur w a r i a nt i ,   " H M M   ba s e pa r t - of - s pe e c t a g g e r   f   o r   B a ha s a   I ndo ne s i a , "   O P r oc e e di ngs   of   4 th   In t e r na t i ona l   M A L I N D O   ( M a l ay   an I ndo ne s i a L angu age )   W o r k s h op ,   2 010 .   [ 8]   S.   H O O N   N A . " C o ndi t i o na l   r a ndo m   f i e l ds   f o r   K o r e a n   m o r p he m e   s e g m e nt a t i o a nd   P O S   t a g g i ng , "   A C M   T r ans ac t i ons   on   A s i a L angu age   I nf o r m a t i o P r oc e s s i n g,   v o l .   14 ( 3 ),   20 15 .   [ 9]   Z .   H .   P o z v e h,   A M o na d j e m i ,   A .   A hm a di ,   " P e r s i a t e x t s   pa r t   o f   s pe e c t a g g i ng   us i ng   a r t i f i c i a l   n e ur a l   ne t w o r k s , "   J our nal   o f   C om pu t i ng  and   Se c ur i t y ,   v ol .   3 ( 4 ) ,   pp.   2 33 - 241 ,   2016 .   [ 10]   C .   L y u,   Y .   Z ha ng ,   D.   J i ,   " J o i nt   w o r s e g m e nt a t i o n,   P O S - t a g gi ng   a nd   s y nt a c t i c   c hunk i ng ,"   P r oc e e di n g s   o f   t he   T h i r t i e t A A A I   C on f e r e nc e   on   A r t i f i c i al   I nt e l l i ge nc e   ( A A A I - 16) ,   2016 .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2088 - 8708   Int   J   E l e c   &   Co m E n g ,   V o l .   10 ,   N o .   2 A p ri l   2020   :     2023   -   2030   2030   [ 11]   H .   F a da e i ,   M .   S ha m s f a r d ,   " P e r s i a n   P O S   t a g g i ng   us i ng   pr o ba b i l i s t i c   m o r pho l o g i c a l   a na l y s i s ,"   I nt .   J .   C om pu t e r   A ppl i c a t i ons   i n   T e c hno l og y ,   v o l .   3 8 ( 4 ) ,   pp.   2 64 - 273 ,   2010 .   [ 12]   P .   H o pp l e ,   " T h e   s t r uc t u r e   o f   no m i na l i z a t i o i B ur m e s e ,"   P h.   D   D i s s e r t a t i o n.   U n i v e r s i t y   of   T e x as ,   A r l i ngt on ,   2 003 .   [ 13]   D e pa r t m e n t   o f   t h e   M y a nm a r   L a ng ua g e   C o m m i s s i o n   , " M y a nm a r   g r a m m a r , "   M i n i s t r y   o f   E duc at i on .   M y anm a r , 200 6 .   [ 14]   " M y a nm a r - E ng l i s h   d i c t i o na r y ,"   M i n i s t r y   o f   E duc at i on ,   M y a nm a r .   [ 15]   G r a m m a r .   B ur m e s e   l a ng ua g e h t t p: / / e n . w i k i pe di a . o r g / w i ki / B u r m e s e _L a ng ua g e   [ 16]   D e pa r t m e n t   o f   t he   M y a nm a r   L a ng ua g e   C o m m i s s i o n ,   " M y a nm a r   g r a m m a r , "   M i n i s t r y   o f   E duc at i on ,   M y anm a r ,   2 016   [ 17]   P .   H M y i nt ,   T .   M H t w e ,   N L .   T he i n ,   " B i g r a m   pa r t - of - s pe e c t a gg e r   f o r   M y a nm a r   l a ng ua g e , "   2011  I n t e r na t i ona l   C onf e r e nc e   on   I nf or m a t i on  C om m un i c a t i on   and   M ana ge m e nt ,   I P C S I T ,   v o l .   16 2011 .   [ 18]   W P P a ,   N L .   T he i n ,   " M y a nm a r   w o r s e g m e nt a t i o us i ng   hy br i a p pr o a c h ,"   P r oc e e di ngs   o f   6 th   I n t e r na t i o nal   C onf e r e nc e   on   C om p ut e r   A pp l i c a t i o ns ,   2008 .   [ 19]   W.   P .   P a ,   Y .   K.   T hu ,   A.   F i nc h,   E.   S um i t a ,   " W o r bo unda r y   i de nt i f i c a t i o f o r   M y a nm a r   t e xt   u s i ng   c o ndi t i o na l   r a ndo m   f i e l d s , "   G e ne t i c   an E v ol ut i on ar y   C om p ut i ng ,   Sp r i n ge r   I nt e r nat i o nal   P ubl i s h i n Sw i t z e r l and ,   p .   44 7, 2016   [ 20]   Y .   Z ha ng ,   S .   C l a r k,   " J o i nt   w o r d   s e g m e n t a t i o a n P O S   t a g g i ng   us i ng   a   s i ng l e   p e r c e p t r o n ,"   P r oc e e di ng s   o f   A C L - 08 :   H L T ,   pp .   8 88 - 896 ,   200 8.   [ 21]   T .   M ,   H t w e ,   D .   L.   C i ng ,   " A   ne u r a l   p r o ba bi l i s t i c   l a ng ua g e   m o de l   f o r   j o i nt   m o r pho l o g i c a l   s e g m e nt a t i o a nd  P O S   t a g g i ng , "   T he   Se v e nt h   I nt e r n at i ona l   C on f e r e nc e   on   Sc i e nc e   an E n gi ne e r i ng( I C SE ) ,   pp .   9 - 10 ,   201 6 .   [ 22]   T T .   Z i n ,   K M S o e ,   N L .   T he i n ,   " M y a nm a r   ph r a s e s   t r a ns l a t i o m o de l   w i t m o r pho l o g i c a l   a na l y s i s   f o r   s t a t i s t i c a l   M y a nm a r   t o   E ng l i s t r a ns l a t i o s y s t e m ,"   25 t P ac i f i c   A s i a   C onf e r e nc e   on   L ang uage ,   I n f or m at i on   and   C om put at i on ,   pp .   1 30 - 139 ,   2011 .     [ 23]   D .   J u r a f s ky ,   J a m e s   H .   M a r t i n ,   " S pe e c a n l a ng ua g e   p r o c e s s i ng :   A i nt r o duc t i o t o   na t u r a l   l a ng ua g e   pr o c e s s i ng ,   c om put a t i o na l   l i ng ui s t i c s ,   a nd   s p e e c r e c o g ni t i o n ,"   C o p y r i g ht   2 006 ,   D r a f t   o f   J un e   25 ,   2 007 .   [ 24]   ht t ps : / / g i t hub . c o m / y e - k y a w - t hu/ s y l br e a k   [ 25]   D .   L .   C i ng ,   K .   M .   S o e ,   " J o i n t   w o r s e g m e nt a t i o a nd  pa r t - of - s pe e c ( P O S )   t a g g i ng   f o r   M y a nm a r   l a ng ua g e ,"   17 t h   I nt e r n at i on al   C on f e r e nc e   on   C om pu t e r   A pp l i c at i on ,   201 9 .       B I O G R A P H I ES   O F   A U T H O R S       D i m   L am   C i n g   r e c e i v e M . C . S c   i C o m put e r   S c i e nc e   f r o m   C o m p ut e r   U ni v e r s i t y   ( K a l a y )   i 2010.   S he   i s   a   P hD   c a nd i da t e   i n   U ni v e r s i t y   of   C o m put e r   S t ud i e s ,   Y a ng o ( U C S Y ) .   H e r   r e s e a r c i nt e r e s t   i nc l ud e s   N a t ur a l   L a ng ua g e   P r o c e s s i ng   a n M a c h i ne   L e a r n i ng .           K h i n   M a r   S o e   r e c e i v e M . C . S c   a nd  P h . D   de g r e e   i I nf o r m a t i o T e c hno l o gy   f r o m   U ni v e r s i t y   of   C o m put e r   S t u di e s ,   Y a ng o ( U C S Y )   i 2000   a n 20 05  r e s pe c t i v e l y .   S he   i s   c ur r e nt l y   a   f ul l   pr o f e s s o r   f r o m   N a t ur a l   L a ng ua g e   P r o c e s s i ng   ( N L P )   L a i U C S Y .   H e r   m a i r e s e a r c i nt e r e s t   i nc l ud e s   N a t ur a l   L a ng ua g e   P r o c e s s i ng   a n A r t i f i c i a l   I nt e l l i g e nc e .     Evaluation Warning : The document was created with Spire.PDF for Python.