I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   15 ,   N o .   1 J ul y   201 9 ,   pp .   3 5 5 ~3 64   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 1 5 .i 1 . pp 3 5 5 - 3 64             355       Jou r n al   h o m e pa ge ht t p: / / i ae s c or e . c om / j our na l s / i nde x . php/ i j e e c s   C o m p i l a t i o n   o f   M a l a y   c r i m i n o l o g i c a l   t e r m s f r o m   o n l i n e   n e w s       Jo an n C h i e w   L i n Le e ,   P h o e Le e   Te h ,   S i an   Lu n   Lau ,   I r i n a   P ak   D e pa r t m e n t   o f   C o m put i ng   a nd  I nf o r m a t i o S y s t e m s ,   S unw a y   U ni v e r s i t y ,   M a l a y s i a       A r ti c l e   I n fo     A B S TR A C T     Ar t i c l e   h i s t or y :   R e c e i v e D e c   1 2 ,   2018   R e v i s e F e b   2 3,   201 9   A c c e pt e M ar   2 ,   201 9       A   M a l a y   l a ng ua g e   c o r pus   ha s   be e n   e s t a b l i s h e by   t he   I ns t i t u t e   o f   L a ng ua g e   a nd  L i t e r a t u r e   ( D e w a B a ha s a   da P u s t a ka ,   D B P   i M a l a y s i a ) .   M o s t   o f   t he   pa s t   r e s e a r c o t he   M a l a y   l a ng ua g e   c o r pus   h a s   f o c us e o t he   d e s c r i p t i o n,   l e x i c o g r a ph y   a nd  t r a ns l a t i o o f   t he   M a l a y   l a ng ua g e .   H o w e v e r ,   i t h e   e x i s t i ng   l i t e r a t ur e ,   t h e r e   i s   no   l i s t   o f   M a l a y   w o r ds   t ha t   c a t e g o r i z e s   c r i m e   t e r m i no l o g i e s .   T hi s   s t udy   a i m s   t o   f i l l   t ha t   l i ng ui s t i c   g a p.   F i r s t ,   w e   a g g r e g a t e t he   m o s t   f r e que n t l y   us e c r i m e   t e r m i no l o gy   w o r ds   f r o m   M a l a y s i a o nl i ne   ne w s   s o ur c e s .   F i v e   hund r e d   c r i m e - r e l a t e w o r d s   w e r e   c om pi l e d .     N o   a ut o m a t i c   m a c hi n e s   w e r e   i t he   i n i t i a l   p r o c e s s ,   but   t he y   w e r e   s ubs e qu e nt l y   us e t o   v e r i f y   t he   da t a .   F o ur   hum a c o de r s   w e r e   us e t o   v a l i da t e   t h e   da t a   a nd  e ns ur e   t h e   o r i g i n a l i t y   o f   t he   s e m a n t i c   un de r s t a ndi ng   of   t he   M a l a y   t e xt .   F i n a l l y ,   m a j o r   c r i m e   t e r m i no l o g i e s   w e r e   o ut l i n e f r o m   a   s e t   o f   ke y w o r ds   t o   s e r v e   a s   t a g g e r s   i o ur   s o l ut i o n .   T he   ul t i m a t e   g oa l   o f   t hi s   s t udy   i s   t o   pr o v i de   a   c o r pus   f o r   f o r e ns i c   l i ng ui s t i c s ,   po l i c e   i nv e s t i g a t i o ns ,     a nd  g e ne r a l   c r i m e   r e s e a r c h.   T h i s   s t udy   ha s   e s t a bl i s he d   t he   f i r s t   c o r pus   o f   a   c r i m i no l o g i c a l   t e x t   i n   t he   M a l a y   l a ng ua g e .   Ke y w or ds :   Cri m i n o l o gi c a l   t e xt   M a l a y   l a n g ua ge   P a rt - of - s pe e c h   S e m a n t i c   t a ggi ng   C opy r i gh t   ©   201 9   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   P h o e y   L e e   T e h ,     D e pa rt m e n t   o f   Co m put i n g   a nd  I n f o rm a t i o S y s t e m s ,     S un w a y   U n i v e r s i t y ,   B a n da S u n w a y ,   46150  P e t a l i n J a y a ,   S e l a n go r ,   M a l a y s i a .   E m a i l :   p h o e y l e e t @ s un w a y . e du. m y       1.   I N TR O D U C TI O N     P a rt - of - s pe e c h   t a ggi n g   (P O S r e f e r s   t o   e a c w o r o f   o n e   s e n t e n c e   a s s i g n e t o   a a pp r o pri a t e   pa rt - of - s pe e c h   t a gg i n [1 ] .   T ha t   i s   t h e   p r o c e dur e   t o   i de n t i fy   e a c h   n o u n ,   v e r b ,   a dj e c t i v e   o r   o t h e pa rt s   o f   s pe e c h ,   w h i c h   i s   k n o w n   a s   t h e   P O S   t a g gi n [1 ] .   P O S   t a gge r   ha s   b e e n   ga i ni n w i de s pr e a a t t e nt i o n   i n   t h e   f i e l of  l i n gu i s t i c s .   T h e   us e   of   P O S   t a gge r   ha s   b e e n   a ppl i e i n   l e xi c a l   f e a t u r e   e xt ra c t i o n   f o r   w o r c l us t e ri n [2] T w i t t e [3] ,   a n m e di c a l   b l o gs   [4] .   Co m p a r e t o   o t h e r   l a ngu a ge s   [5]   s uc h   a s   E ngl i s [6 - 7] ,   t h e   de v e l o pm e n t   of   t h e   M a l a y   l a n g ua ge   c o r po ra   i n   M a l a y s i a   i s   s t i l l   l a ggi n b e h i n d .   T o   t h e   b e s t   of   o ur   k n o w l e dge ,   t h e r e   i s   y e t   t o   b e   a   M a l a y   l a n gu a ge   c o r po ra   t h a t   c o m pi l e   a   s pe c i f i c   a n d e t a i l e d   l i s t   o f   c r i m i n o l o gi c a l   t e r m s   i M a l a y .     L i n gu i s t i c s   l i t e r a t u r e   [8]  ha s   hi g h l i g h t e h o w   t h e   M a l a y   l a ngua ge   h a s   m a n y   l o a n w o r ds   f r o m   o t h e r s   l a n gu a ge s .   S i n c e   t h e n ,   l a rge - s c a l e   l i n gu i s t i c   w o r ks   ha v e   be e n   e s t a b l i s h e d.   T a s ks   s uc h   a s   w o r t a g gi n a n d   t o ke n i z i n a r e   do n e   i n   m a n y   di ffe r e nt   l a ngua ge s ,   i n c l udi n g   A ra b i c   [9],   H e b r e w   [10],   G e r m a n   [11] ,   U r du  [12],   B ur m e s e   [13],   R us s i a n   [14] ,   C hi n e s e   [15]  a nd  S w e di s h   [16].   In   o t h e r   w o r ds ,   t h e   p r o c e s s   of   t e xt   s e gm e n t a t i o i n v o l ve i t h e s e   s t u di e s   ha s   b e e n   us e i m a n y   di f f e r e n t   l a n gua ge s   f o r   t e xt   a n a l y s i s   [17].   It   i s   u na r gu a b l y   t r ue   t ha t   E n g l i s h   i s   o n e   o f   t h e   m o s t   us a b l e   a n e s t a b l i s h e c o m pa r e t o   a n y   o t h e r   l a n gu a ge .   A l t h o ug h   s e v e r a l   M a l a y   c o r po r a   a n a l y s i s   h a s   b e e n   c o n duc t e d,   t h e   de v e l o pm e n t   o f   t h e   E ngl i s h   l a n gu a ge   r e m a i n s   a n   e xa m pl e   a t   a l l   t i m e s ,   a t   l e a s t   b o t h   of   t he   i n f o r m a t i o n   o n   n e w s pa pe r s   (e . g.   U t us a n   O nl i n e   o r   B e r i t a   H a r i a n)  o nl y   h a v e   a   ge n e r a l   t a t o   s e a r c h   f o r   a l l   t h e   c ri m e   n e w s   o n l i n e ,   w hi c i s   j e n a y a h”   i M a l a y .   T h e   w o r c r i m e   i s   t o o   a bs t r a c t   a n b r o a t e rm ,   a n y e t   l i m i t e t o   be   of   a n y   h e l t o   fo r e n s i c   li n gu i s t i c   us e r s .   I n   p a r t i c ul a r,   p r o f e s s i o n a l s   i c ri m e - r e l a t e f i e l ds   s u c h   a s   po l i c e ,   l a w y e r s   a n f o r e n s i c   s c i e n t i s t s   m a y   f i n i t   i s   h e l pf ul   t o   s e a r c h   f o r   m a t e ri a l s   r e l a t e t o   c r i m e   w i t s uc a   l i s t   o f   t e r m s   i n   M a l a y .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   15 ,   N o .   1 J ul y   201 :     3 5 5   -   3 6 4   356   W i t h   s uc h   l i s t   o f   t a gs ,   t h e   a v a i l a b i l i t y   of   m o r e   r e l e v a nt   i n f o rm a t i o w i l l   b e   a v a i l a b l e   f o r   c ri m e - r e l a t e f i e l ds   a c a de m i c   o r e s e a r c h   p u r po s e s .   W h i l e   t h e   M a l a y   l a n gu a ge   i s   a   m e di um   o f   i n s t r uc t i o n   i n   e duc a t i o n,     t h e   m a j o ri t y   of   o n l i n e   c o m m u ni c a t i o n   i n   M a l a y s i a   r e m a i n s   t o   b e   i n   E ngl i s h   [18] .   F u rt h e r m o r e ,   t h e   M a l a y   l a n gu a ge   ha s   y e t   t h a v e   a   s pe c i f i c   l i s t   of   c r i m e - r e l a t e t e rm i n o l o gi e s   de v e l o pe fo r   c r i m e - r e l a t e n e w s   o r   i n f o r m a t i o s e a r c h .     T h us ,   t hi s   s t udy   a i m s   t o   l oo a t   t h e   c r e a t i o n   o f   c r i m e - re l a t e w o r ds   by   i de n t i fy i n t h e   m o s t   f r e que n t l y   us e d   c r i m i n o l o gy   t e r m s   f r o m   o n l i n e   n e w s   a r t i c l e s .   T h e   r e s t   of   t h i s   p a pe r   i s   o r ga ni z e a s   f o l l ow s :   S e c t i o n   2   pr e s e nt s   t h e   l i t e ra t u r e   r e v i e w ,   a n S e c t i o n   3   de s c ri b e s   t h e   m e t h o o f   t h i s   s t udy   us i n h u m a n   c o de r   a n s e n t i m e nt   t o o l s ’  s e t ups .   S e c t i o n   4   c o n t a i n s   a n   a n a l y s i s   of   t h e   s ur v e y   r e s ul t s ,   f o l l ow e by   t h e   e v a l ua t i o n   of   s e n t i m e nt   t o o l s ’  t e s t i n g .   S e c t i o 5   t h e n   c o n c l u de s   t h e   p a pe r .       2.   LI TER A TU R R EV I EW   2 . 1 .       C r i m e   Cri m e   ha s   a l w a y s   b e e n   a   b i s o c i e t a l   i s s ue ,   r e ga r d l e s s   of   w h e t h e r   i t   i s   a   k ni f e   c r i m e   o r   a   c y be r c r i m e .   In  2018 ,   t h e   c r i m e   r a t e   i M a l a y s i a   i s   s t i l l   o n   t h e   r i s e   [19 ] .   I t h e   w o r l dw i de   c ri m e   i n de x,   M a l a y s i a   i s   ra n ke a t   n um b e r   15  ( 63 . 05%) ,   w h i l e   t h e   U n i t e S t a t e s   i s   a t   n u m b e r   35  (49. 58 %)  a n t h e   U n i t e K i n gdo m   a t   n u m b e r   62  (41 . 20%) .   M a l a y s i a ’s   c r i m e   i n de w a s   r a t e a t   7 0. 88%  i n   2012 ,   de c r e a s e t o   67. 50%  i n   20 14  a n d   r o s e   a ga i t o   69 . 70%   i 20 15.     U n t i l   201 7,   t h e   c ri m e   i n de h a de c r e a s e t o   63. 05% .   T h e s e   n um b e r s   a r e   s t i l l   c o n s i de r e hi g h,   a n d   M a l a y s i a   i s   s t i l l   a   c o un t r y   t ha t   i s   pl a gue b y   c r i m e s .   A   r e c e n t   o pe s o ur c e   s t a t i s t i c   r e po rt   o f   M a l a y s i a   ha s   c a t e go r i z e c r i m e s   i n t o   t w o   m a i n   c a t e go r i e s   [19] :   1)  a c t s   o v i o l e n c e ,   a n 2)  p r o pe r t y   da m a ge .   A s   s h o w n   i T a b l e   1 ,   t h e s e   t w o   c a t e g o r i e s   c a b e   s e pa ra t e i n t o   s e v e n   a nd   s i x   s ub c a t e go r i e s ,   r e s pe c t i v e l y .   T h e   s ub c a t e go r i e s   i n   T a b l e   s h o w   t h e   v a ri o us   t y pe s   a n a m o un t   o f   c r i m e s   t h a t   a r e   b e i n c o m m i t t e i n   t h e   c o un t r y .   T h e r e f o r e ,   i t   c a n   b e   de duc e t h a t   i t   i s   a   s i g n i f i c a n t   a s pe c t   t ha t   f urt h e r   a n a l y s i s   m us t   b e   c o n s i de r e d.   H ow e ve r ,   t h e   s t a t i s t i c s   o n l y   c o n s i de r   t w o   di ff e r e n t   c ri m e   c a t e go ri e s   t h a t   a r e   p r e s e n t   i n   t h e   c o un t r y   a n d   do   t a ke   i nt o   a c c o un t   o t h e c a t e go ri e s   o f   c r i m e   t h a t   e xi s t .       T a b l e   1 .   M a l a y s i a n   C ri m e   Ca t e go r i e s   Cri m e   Ca t e g o ri e s   A m o u n t   (t h e   y e a 2 0 1 6 )   A c t s   o V i o l e n c e   M u rd e r   Ra p e   456   1886   Ro b b e r y :   A c c o m p l i c e s   w i t h   F i r e a r m s   65   Ro b b e r y :   A c c o m p l i c e s   w i t h o u t   F i r e a rm s   1 0 , 9 0 7   Ro b b e r y :   F i r e a r m s     18   Ro b b e r y :   W i t h o u t   F i r e a rm s   3463   W o u n d i n g   5531   P ro p e rt y   D a m a g e   T h e f t   1 9 8 9 4   Ca T h e ft   1 0 6 0 7   M o t o r c y c l e   T h e f t   3 4 7 5 4   H e a v y   V e h i c l e   T h e f t   3050   S n a t c h   T h e f t   2963   Bre a k i n g ,   E n t e ri n g   a n d   S t e a l i n g   /   Bu rg l a r y   1 8 7 6 0   T o t a l   Cri m e   I n d e x   1 1 2 3 5 4       2 . 2 .       H o w   D o e s   Li t e r a tu r e   C at e go r i z e   C r i m e   T e r m i n o l o gi e s ?   M a n y   t y p e s   of   r e s e a r c h   h a v e   b e e n   do n e   t o   c a t e go r i z e   c ri m e   t e rm i n o l o gi e s   [20 - 22] .   F r o m   m e n t i o n e l i t e r a t u r e ,   c ri m e   c a b e   pr i m a ri l y   c a t e go r i z e i n t o   t h e   f o l l ow i n s e v e n   c a t e go r i e s :   1)  p r o pe rt y   t h e f t   2)  v i o l e n t   c r i m e   3)  c o n t r o l l e s ub s t a n c e / d r ug  4 t e rr o r i s m   5)  a b us e   6)  w h i t e   c o l l a r   c ri m e ,   a n 7)  f o r c e l a b o ur .   A s   s h o w n   i n   T a b l e   2,   e a c h   o f   t h e s e   b r o a c a t e go r i e s   o f   c r i m e   c a n   t h e b e   b r o ke n   dow n   i n t o   di f f e r e n t   s ub c a t e g o r i e s   [20 23 - 26]   In  da t a   c l a s s i f i c a t i o n ,   i t   i s   e s s e n t i a l   t o   g r o up  t e r m s   t ha t   s ha re   a   c o m m o n   c ha r a c t e r i s t i c ,   m e a n i ng  o qua l i t y .   W i t t h e   c l a s s i f i c a t i o n   i n   T a b l e   2 ,   t h e   p r o c e s s   of   c a t e go r i z i n g   c ri m e   t e r m i n o l o gi e s   b e c o m e s   c l e a r e r .             Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Com pi l a t i on  o f   m al a y   c r i m i n ol og i c a l   t e r m s   f r om   onl i ne   n e w s   ( J oanna   Chi e w   L i ng  L e e )   357   T a b l e   2 .   C a t e go ri e s   o f   Cr i m e   M a j o r   Ca t e g o r i e s   (n u m b e o f   c ri m e s )   S u b c a t e g o ri e s   P ro p e rt y   T h e f t   (6 * )   T h e f t ,   Ca T h e f t ,   M o t o r c y c l e   T h e f t ,   H e a v y   V e h i c l e   T h e f t ,   S n a t c h   T h e f t ,   Bre a k i n g ,   E n t e ri n g   a n d   S t e a l i n g   / Bu r g l a r y .   V i o l e n t   Cri m e s   (7 * )   J e n a y a h   K e k e r a s a n   M u rd e r,   Ra p e ,   A r m e d   R o b b e r y   w i t h   A c c o m p l i c e s ,   U n a r m e d   R o b b e r y   w i t h o u t   F i r e a r m s ,   A r m e d   R o b b e r y ,   U n a r m e d   R o b b e r y ,   W o u n d i n g .   Co n t r o l l e d   S u b s t a n c e s / D ru g s   (7 * B a h a n - B a h a n   T e r k a w a l   T ra f fi c k i n g ,   D ru g   P o s s e s s i o n ,   Co n t r o l l e d   S u b s t a n c e   V i o l a t i o n   a n d   O t h e r   Cri m e s / A c t i v i t y ,   Ra c k e t e e ri n g ,   S m u g g l i n g ,   L a u n d e r i n g   M o n e y   fro m   Co n t ro l l e d   S u b s t a n c e s ,   T a x   O ffe n s e s .   T e rro ri s m   (8 * P e n g g a n a s a n   Cy b e T e rr o ri s m ,   S t a t e   T e rro r i s m ,   S t a t e   S p o n s o r e d   T e rr o ri s m ,   N a t i o n a l i s t   T e rro ri s m ,   Re l i g i o u s   T e rro ri s m ,   L e f t   a n d   Ri g h t   W i n g   T e rro ri s m ,   A n a rc h i s t   T e rro ri s m ,   S u i c i d e   T e r ro r i s m .   A b u s e   (7 * )   P e n d e r a a n   Ch i l d   A b u s e ,   P h y s i c a l   A b u s e ,   E m o t i o n a l   A b u s e ,   S e x u a l   A b u s e ,   N e g l e c t ,   Bu l l y i n g ,   F i n a n c i a l   E x p l o i t a t i o n .   W h i t e - Co l l a Cr i m e   (8 * )   J e n a y a h   K o l a r   P u t i h   A n t i t ru s t ,   S e c u ri t i e s   F ra u d ,   M a i l   F ra u d ,   F a l s e   Cl a i m s ,   Cr e d i t   F ra u d ,   Bri b e r y ,   T a x   F ra u d ,   Ba n k   E m b e z z l e m e n t .   F o r c e d   L a b o u (8 * B u r u h   P a k s a   F o r m s   o c o e r c i o n ,   P ri s o n   L a b o u r,   F o r c e d   O v e rt i m e ,   H u m a n   T ra ff i c k i n g ,   T ra f fi c k i n g   o S m u g g l i n g ,   S l a v e r y ,   C h i l d   L a b o u r ,   B o n d e d   L a b o u r .   *T h e   n u m b e r   o f   s ub c a t e go r i e s   i n   t h e   c a t e go r y   It a l i c   w o r ds   a re   i n   t h e   M a l a y   l a n g ua ge       A   c o m m o n   w a y   of   c a t e go r i z i n a   ke y w o r i s   t hr o ug ke y w or d   e xt r a c t i o [27] .   T h i s   p r o c e s s   i s   do n e   b a s e o n   t h e   a v a i l a b l e   l i s t   o f   k e y w o r ds   t o   a c c o m m o da t e   t h e   c a t e go r i z a t i o n   o f   o t h e r   ke y w o r ds   i n t o   t h o s e   c a t e go r i e s .   H ow e ve r ,   a n   i s s ue   t ha t   m a y   a r i s e   i s   t h a t   w h i l e   t h e r e   a r e   s ub c a t e go r i e s   t ha t   r e p r e s e n t   t h e   ge n e r a l   c a t e go r y   of   c r i m e   t e rm s ,   t h e r e   i s   n o   e v i de n c e   o r   m e t h o t o   s h o w   t h a t   s o m e   t y pe s   of   c r i m e   b e l o n i n   a   pa r t i c ul a r   s ub c a t e go r y ,   e s pe c i a l l y   i n   t h e   M a l a y   l a n gua ge   [27].   T h e   us e   o f   ke y w o r d - b a s e c a t e go r i z a t i o n   t o   c l a s s i fy   t e xt   i n t o   a   c o rr e s po n d i n g   c a t e go r y   r e qui r e s   a pp r o xi m a t e l y   30  ke y w o r ds   t o   r e p r e s e nt   e a c c a t e go r y .     In   t h i s   s t udy ,   t h e r e   a r e   n o   ke y w o r ds   t h a t   a r e   us e t o   r e p r e s e n t   e a c h   c a t e go r y   of   c r i m e .   T h e r e   i s     o n l y   a   l i s t   o f   E ngl i s w o r ds   fo r   c ri m e   a nd  ge n e ra l   t e r m s   w i t h o ut   a   s o ur c e   o f   r e fe r e n c e s   t o   t h e i m a j o r   c a t e go r i e s   [28] .   T hus ,   m a k i n a   l i s t   o f   w o r ds   fo r   c ri m e   i s   e s s e n t i a l .   A s   s e e n   i n   T a b l e   2,   s e v e r a l   m a j o r   c r i m e   c a t e go r i e s   a n d   t h e i s ub c a t e go r i e s   ha v e   b e e n   s um m a ri z e a nd  t a b ul a t e d.   T hi s   s t u dy   a i m s   t o   de v e l o a   l i s t   o c r i m e - r e l a t e M a l a y   t e r m i n o l o gi e s .   H ow e ve r ,   i t   ha s   a l s o   a s s i s t e us   i n   pr o duc i n a   l i s t   o f   E n gl i s t e rm i n o l o gi e s .   U nt i l   t o da y ,   M a l a y s i a po l i c e   r e po r t s   a n d   do c um e nt s   a r e   s t i l l   w ri t t e i t h e   M a l a y   l a n gu a ge .   In  M a l a y s i a ’s   o n l i n e   n e w s   c o n t e nt   (c r i m e   n e w s a r e   ge ne r a l l y   t a gge a s   ‘c ri m e ’  o r   ‘j e na y a h ’.     N o   w e bs i t e   i s   fo un t o   p r o v i de   a   l i s t   o f   t a gs   t h a t   gi v e   f ur t h e r   i n s i g ht   i nt o   t h e   s pe c i f i c   c r i m e   t ha t   t h e   c o n t e nt   b e l o n gs   t o .   T o   f i l l   t h e   ga p,   t h e   m a i a i m   o f   t h e   s t udy   i s   t o   c r e a t e   a   l i s t   o f   c r i m e - r e l a t e M a l a y   t e r m i n o l o gi e s         3.   M A TER I A LS   A N D   M E TH O D S   3. 1 .       P h as e   1:   D ata   C o l l e c ti o n   T h e   f i r s t   s t a ge   o f   t h i s   s t udy   w a s   t o   c o l l e c t   n e w s   f r o m   o n l i n e   n e w s pa pe r s   i n   t h e   M a l a y   l a n g ua ge ,   pa r t i c ul a rl y   n e w s   a n d   a rt i c l e s   t ha t   r e l a t e t o   c ri m e .   I ni t i a l l y ,   200  n e w s   a r t i c l e s   w e r e   c o m pi l e d.   M a n u a l l y ,     a l l   w o r ds   f r o m   t h e   a rt i c l e s   w e r e   r e c o r de i n   a   da t a b a s e ,   w hi c h   s e pa ra t e t h e   w o r ds   by   da t e s .   F o r   e a c h   y e a r   b e t w e e n   2014  a nd  2017 ,   a t   l e a s t   5 a rt i c l e s   w e r e   m a n ua l l y   r e c o r de d.   T h e   n u m b e r   o f   s e l e c t e o n l i n e   a rt i c l e s   f r o m   U t us a n   O nl i n e   w a s   71  (w w w . ut us a n. c o m . m y ),   60  f r o m   B e r i t a   H a ri a (w w w . b h a r i a n. c o m . m y a n d   69  f r o m   H a r i a n   M e t r o   (w w w . h m e t r o . c o m . m y ).   T h e s e   w e b s i t e s   ge n e r a l l y   fe a t ur e   n e w s pa pe r   a r t i c l e s   fo r   a l l   c a t e go r i e s   a n a r e   w r i t t e n   i n   t h e   M a l a y   l a ngua ge .   T h e   us e   of   t h e s e   n e w s pa pe r   a r t i c l e s   m a ke s   i t   po s s i b l e   n o t   o n l y   t o   ob t a i n   u ni que   i n f o r m a t i o n   o f   t h e   w a y   i n   w h i c h   e a c h   n e w s pa pe r   r e po rt s   o r   w r i t e s   c r i m e - r e l a t e c o n t e n t ,   b ut   a l s o   t o   c o n s i de t h e   t y pe s   of   c r i m e   t ha t   ha v e   b e e n,   a n d   a r e   b e i n g ,   r e po rt e d.   A   r a ndo m   s a m p l i ng  m e t h o w a s   us e t o   s e l e c t   t h e   a r t i c l e s   a n t o   e n s ur e   t ha t   t h e   da t a   c o l l e c t e w a s   n o t   b i a s e [29] .   T h e   s a m p l i n m e t h o w a s   c a rri e o ut   by   u s i ng  a   ra n do m   n u m b e r   ge n e ra t o r ,   t h e   m a xi m u m   l i m i t   i s   t h e   num b e o f   a rt i c l e s   a v a i l a b l e   o t h e   n e w s pa pe r   w e b pa ge .     3. 2 .       P h as e   2:   P r e - p r o c e s s i n o D at u s i n H u m an   C o d e r   D ue   t o   t h e   l a c o f   M a l a y   s e n t i m e nt   t o o l s ,   fo ur   h u m a n   c o de r s   w e r e   us e t o   r e a e a c h   n e w s pa pe r   a r t i c l e   a n v e ri fy   t h e   n e w s   c o n t e nt .   T hr o ug h   t h e   r a ndo m   s a m pl i n g   m e t h o d,   s o m e   c o l l e c t e a rt i c l e s   w e r e   fo un t o   b e   i rr e l e v a nt .   F o e xa m p l e ,   u n de r   t h e   l i s t   o f   c r i m e   a rt i c l e s   i B e r i t a   H a r i a n,   n e w s   o n   ‘a c c i d e n t s   h a d   b e e n   e rr o n e o us l y   i n c l ude d.   T o   o ve r c o m e   t h i s   i s s ue ,   e a c h   n e w s   a r t i c l e   w a s   r e a t hr o ugh   by   h um a n   c o de r s   a n d   w o ul b e   r e m o v e f r o m   a   l i s t   o f   t o 500  c r i m e - r e l a t e d   ke y w o r ds   s e a r c i f   t h e   a rt i c l e   w a s   u n s u i t a b l e .     T h e   s e c o n i s s ue   t h a t   ha t o   b e   c o un t e r e d   du r i ng  t h e   da t a   p r e - p r o c e s s i n s t a ge   w a s   t h e   p r e s e n c e   of  dupl i c a t e   n e w s   f r o m   di f f e r e n t   n e w s pa pe r s .   T h e r e f o r e ,   e a c h   a rt i c l e   w a s   r e ga r de a s   a   di s t i n c t   p i e c e   of   n e w s   a s   t h e   a ut h o r s   o f   t h e   n e w s   a r t i c l e   m i g ht   ha v e   us e di ff e r e n t   t e rm s   t o   w r i t e   a   s i m i l a r   s t o r y .   T hi s   pa rt i c ul a r   i s s ue   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   15 ,   N o .   1 J ul y   201 :     3 5 5   -   3 6 4   358   s t i l l   ha s   t o   b e   s t udi e i l l us t ra t e s   t h e   f l ow   of   da t a   pr e - p r o c e s s i n g,   a nd  t h e   fo l l ow i n p h a s e s   (f e a t ur e   s e l e c t i o n ,   e v a l ua t i o e t c . ) .   F l o w   o f   D a t a   P r e - p r o c e s s i n g,   F e a t u r e   S e l e c t i o n   t o   E v a l u a t i o n   a s   s h o w n   i F i gu r e   1 .           F i gu r e   1 .   F l o w   of   D a t a   P r e - p r o c e s s i n g,   F e a t u r e   S e l e c t i o t o   E v a l ua t i o n       3. 3   P h as e   3:   P r o c e s s i n g   th e   D ata   F r o m   t h e   l i t e r a t u r e   r e v i e w ,   a   t o t a l   o f   52  s ubc a t e go r i e s   of   c r i m e   w e r e   i de n t i f i e a n s u m m a ri z e d   T a b l e   2 .   T h e   r e duc t i o p r o c e s s   w a s   do n e   be c a us e   t h e r e   w a s   a n   o v e r l a p pi n g   o f   a t t r i b ut e s   (w o r ds t ha t   a ppe a r e i n   di f f e r e n t   c a t e go ri e s .   F urt h e rm o r e ,   t o   e n s ur e   t h a t   t h e   w o r ds   i n   t h e   f i n a l   l i s t   ha v e   n o   s i m i l a ri t y   i n   m e a n i ng,   a   c r i m e   v o c a b ul a r y   i n   E n gl i s h   w a s   us e t o   di s t i n g u i s t h e   s e m a n t i c   m e a ni n o f   t h e   w o r ds .   T hi s   s t e w a s   t o   b e n c h m a r a l l   s e m a n t i c   m e a n i ng  o f   e a c h   E n g l i s w o r t o   a   M a l a y   m e a n i ng  us i n g   f o ur   h u m a c o de r s .   T h e r e f o r e ,   a   l i s t   o f   w i de - r a ngi n c r i m e   vo c a b ul a r y   i n   E n g l i s h   w a s   ob t a i n e o n l i n e   f r o m   Ca m b ri dge   D i c t i o na r y   a n O xf o r D i c t i o na r y .   T h e   di c t i o na r i e s   w e r e   a l s o   us e t o   t r a n s l a t e   E n gl i s h   w o r ds   i nt o   M a l a y ,   a s   s o m e t i m e s   o n e   di c t i o n a r y   a l o n e   w o ul n o t   b e   a b l e   t o   pr o v i de   t h e   M a l a y   e qui v a l e n t   o f   a   w o r s e m a n t i c a l l y .   T h e   h u m a n   c o de r ,   t h e r e f o r e ,   h a t o   de t e rm i n e   t h e   o ut c o m e .   If   n o   M a l a y   t r a n s l a t i o n   o a   w o r c o ul be   fo un i n   e i t h e r   d i c t i o na r y ,   t h e n   t h e   E n g l i s h M a l a y   G oo gl e   T ra n s l a t e   t o o l   w o ul be   us e t o   a t t a i n   a   r o ug h   t r a n s l a t i o n .     3. 4     P h as e   4:   P r o c e s s i n th e   Tr a i n i n g   S e t   o D ata   T h i s   s t e w a s   pe r f o r m e t o   c r e a t e   a   l i s t   o f   c a t e go r i z e n e w s pa pe r   a rt i c l e s   by   c o m pa r i ng  t h e   l i s t   o w o r ds   t ha t   a ppe a r e i n   t h e   n e w s   w i t t h e   l i s t   o f   M a l a y - t ra n s l a t e w o r ds   ga t h e r e f r o m   t h e   p r e v i o us   s t e p   (P ha s e   3).   W h e n   t h e   t e xt   i n   t h e   n e w s   a r t i c l e   ha s   a   m o r e   f re que n t   a ppe a r a n c e   of   c r i m e   w o r ds   i n   a   s pe c i f i c   c a t e go r y   l i s t   (e . g .   M u r de r),   t h e t h e   n e w s   w i l l   b e   c a t e go r i z e u n de r   t h a t   pa rt i c ul a r   c a t e go r y .     3. 5     P h as e   5:   U s i n th e   WEK A   U s i n W E K A   [30] ,   t h e   da t a s e t   w h i c h   w a s   o r i gi na l l y   a   c o l l e c t i o n   of   t e xt   i n   S t ri n f o r m a t   w a s   c o n v e r t e i n t o   e a c h   w o r o a t t ri b ut e   us i n t h e   S t r i ngT o W o r dV e c t o r   f un c t i o n.   I t hi s   s t e p,   u nn e c e s s a r y   a t t ri b ut e s   (f o r   e xa m pl e ,   ‘a d a ,   ‘a ka n ,   e t c . ,   i n   M a l a y w h i c h   m a y   n e ga t i v e l y   a ff e c t   t h e   d a t a   due   t o   a n   ov e r l a pp i n o f   w o r ds   w e r e   f i l t e r e a nd  r e m o v e us i n g   t h e   ke y w o r ds   t h a t   c o ul b e s t   h e l p   t h e   c l a s s i f i c a t i o pr e di c t i o n   w e r e   o b t a i n e d.   T a b l e   s h o w s   a n   e xa m pl e   o f   a   l i s t   o f   w o r ds   (a t t r i b ut e s t ha t   w e r e   s e l e c t e f r o m   t h e   Co rr e l a t i o n A t t ri b ut e E v a l   f e a t u r e   s e l e c t i o n.       T a b l e   3 .   C ri m e   Ca t e go r i e s   a nd  N u m b e r   o f   R e l a t e W o r ds   Ca t e g o ry   N u m b e r   o W o r d s   V i o l e n t   Cri m e s   129   P ro p e rt y   T h e f t   72   A b u s e   77   F o r c e d   L a b o u r   47   W h i t e - c o l l a Cri m e   74   Co n t r o l l e d   S u b s t a n c e s   77   T e rro ri s m   52   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Com pi l a t i on  o f   m al a y   c r i m i n ol og i c a l   t e r m s   f r om   onl i ne   n e w s   ( J oanna   Chi e w   L i ng  L e e )   359   3. 6 .       P h as e   6:   F e atu r e   S e l e c t i o n     P h a s e   i n v o l ve fe a t ur e   s e l e c t i o n ,   a l s o   kn o w n   a s   a t t r i b ut e   s e l e c t i o n ,   t o   r e m o v e   n o i s e   fe a t u r e .     In  t hi s   s t udy ,   t h e   G a i n R a t i o A t t r i b ut e E v a l ,   I n f o G a i n A t t r i b ut e E v a l   a n Co rr e l a t i o n A t t ri b ut e E v a l   f e a t u r e   s e l e c t i o n   a l go ri t hm s   a nd  a p pl i e ra n s e a r c h   a s   a l go r i t h m s   w e r e   us e d.   By   us i n t hr e e   di f f e r e n t   f e a t u r e   s e l e c t i o n   a l go ri t hm s ,   t h e   c o n s i s t e n c y   of   t h e   s t udy ’s   e v a l ua t i o n   c o ul b e   pr o ve n .   T h e   b e s t   500  e xt r a c t e ke y w o r ds   t ha t   c o ul b e s t   h e l p   t h e   c l a s s i f i c a t i o p r e di c t i o n   w e r e   o b t a i n e d .   T a b l e   3   s h o w s   a n   e xa m pl e   o f   a   l i s t   of   w o r ds   (a t t ri b ut e s t ha t   w e r e   s e l e c t e f r o m   t h e   Co rr e l a t i o nA t t r i b ut e E v a l   f e a t u r e   s e l e c t i o n .     3 . 7     P h as e   7:   M o d e l   Ev al u ati o n / V al i d ati o n   In  P h a s e   7,   t h e   c l a s s i f i e s e t   o f   t e r m s   w a s   e v a l ua t e d.   N a ï v e   B a y e s   c l a s s i f i e r   w a s   us e t o   c a t e go r i z e   t h e   da t a s e t   a s   i t   i s   a   s i m pl e   p r o b a b i l i s t i c   c l a s s i f i e w h i c h   i s   e ff e c t i v e   i n   a n a l y z i n g   t e xt   i m a n y   do m a i n s .   P a rt i c ul a r   c l a s s i e r   w a s   s e l e c t e be c a us e   i t   w a s   s uc c e s s f ul l y   a ppl i e i t e xt   a na l y s i s   i t h e   p a s t   s t udy   of   [31] M o r e ov e r ,   s i n c e   t h e r e   w e r e   s e v e n   di f fe r e n t   c a t e go r i e s   of   c r i m e   t o   b e   c l a s s i f i e d,   N a ï v e   B a y e s   w a s   c h o s e n   a s   i t   i s   k n o w n   f o r   m ul t i - c l a s s   p r e di c t i o n   w h i c h   c o ul ge n e ra t e   b e t t e r   o ut pu t   f o r   t e xt   a na l y s i s .   T h e   o ut put   m o de l   w a s   e v a l ua t e t hr o ug h   c o rr e c t l y   c l a s s i f i e i n s t a n c e s ,   i n c o rr e c t l y   c l a s s i f i e i n s t a n c e s ,   r e c a l l ,   p r e c i s i o n ,   F - m e a s u r e ,   a n d   R O A r e a .       4.   R ES U LTS   4 . 1     P ar 1 L i s o c r i m e   w o r d s   ac c o r d i n to   th e   c at e go r y   L i s t   of   w o r ds   w a s   ga t h e r e t hr o ug h   t h e   p r o c e s s   of  w o r s e a r c hi n r e l a t e t o   e a c h   c r i m e   c a t e go r y .   F r o m   t h e   s e v e n   c a t e go r i e s   o f   c r i m e ,   a   t o t a l   o f   724  c r i m e   t e rm i n o l o gi e s   w e r e   c o l l e c t e d.   F o l l ow i n g   t h e   c o n v e r s i o n   of   w o r ds   i n t o   M a l a y ,   a   t o t a l   of   521  c r i m e   w o r ds   w e r e   l e f t ,   o n e   of   t h e   e xa m pl e s   c a n   b e   s e e n   i F i gu r e   2.   D ue   t o   t h e   na t u r e   o f   l a n gu a ge ,   s o m e   M a l a y - t r a n s l a t e w o r ds   a ppe a r e t o   b e   s i m i l a r.   It   f o l l ow s   t h a t   i f   s i m i l a r   w o r ds   a ppe a r e w i t h i n   t h e   s a m e   c a t e go r y ,   i t   w o u l b e   e l i m i na t e t hus   r e duc i ng  t h e   r e du n da n c y .   T a b l e   s h o w s   t h e   n u m b e r   o f   w o r ds   t ha t   r e p r e s e n t   e a c h   c ri m e   c a t e go r y .   T h e   w o r ds   fo r   e a c h   c a t e go r y   w e r e   t h e ut i l i z e d   t o   c a t e go ri z e   t h e   t ra i ni n g   s e t .           F i gu r e   2 .   M a l a y   c r i m e   c a t e go r y   a n d   l i s t   o f   w o r ds       4 . 2     P ar 2 N e w s   C at e go r i z a ti o n   fo r   T r ai n i n S e t   Ca t e go ri z a t i o n   p r o c e s s   w a s   do n e   f o r   n e w s   t e xt .   T h e   f r e qu e n c y   of   t h e   w o r ds   a n t h e   c a t e go r y   t w h i c h   t h e y   b e l o n ge de t e r m i n e t h e   c a t e go r y   of   t h e   t e xt   a s   a   w h o l e .   T hus ,   t h e   t ra i ni n s e t   c o n t a i ni n t h e   t e xt   a n i t s   c o rr e s po n di n g   c r i m e   c a t e go r y   w a s   de v e l o p e d .     4 . 3     P ar 3 D ata   P r e - p r o c e s s i n g   In   t h i s   p r o c e s s ,   t h e   da t a s e t   p r e - p r o c e s s i n w a s   a ppl i e t o   t h e   o r i gi na l   da t a s e t .   B y   a ppl y i n a un s upe r v i s e m e t h o o f   f i l t e r i ng  us i ng  S t ri n g T o W o r dV e c t o r   i n   W E K A ,   e a c w o r i n   t h e   t e xt   w a s   c o n v e r t e i n t o   i t s   a t t ri b ut e .   T hi s   l e t o   a n   i n c r e a s e   i n   t h e   t o t a l   num b e r   of   a t t r i b ut e s .   T h e   a ppl i e s t o w o r ds   t h e n   f i l t e r e t h e   a t t ri b ut e s   by   m a t c h i n t h e   s a m e   w o r ds   t o   t h e   e xi s t i n a t t ri b ut e s .   T h i s   p r e - p r o c e s s i n p ha s e   h e l pe o b t a i a t t ri b ut e s   i t h e   t r a i ni n a n d   t e s t   da t a s e t s .       Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   15 ,   N o .   1 J ul y   201 :     3 5 5   -   3 6 4   360   4 . 4     P ar 4 F e atu r e   S e l e c ti o n   A   l i s t   o f   500  m o s t   r e l e v a nt   a t t ri b ut e s   i n   t h e   c o nt e nt   o f   t h e   o ut put   w a s   f i na l i z e d.   A t t ri b ut e s   w i t h   a   l o w   c o r r e l a t i o n   w e r e   dr o ppe f r o m   t h e   l i s t   a n t h us   i m p r o v e t h e   c l a s s i f i e r ’s   pr e d i c t i o n,   a s   t h e y   w o ul n o   l o n ge a f fe c t   t h e   o ut put .   Co rr e l a t i o n A t t ri b ut e E v a l   w a s   a ppl i e a s   fe a t u r e   s e l e c t i o n .   R a n ke r   S e a r c h   m e t h o w a s   a ppl i e a s   w e l l .     4 . 5     P ar 5 C l as s i fi c ati o n   T h e   r e s ul t s   o f   t h e   N a ï v e   B a y e s   c l a s s i f i e r   us i n f o ur   di f f e r e n t   f e a t ur e   s e l e c t i o n s   a r e   s h o w n   i T a b l e   4.   T h i s   e v a l ua t i o n   di s p l a y s   t h e   a c c u r a c y   of   t h e   m o de l   b a s e o n   t h e   da t a s e t s   t h a t   w e r e   i n put   i nt o   t h e   W E K A   M a c hi n e   L e a rn i n g   t o o l .       T a b l e   4 .   R e s ul t s   o f   Cl a s s i f i e A c c ura c y   Cl a s s i fi e r   F e a t u r e   S e l e c t i o n   Co rr e c t l y   Cl a s s i fi e d   In s t a n c e   (% )   In c o rr e c t l y   Cl a s s i fi e d   In s t a n c e   (% )   K a p p a   S t a t i s t i c s   N a ï v e   Ba y e s   N o n e   8 2 . 5 0   1 7 . 5 0   0 . 7 8 8 2   N a ï v e   Ba y e s   G a i n Ra t i o A t t ri b u t e E v a l   7 8 . 7 5   2 1 . 2 5   0 . 7 4 2 5   N a ï v e   Ba y e s   In fo G a i n A t t ri b u t e E v a l   7 8 . 7 5   2 1 . 2 5   0 . 7 4 2 5   N a ï v e   Ba y e s   Co rr e l a t i o n A t t r i b u t e E v a l   8 3 . 7 5   1 6 . 2 5   0 . 8 0 4 0   A v e ra g e   8 0 . 9 4   1 9 . 0 6   0 . 7 6 9 3       F r o m   T a b l e   4,   i t   c a n   b e   s e e n   t ha t   t h e   c o rr e c t l y   c l a s s i f i e d   i n s t a n c e   b a s e o n   t h e   w e i gh t e a v e r a ge   of  t h e   fo ur   r e s ul t s   i s   80. 9 4% .   T hi s   n o t   o n l y   s h ow s   t h e   c l a s s i f i c a t i o n ’s   hi g h   a c c ur a c y   b ut   a l s o   s i g n i f i e s   t h a t   o f   t h e   80  i n s t a n c e s   f r o m   t h e   t e s t   d a t a s e t ,   t h e   m o de l   m a na ge t o   v a l i da t e   80. 94 o f   t h e m .   K a ppa   s t a t i s t i c   r e p r e s e nt s   a g r e e m e nt   ra n ge   b e t w e e n   ob s e r v e r s   a n pe r f e c t   a g r e e m e n t   i s   e qua l   t o   a   ka ppa   o f   [32] .   B a s e o n   t h e   ka pp a   s t a t i s t i c s ,   t h e   a v e ra ge   o f   0. 7693  s u gge s t s   t ha t   t h e   c l a s s i f i c a t i o n   d i n o t   p r o v i de   m uc h   r o o m   f o r   ra n do m   gue s s i n g .   T o   o b t a i n   a   m o r e   c o m pr e h e n s i v e   a na l y s i s   of  t h e   r e s ul t s ,   t h e   de t a i l e a n a l y s i s   of   W E K A     o ut put s   w a s   s t ud i e d.     T a b l e   s h o w s   t h e   a c c ur a c y   of   t h e   a na l y s i s   b a s e o n   e a c h   c l a s s   f r o m   t h e   Co rr e l a t i o n A t t ri b ut e E v a l   f e a t ur e   s e l e c t i o n   o ut put .   B a s e o n   t h e   a v e ra ge   o f   pr e c i s i o n   =   0. 882 ,   r e c a l l   =   0 . 83 a nd  f - m e a s u r e   =   0 . 839 ,   t h e   r e s ul t s   s ugge s t   t h a t   t h e   c l a s s i f i c a t i o n   w a s   r e l i a b l e   a n a c c ura t e   f o r   m o s t   c l a s s e s .   T h e   R O [33]  a r e a   a l s o   pr o duc e a   h i g h   s t a t i s t i c   (R O A r e a   =   0. 980) ,   r e f l e c t i n h i g h   a c c u r a c y   i n   t h e   t e s t .   A c c ur a c y   i s   m e a s ur e b y   t h e   a r e a   u n de t h e   R O c u r v e ,   w h e r e by   t h e   c l o s e r   t h e   c ur v e   i s   t o   t h e   Y - a xi s ,   t h e   b e t t e t h e   r e s ul t   w i l l   b e .   F i gu r e   f e a t ur e s   t h e   t o 10  w o r ds   f r o m   t h e   s e v e n   c r i m e   c a t e go r i e s .   T h e   c l a s s i f i e r   w i t h   t h e   Co rr e l a t i o n A t t ri b ut e E v a l   f e a t u r e   s e l e c t i o n   w i t t h e   hi g h e s t   a c c ur a c y   i s   s h o w n   i n   T a b l e   5.   T h e   a t t ri b ut e s   f r o m   t h e   c l a s s i f i e w e r e   s e l e c t e f r o m   t h e   o ut pu t   o f   t h e   f e a t ur e   s e l e c t i o n   p r o c e s s ,   a nd  t h e   w o r ds   ( a t t r i b ut e s t ha t   m a t c h e t h e   l i s t   o f   c r i m e   w o r ds   w e r e   s e l e c t e t o   be   i n   t h e   t o 10  w o r ds   f r o m   t h e   c ri m e   c a t e go r y .   F i gu r e   r e c o r ds   t h e   r e s ul t s   w h e r e   e a c h   c a t e go r y   h a s   i t s   o w n   s e t   of   t o 10  w o r ds   fo l l ow e by   t h e   ra n o f   e a c h   w o r d,   w h i c a f f e c t s   t h e   t e x t   c l a s s i f i c a t i o n.   W h i l e   t h e r e   a r e   w o r ds   t ha t   i de n t i fy   e a c h   c a t e go r y ,   t h e r e   i s   t h e   i s s ue   o f   ov e r l a pp i n w o r ds   i n   m o r e   t h a n   o n e   c a t e go r y .   F o r   i n s t a n c e ,   i n   t h e   ‘J e n a y a h   H a r t a b e nda ’  a n ‘J e na y a h   K o l a r   P ut i h’  c a t e go r i e s ,   t h e   w o r ‘c ur i   i s   e v i de n t   i n   b o t h .   T h e   c l a s s i f i e rm a y   m a na ge   t o   c l a s s i f y   t h e   t e xt   i nt o   i t s   c o rr e s po n di ng  c a t e go r y   due   t o t h e r e l a t e w o r ds   w i t h i a   p a r t i c ul a c a t e go r y .       T a b l e   5 .   A   de t a i l e d   a na l y s i s   b a s e o n   t h e   N a ï v e   B a y e s   Cl a s s i f i e r   w i t h   Co rr e l a t i o n   A t t r i b ut e   E v a l   f e a t ur e   s e l e c t i o n   Cl a s s   T P   Ra t e   F P   Ra t e   P re c i s i o n   Re c a l l   F - M e a s u re   M CC   RO A r e a   P RC  A r e a   Ba h a n - b a h a n   T e rk a w a l   0 . 7 7 8   0 . 0 0 0   1 . 0 0 0   0 . 7 7 8   0 . 8 7 5   0 . 8 5 5   0 . 9 7 2   0 . 9 5 5   Bu ru h   P a k s a   0 . 8 3 3   0 . 0 0 0   1 . 0 0 0   0 . 8 3 3   0 . 9 0 9   0 . 9 0 7   0 . 9 2 8   0 . 8 6 0   J e n a y a h   H a rt a b e n d a   0 . 7 7 8   0 . 0 0 0   1 . 0 0 0   0 . 7 7 8   0 . 8 7 5   0 . 8 5 5   0 . 9 8 9   0 . 9 7 0   J e n a y a h   K e k e ra s a n   1 . 0 0 0   0 . 1 5 4   0 . 6 0 0   1 . 0 0 0   0 . 7 5 0   0 . 7 1 3   0 . 9 8 5   0 . 9 3 6   J e n a y a h   K o l a P u t i h   1 . 0 0 0   0 . 0 2 9   0 . 8 3 3   1 . 0 0 0   0 . 9 0 9   0 . 9 0 0   0 . 9 9 0   0 . 9 0 6   P e n d e ra a n   0 . 4 2 9   0 . 0 1 4   0 . 7 5 0   0 . 4 2 9   0 . 5 4 5   0 . 5 3 8   0 . 9 7 5   0 . 8 0 0   P e n g g a n a s a n   1 . 0 0 0   0 . 0 0 0   1 . 0 0 0   1 . 0 0 0   1 . 0 0 0   1 . 0 0 0   1 . 0 0 0   1 . 0 0 0   W e i g h t e d   A v e .   0 . 8 3 8   0 . 0 3 4   0 . 8 8 2   0 . 8 3 8   0 . 8 3 9   0 . 8 2 1   0 . 9 8 0   0 . 9 3 1       Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Com pi l a t i on  o f   m al a y   c r i m i n ol og i c a l   t e r m s   f r om   onl i ne   n e w s   ( J oanna   Chi e w   L i ng  L e e )   361           F i gu r e   3 .   T o 10   w o r ds   f r o m   e a c h   c r i m e   c a t e go r y       T a b l e   r e p r e s e nt s   t h e   c a t e go r y   of   c r i m e   a n i t s   r e s pe c t i v e   t e xt s .   T h e   f r e que n c y   of   t h e   w o r ds   i n   e a c t e xt   c o n t r i b ut e s   t o   t h e   w o r ds   t h a t   de s c r i b e   t h e   c a t e go r y .   A t   l e a s t   o n e   of   t h e   t o 10  w o r ds   us e i n   e a c c a t e go r y   i s   pr e s e n t   w i t hi n   t h e   t e x t .   F o r   e xa m p l e ,   t h e   w o r d s   ‘m a t i ,   ‘m a y a t ’  a n ‘c e de r a ’  a r e   a m o n t h e   t o 10  w o r ds ,   w hi c h   de s c ri b e   t h e   p r e v a l e n c e   o f   v i o l e n t   c ri m e s   i n   t h e   r e p r e s e n t a t i v e   t e xt .       T a b l e   6 .   T h e   C a t e go r y ,   R e pr e s e n t a t i v e   S e n t e n c e s   a n d   W o r ds   D e s c r i b i n g   t h e   Ca t e go r y   Ca t e g o ry   Re p r e s e n t a t i v e   s e n t e n c e   W o r d s   d e s c ri b i n g   c a t e g o r y   J e n a y a h   K e k e ra s a n   s e o ra n g   l e l a k i   w a r g a   i n d o n e s i a   m a t i   s e l e p a s   t e r b a b i t   d a l a m   p e r g a d u h a n   d e n g a n   ra k a n   s e n e g a ra n y a   d i   k e d i a m a n   m e r e k a   d i   k a m p u n g   b u l u h   p e n y u m p i t ,   m u k i m   k u a h   d i   s i n i ,   h a ri   i n i .     k e t u a   b a h a g i a n   s i a s a t a n   j e n a y a h   l a n g k a w i ,   a s i s t e n   s u p e ri n t e n d a n   b e e   a n a k   a m b a ,   b e rk a t a   m a y a t   l e l a k i   b e ru s i a   3 8   t a h u n   y a n g   b e l u m   d i k e n a l i   i t u   d i t e m u i   b e rl u m u ra n   d a ra h   d i   a t a s   s o f a   d a l a m   ru m a h   t e r b a b i t   p a d a   j a m   6 .   1 5   p a g i .   s i a s a t a n   a w a l   m e n d a p a t i   m e r e k a   b e r g a d u h   s e b e l u m   m a u t   m a n a k a l a   ra k a n n y a   c e d e ra     J e n a y a h   H a rt a b e n d a   e m p a t   l e l a k i   y a n g   c u b a   m e r o m p a k   k e d a i   e m a s   d i   j a l a n   b e s a s a s a ra n ,   k u a l a   s e l a n g o r ,   p a g i   s e m a l a m ,   m e l a ri k a n   d i r i   d e n g a n   t a n g a n   k o s o n g   s e l e p a s   g a g a l   m e m e c a h k a n   c e r m i n   p a m e ra n   b a ra n g   k e m a s .   k e t u a   p o l i s   d a e ra h   k u a l a   s e l a n g o r,   s u p e ri n t e n d a n   ru s l a n   a b d u l l a h   b e rk a t a ,   k e j a d i a n   b e rl a k u   p a d a   1 1 . 3 5   p a g i   d a n   t i a d a   p e l a n g g a n   k e t i k a   i t u .       J e n a y a h   K o l a P u t i h   d u a   k o n s t a b e l   p o l i s   d i t a h a n   s u ru h a n j a y a   p e n c e g a h a n   ra s u a h   m a l a y s i a   ( s p rm p e t a n g   t a d i   s e l e p a s   d i s y a k i   m e m i n t a   ra s u a h   d a r i p a d a   c e t i   h a ra m   a t a u   a l o n g   d i   s u n g a i   p e t a n i .   s u m b e b e rk a t a ,   k e d u a   -   d u a   a n g g o t a   b e ru s i a   3 4   d a n   3 7   t a h u n   i t u   d i t a h a n   s p r m   c a w a n g a n   s u n g a i   p e t a n i   p a d a   2   p e t a n g   t a d i .   a n g g o t a   p o l i s   t e r b a b i t   d i t a n g k a p   k e ra n a   t e r b a b i t   d a l a m   p e r m i n t a a n   w a n g   ra s u a h   b e rj u m l a h   rm   1 0 , 0 0 0   d a ri p a d a   p e n g a d u   y a n g   m e n j a l a n k a n   k e g i a t a n   p e m i n j a m a n   w a n g   h a ra m .     P e n d e ra a n   s e o ra n g   w a n i t a   h o n g   k o n g   d i s a b i t   k e s a l a h a n   m e m u k u l ,   m e n y e k s a ,   d a n   m e m b i a rk a n   p e m b a n t u   ru m a h n y a   y a n g   j u g a   w a rg a   i n d o n e s i a   k e l a p a ra n ,   d a l a m   k e s   y a n g   m e n c e t u s k a n   k e m a ra h a n   p e n d u d u k   re p u b l i k   n e g a ra   t e r s e b u t ,   t a h u n   l a l u .   k e p u t u s a n   i t u   d i b a c a k a n   d i   d a l a m   k a m a m a h k a m a h ,   d i s a m b u t   s o ra k a n   p e n y o k o n g   e r w i a n a   s u l i s t y a n i n g s i h   y a n g   m e ru p a k a n   b e k a s   p e m b a n t u   ru m a h ,   l a w   w a n   -   t u n g .   w a n - t u n g ,   4 4 ,   i b u   k e p a d a   d u a   o ra n g   a n a k   i t u ,   d i t a n g k a p   p a d a   j a n u a ri   t a h u n   l a l u   d a n   h u k u m a n   t e r h a d a p n y a   a k a n   d i p u t u s k a n   p a d a   2 7   fe b ru a ri   i n i .     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   15 ,   N o .   1 J ul y   201 :     3 5 5   -   3 6 4   362   Bu ru h   P a k s a   s e ra m a i   1 7   w a rg a   a s i n g   t e r m a s u k   e n a m   k a n a k   -   k a n a k   b e rj a y a   d i s e l a m a t k a n   o l e h   p o l i s   s e m a l a m ,   s e l e p a s   d i k e s a n   m e n j a d i   b u ru h   p a k s a   s a t u   s i n d i k e t   u n t u k   m e n g e m i s   d i   b e b e ra p a   l o k a s i   p a s a m a l a m   d i   p u c h o n g .   k e t u a   p e n o l o n g   p e n g a ra h   b a h a g i a n   k o n g s i   g e l a p ,   j u d i   d a n   m a k s i a t   ( d 7 b u k i t   a m a n   s e n i o a s i s t e n   k o m i s i o n e r o h a i m i   m d   i s a   b e rk a t a ,   s e m u a   p e n g e m i s   b e ru s i a   a n t a ra   d u a   t a h u n   h i n g g a   5 0 - a n   y a n g   d i s e l a m a t k a n   i t u   t e r d i ri   d a r i p a d a   d u a   l e l a k i ,   s e m b i l a n   w a n i t a   d a n   e n a m   k a n a k   -   k a n a k .     Ba h a n - b a h a n   T e rk a w a l   p o l i s   m e n a h a n   l i m a   i n d i v i d u ,   t e r m a s u k   t i g a   w a rg a   a s i n g   d a n   m e ra m p a s   p e l b a g a i   j e n i s   d a d a h   d i a n g g a rk a n   b e r n i l a i   rm   6 . 7   j u t a   s e p a n j a n g   a w a l   b u l a n   i n i   s e h i n g g a   k e l m a ri n .   p e n g a ra h   j a b a t a n   s i a s a t a n   j e n a y a h   n a rk o t i k   (j s j n b u k i t   a m a n ,   d a t u k   s e ri   n o o ra s h i d   i b ra h i m ,   b e rk a t a   p o l i s   t u ru t   b e rj a y a   m e m b o n g k a s a t u   m a k m a l   d a d a h   m e m p ro s e s   d a n   m e m b u n g k u s   p i l   e k s t a s i   y a n g   b e ro p e ra s i   d i   s e b u a h   k o n d o m i n i u m   d i   j a l a n   k u c h a i   m a j u   p a d a   j u m a a t   l a l u .       P e n g g a n a s a n   p i h a k   b e rk u a s a   t u rk i   t e l a h   m e m b u n u h   h a m p i r   9 0 0   o ra n g   y a n g   d i d a k w a   a n g g o t a   k u m p u l a n   m i l i t a n   n e g a ra   i s l a m   ( i s s e j a k   j a n u a ri   l a l u ,   k a t a   a g e n s i   b e ri t a   k e ra j a a n ,   a n a t o l i a   y a n g   m e m e t i k   s u m b e k e t e n t e ra a n   n e g a ra   i t u .   m e n u ru t   a n a t o l i a ,   d a ri p a d a   j u m l a h   i t u ,   s e ra m a i   4 9 2   '   p e n g g a n a s   '   t e l a h   d i b u n u h   m e n e ru s i   s e ra n g a n   u d a r a   m a n a k a l a   3 7 0   l a g i   t e r b u n u h   d a l a m   b e b e ra p a   s e ra n g a n   m e ri a m   y a n g   m e m u s n a h k a n   d e p o t   s e n j a t a   m e r e k a .   b a g a i m a n a p u n ,   a n g k a   k e m a t i a n   i t u   t i d a k   d a p a t   d i s a h k a n   s e c a ra   b e b a s   s e t a k a t   i n i .         5.   C O N C LU S I O N   A N D   F U TU R W O R K   B a s e o n   t h e   v a l i d a t i o n   o f   t h e   c l a s s i f i c a t i o n   f r o m   t h e   M a c hi n e   L e a rni n t o o l   o n   di f f e r e n t   f e a t u r e   s e l e c t i o n s ,   t h e   r e s ul t s   o f   r e c a l l   =   0 . 838 ,   p r e c i s i o n   =   0 . 882 ,   f   m e a s u r e   =   0. 83 a n R O A r e a   =   0. 9 80  p r o v e d   t h a t   t h e   de t e r m i n e r e s ul t s   a r e   a c c ura t e .   I t   c a n   a l s o   be   c o n c l ude t ha t   t h e   w o r l i s t   us e t o   c a t e go r i z e   t h e   t e xt   f r o m   t h e   a rt i c l e s   i s   a c c ura t e   s i n c e   t h e   a v e ra ge c o rr e c t l y   c l a s s i f i e i n s t a n c e   w a s   r e c o r de a t   80 . 94% .   M o r e ov e r ,   t h e   b ui l t   m o de l   w a s   a b l e   t o   ge n e r a t e   a   hi g h   pe r c e nt a ge   o f   c o r r e c t l y   c l a s s i f i e i n s t a n c e s .   T h e r e fo r e ,   t h e   521  w o r ds   i n   t h e   c r i m e   w o r l i s t   c a n   b e   us e i n   f ut ur e   w o r t o   a s s i s t   i n   t h e   t a gg i n o f   c r i m e   i n   t h e   M a l a y   l a n gu a ge .   F o l l ow i n t h e   s a t i s f a c t o r y   r e s ul t s   o b t a i n e i t hi s   s t udy ,   i t   i s   s ugge s t e t h a t   i f ut u r e   r e s e a r c h,     a   s t e m m e r / l e m m a t i z e r   c o ul b e   a ppl i e t o   t h e   da t a s e t   t o   a c q ui r e   a   c l e a n e r   da t a s e t .   S t e m m i n i s   t h e   p r o c e s s   o r e duc i n de r i v e w o r ds ,   s t ha t   a   ge n e ra l   t e r m   c o ul b e   ge n e r a t e d.   I n   t hi s   s t udy ,   t h e   a t t ri b ut e s   c o n t a i n e a   m ul t i p l e   o f   t h e   s a m e   w o r ds   b ut   w i t h   d i f f e r e n t   p r e f i xe s   o n t o   i t   s uc h   a s   m e m - ,   ‘pe r - ‘,   - a n’  e t c .   D ue   t o   t h e s e   pr e f i xe s ,   t h e   f i l t e r e da t a s e t   s t i l l   c a rr i e a t t r i b ut e s   t ha t   r e p r e s e n t   t h e   s a m e   w o r ds   i d i f fe r e nt   f o r m s .   T h e r e f o r e ,   t h e   a p pl i c a t i o n   o f   a   l e m m a t i z e r   w o ul b e   a b l e   t o   p r o duc e   a   m o r e   l e gi t i m a t e   s e t   o f   w o r ds .   O n e   o t h e   i m p r o v e m e n t s   f o r   f ut ur e   s t ud y   c a n   b e   de a l i n w i t h   t h e   m ul t i - c l a s s i f i c a t i o n   o f   t h e   w o r ds .   W h e n   t h e   t e xt   c a n   e xi s t   i m o r e   t ha n   o n e   c a t e go r y ,   kn o w n   a s   m ul t i - l a b e l   c l a s s i f i c a t i o n.   T h e r e f o r e ,   i n   f ut u r e   w o r k,   t h e   m ul t i - l a b e l   c l a s s i f i c a t i o n   s h o ul b e   t a ke i nt o   c o n s i de ra t i o n   f o r   i n s t a n c e s   w h e r e   w o r ds   m a y   e xi s t   i m o r e   t ha o n e   c a t e go r y .       R EF ER EN C ES   [ 1]   H .   S h i ,   W .   Z h a n ,   a n X .   L i ,   A   S upe r v i s e F i n e - G r a i ne d   S e n t i m e nt   A na l y s i s   S y s t e m   f o r   O nl i ne   R e v i e w s ,   I n t e l l .   A ut om .   Sof t   C om pu t . ,   v o l .   2 1,   no .   4 ,   p p.   58 9 - 605 ,   2 015 .   [ 2]   A .   Y .   N o ui r a ,   Y .   J a m o us s i ,   a n H .   B .   G .   H a j j a m i ,   E xt r a c t i ng   A c t i o ns   w i t I m pr o v e P a r t   o f   S pe e c T a g g i ng   f o r   S o c i a l   N e t w o r k i ng   T e xt s ,   i 2 016  I E E E   I n t e r na t i ona l   C on f e r e nc e   on  C om put e r   an I n f o r m at i on  T e c h nol ogy   ( C I T ) ,   20 16 ,   p p.   16 1 - 166 .   [ 3]   O .   F .   W .   O n i f a d e   a nd  M .   A .   M a l i k ,   S A S M :   A   t o o l   f o r   s e nt i m e nt   a na l y s i s   o T w i t t e r ,   i 20 15  2nd  W or l d   Sy m po s i um   on   W e A ppl i c a t i ons   a nd  N e t w or k i ng   ( W S W A N ) ,   2015 ,   pp.   1 - 5.   [ 4]   Y .   B a t c h,   M .   M .   Y us o f a ,   S .   A .   M .   N o a ha ,   a nd  T .   P .   L e e ,   M T a g:   A   m o de l   t o   e na b l e   c o l l a bo r a t i v e   m e di c a l   t a g g i ng  i m e di c a l   bl o g s ,   P r oc e di a   C om p ut .   Sc i . ,   v o l .   3 ,   pp .   7 85 - 790 ,   2011 .   [ 5]   S .   P i a o   e t   a l . ,   L e xi c a l   C o v e r a g e   E v a l ua t i o o f   L a r g e - s c a l e   M u l t i l i ng ua l   S e m a n t i c   L e xi c o ns   f o r   T w e l v e   L a ng ua g e s ,   i n   10 t h   e di t i o o f   t he   L ang uage   R e s ou r c e s   and   E v al ua t i o C onf e r e nc e ,   201 6,   pp .   26 15 - 2619 .   [ 6]   P .   R a y s o n,   F r o m   K e y   W o r ds   t o   K e y   S e m a nt i c   D o m a i ns ,   I n t .   J .   C or p us   L i n gui s t . ,   v o l .   13 ,   no .   4,     pp.   51 9 54 9,   20 08.   [ 7]   D a w nA r c he r ,   S l ur s ,   I ns ul t s ,   ( B a c kha n de d )   C o m pl i m e n t s   a n O t he r   S t r a t e g i c   F a c e w o r M ov e s ,   L ang .   Sc i .   v o l .   52,   p p.   82 - 97 ,   201 5.   [ 8]   A .   T e e uw ,   T h e   H i s t o r y   of   t he   M a l a y   L a ng ua g e ,   i M o de r I n don e s i an  l i t e r a t u r e .   K oni nk l i j k   I ns t i t uu t   v oo r   T aa l - L and -   E n   V o l k e nk unde ,   196 7,   pp .   4 - 7.   [ 9]   S .   K üb l e r   a nd  E .   M o ha m e d ,   P a r t   o f   S pe e c T a g g i ng   f o r   A r a bi c ,   N at .   L a ng .   E ng . ,   v o l .   18 ,   no .   4,     pp.   52 1 - 548,   2 011 .   [ 10]   R .   B a r - ha i m ,   K .   S i m a a n ,   a nd  Y .   W i nt e r ,   P a r t - of - S pe e c T a gg i ng   o f   M o de r H e br e w   T e x t ,   N at .   L ang .   E ng . ,   v o l .   14,   no .   2,   p p.   22 3 - 251,   2 008 .   [ 11]   M .   K o l e v a ,   M .   F a r a s y n,   B .   D e s m e t ,   A .   B r e i t ba r t h,   a nd  V .   H o s t e ,   A A ut o m a t i c   P a r t - of - S pe e c T a gg e r   f o r   M i ddl e   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Com pi l a t i on  o f   m al a y   c r i m i n ol og i c a l   t e r m s   f r om   onl i ne   n e w s   ( J oanna   Chi e w   L i ng  L e e )   363   L o w   G e r m a n ,   I nt .   J .   C O R P U L i ngu i s t . ,   v o l .   2 2,   no .   1 ,   p p.   10 8 - 1 4 1,   201 7.   [ 12]   W .   A nw a r ,   X .   W a ng ,   L .   L i ,   a nd  X . - L .   W a ng ,   A   S t a t i s t i c a l   B a s e P a r t   o f   S pe e c T a gg e r   f o r   U r du  L a ng ua g e ,   i St a t i s t i c a l   B as e d   P ar t   of   S pe e c T agge r   f or   U r d L angu age ,   2007 ,   pp.   34 18 - 3424 .   [ 13]   C .   M y i nt ,   A   H y br i A ppr o a c f o r   P a r t - of - S pe e c T a g g i ng   o f   B ur m e s e   T e xt s ,   i 20 11  I nt e r n at i ona l   C o nf e r e nc e   on  C om put e r   an M an age m e nt   ( C A M A N ) ,   2011 ,   pp .   1 - 4.   [ 14]   V .   V .   P e t r o c he nko v   a nd  A .   O .   K a z e nn i ko v ,   A   S t a t i s t i c a l   T a g g e r   f o r   M o r pho l o g i c a l   T a g g i ng   o f   R us s i a L a ng ua g e   T e xt s ,   A ut om .   R e m ot e   C on t r ol ,   v o l .   74 ,   no .   10,   p p.   17 24 - 1732 ,   201 3.   [ 15]   T. - H .   C ha ng ,   F . - Y .   H s u,   C . - H .   L e e ,   a nd  H . - M .   L e e ,   P a r t - of - S pe e c T a gg i ng   f o r   C hi ne s e   U nk no w W o r ds   i A   D o m a i n - S pe c i f i c   S m a l l   C o r pu s   U s i ng   M o r p ho l o g i c a l   a nd  C o nt e x t u a l   R ul e s ,   i n   P r oc e e di ngs   of   t he   6t h   I nt e r n at i on al   C on f e r e nc e   on  N at ur a l   L angu age   P r oc e s s i ng   and  K now l e dge   E ngi ne e r i ng( N L P K E - 2010)   2010 ,   pp.   1 - 6.   [ 16]   K .   S m i t h,   B .   M e g y e s i ,   S .   V e l up i l l a i ,   a n M .   K v i s t ,   P r o f e s s i o na l   L a ng ua g e   i S w e di s C l i n i c a l   T e x t :   L i ng ui s t i c   C ha r a c t e r i z a t i o a n C o m pa r a t i v e   S t u di e s ,   N or d .   J .   L i n gui s t . ,   v o l .   37,   no .   2,   p p.   29 7 - 323,   2 014 .   [ 17]   I .   P a a nd  P .   L .   T e h ,   T e x t   S e g m e n t a t i o T e c hni que s :   A   C r i t i c a l   R e v i e w ,   i S t u di e s   i C om pu t at i o nal   I nt e l l i ge nc e ,   I .   Z e l i nk a   e t   a l . ,   E d .   S pr i ng e r   I nt e r na t i o na l   P u b l i s h i ng   A G   2018,   201 8,   p p.   16 7 - 181.   [ 18]   S .   M .   A l i   a nd  P .   K r i s h ,   G e nde r - S pe c i f i c   E ng l i s h   L a ng ua g e   U s e   o f   M a l a y s i a B l o g   A ut ho r s ,   J .   L ang .   S t ud . ,   v o l .   16,   no .   3,   p p.   21 - 35 ,   201 6.   [ 19]   M .   O .   D .   P o r t a l ,   J e n a y a i nd e k   S e l ur uh   M a l a y s i a ,   D at f o r   C i t i z e W e l l be i ng ,   2 018 .   .   [ 20]   M .   M a hm o o d,   T e r r o r i s m -   D e f i ni t i o A nd  T y pe s ,   20 16 .   [ O nl i n e ] .   A v a i l a bl e :   ht t ps : / / c ha i ns o f f . f i l e s . w o r dp r e s s . c o m / 2016/ 1 1/ t e r r o r i s m - de f i n i t i o n - a nd - t y pe s . pdf .   [ A c c e s s e d:   02 - J un - 201 7] .   [ 21]   S .   W he e l e r ,   W hi t e   C o l l a r   C r i m e s   a nd  C r i m i na l s ,   F ac u l t y   S c hol ar s hi Se r i e s ,   1988 .   [ O nl i ne ] .   A v a i l a bl e :   h t t p: / / di g i t a l c o m m o ns . l a w . y a l e . e du / f s s _p a pe r s / 41 27/ .   [ A c c e s s e d:   02 - J un - 2017] .   [ 22]   B .   T .   Y e h,   D r ug   O f f e ns e s :   M a x i m um   F i n e s   a nd   T e r m s   o f   I m pr i s o nm e nt   f o r   V i o l a t i o o f   t h e   F e de r a l   C o nt r o l l e d   S ubs t a nc e s   A c t   a nd   R e l a t e d   L a w s ,   i n   C on gr e s s i on al   R e s e ar c h   Se r v i c e ,   20 1 5 ,   p p.   1 - 14 .   [ 23]   N S P C C ,   T h e   D e f i n i t i o ns   a nd  S i g ns   o f   C hi l A bus e   ( N S P C C   C h i l P r o t e c t i o F a c t   S he e t ) , ”  on l i ne   C hi l P r ot .   R e s our . ,   no .   A pr i l ,   pp .   1 - 9,   200 9.   [ 24]   I T U C ,   F o r c e L a bo ur   G u i de ,   20 08 .   [ 25]   S .   W .   B ue l l ,     W hi t e   C o l l a r     C r i m e s ,   p p.   83 7 - 861 ,   2 014 .   [ 26]   B .   Y e h,   D r ug   O f f e ns e s :   M a x i m um   F i ne s   a nd  T e r m s   o f   I m pr i s o nm e nt   f o r   V i o l a t i o o f   t he   F e de r a l   C o nt r o l l e d   S ubs t a nc e s   A c t   a nd   R e l a t e d   L a w s ,   C ong r .   R e s .   Se r v . ,   p p .   8 ,   201 5.   [ 27]   J .   A a n Y .   P .   C h e n,   K e y w o r E xt r a c t i o f o r   T e x t   C a t e g o r i z a t i o n,   P r oc .   20 05  I n t .   C on f .   A c t .   M e di T e c hn ol .   2005 .   ( A M T   2005) . ,   pp .   556 - 56 1.   [ 28]   M y V oc a bul a r y . c o m ,   C r i m e   v oc a bul a r y ,   C r i m e   w o r d   l i s t   -   w w w . m y voc a bul a r y . c o m ,   M y V oc a bu l ar y . c om ,   20 18 .   .   [ 29]   C .   T e dd l i e   a nd   F .   Y u ,   M i xe d   M e t ho ds   S a m pl i ng ,   J .   M i x .   M e t hods   R e s . ,   v o l .   1 ,   no .   1 ,   pp .   7 7 - 100 ,   2007 .   [ 30]   M .   H a l l ,   E .   F r a n k,   G .   H o l m e s ,   B .   P f a h r i ng e r ,   P .   R e u t e m a n n,   a n I .   H .   W i t t e n ,   T h e   W E K A   D a t a   M i n i ng   S o f t w a r e ,   A C M   S I G K D D   E x pl o r . ,   v o l .   1 1,   no .   1,   p p.   10 - 18 ,   200 9.   [ 31]   S .   H .   L u,   D .   a .   C hi a ng ,   H .   C .   K e h ,   a nd  H .   H .   H ua ng ,   C hi ne s e   T e xt   C l a s s i f i c a t i o by   t he   N a i v e   B a y e s   C l a s s i f i e r   a nd  t he   A s s o c i a t i v e   C l a s s i f i e r   w i t M u l t i p l e   C o nf i de nc e   T h r e s ho l V a l ue s ,   K now l e dge - B as e Sy s t . ,   v o l .   23,   no .   6 ,   pp.   59 8 - 604,   2 010 .   [ 32]   I .   P a a nd  P .   L .   T e h ,   M a c hi ne   L e a r ni ng   C l a s s i f i e r s :   E v a l ua t i o o f   t he   P e r f o r m a nc e   i O nl i n e   R e v i e w s ,   In di a J .   Sc i .   T e c hno l . ,   v o l .   9 ,   no .   9 45 ,   p p.   97 4 - 6846 ,   2016 .   [ 33]   P .   M a r t í ne z - C a m bl o r ,   C .   C a r l e o s ,   a n N .   C o r r a l ,   G e n e r a l   N o np a r a m e t r i c   R O C   C ur v e   C o m pa r i s o n ,   J .   K or e an   St a t .   So c . ,   v o l .   4 2,   no .   1,   p p.   71 - 81 ,   201 3.       B I O G R A P H I ES   O F   A U T H O R S       D r .   P ho e y   L e e   T e g r a du a t e he r   P hD   i y e a r   201 1,   f r o m   U ni v e r s i t y   P ut r a   M a l a y s i a   ( U P M ) ,   M a l a y s i a .   U nt i l   no w ,   s he   ha s   m o r e   t h a 15  y e a r s   o f   t e a c hi ng   a nd  r e s e a r c e xpe r i e nc e   i hi g he r   e d uc a t i o s e c t o r   a nd  c ur r e nt l y   a A s s oc .   P r o f .   i t he   D e pa r t m e nt   o f   C o m put i ng   a nd  I S   o f   S unw a y   U ni v e r s i t y ,   M a l a y s i a .   S he   ha s   pu bl i s h e d   pa p e r s   i bo t l o c a l   a n i n t e r na t i o na l   pe e r - r e v i e w e j o ur na l s   a n c o nf e r e nc e s .   H e r   c ur r e nt   a r e a   o f r e s e a r c i s   i n   s e nt i m e n t   a na l y s i s ,   f oc us i ng   o bo t t he   l i ng ui s t i c   a ppr o a c i t e xt   a na l y s i s   a n s o c i a l   ne t w o r k   a na l y s i s .   S he   h a s   be e a   m e m b e r   o f   I E E E   s i nc e   201 3a nd   c ur r e n t l y   a a f f i l i a t e m e m be r   o f   U C R E L   R e s e a r c C e nt r e .         J o a nna   C hi e w   L i ng   L e e   r e c e i v e h e r   B a c he l o r s   D e g r e e   i n   C o m put e r   S c i e nc e   f r o m   S unw a y   U ni v e r s i t y ,   M a l a y s i a   i t he   y e a r   201 7.   H e r   m a i a r e a   o f   r e s e a r c h   i s   c ur r e n t l y   i S e nt i m e n t   A na l y s i s .               Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   15 ,   N o .   1 J ul y   201 :     3 5 5   -   3 6 4   364         S i a L un  L a r e c e i v e hi s   D r . - I n g .   i C o m put e r   S c i e nc e   ( I nf o r m a t i k )   a n M S c   i E l e c t r i c a l   C o m m uni c a t i o E ng i ne e r i ng   f r om   t he   U ni v e r s i t y   o f   K a s s e l ,   G e r m a ny .   H e   a l s o   ho l ds   a   B E ng  ( H o ns )   i E l e c t r o ni c s   a n T e l e c o m m uni c a t i o f r o m   U ni v e r s i t i   M a l a y s i a   S a r a w a ( U N I M A S ) .   D ur i ng   hi s   ni n e   y e a r s   ( 200   2013 )   a s   a   r e s e a r c he r   a t   t he   C ha i r   f o r   C om m uni c a t i o T e c hno l o gy   ( C o m T e c )   a t   t h e   U n i v e r s i t y   o f   K a s s e l ,   h e   ha s   w o r ke a nd  m a na g e v a r i o us   G e r m a N a t i o na l -   a nd  E U - f unde r e s e a r c pr o j e c t s .   A m o ng  t he m   a r e   E U   I S T - M o bi L i f e ,   I T E A   S 4 A L L ,   B M B F   M A T R I X   a nd  E U - S E A M 4U S .   H e   j o i ne d   S u nw a y   U ni v e r s i t y ,   M a l a y s i a   i F e br ua r y   2013.   H e   i s   c ur r e n t l y   a A s s o c i a t e   P r o f e s s o r   a t   t he   D e p a r t m e nt   o f   C o m put i ng   a nd   I n f o r m a t i o S y s t e m s   a nd  ho l ds   t h e   r e s po ns i bi l i t y   a s   t he   H e a o f   D e pa r t m e nt .   S i nc e   2015 ,   he   i s   a l s o   t he   A s s o c i a t e   D e a f o r   t he   S c ho o l   o f   S c i e nc e   a nd  T e c hno l o gy .   H e   i s   c ur r e n t l y   a   s e ni o r   m e m be r   o f   t he   I ns t i t u t e   o f   E l e c t r i c a l   a n E l e c t r o ni c s   E ng i ne e r s   ( I E E E )   a nd  s e r v e s   a s   a e xe c ut i v e   c o m m i t t e e   m e m b e r   i t he   I E E E   C o m put e r   S o c i e t y   M a l a y s i a   C ha pt e r   s i nc e   2 017 .   H i s   r e s e a r c i n t e r e s t s   i nc l ud e   ub i qu i t o us   c o m put i ng ,   s us t a i na bl e   s m a r t   c i t y ,   c o nt e xt - a w a r e ne s s   a nd   a pp l i e m a c hi ne   l e a r n i ng .         M r s .   I r i na   P a g r a dua t e he r   B s c .   ( H o ns )   i I nf o r m a t i o S y s t e m   i t he   y e a r   2015  a nd   c ur r e n t l y   a   M a s t e r   s t ud e n t   i S u nw a y   U ni v e r s i t y ,   M a l a y s i a .   S he   ha s   be e t a k i ng   pa r t   t i m e   po s i t i o a s   R e s e a r c A s s i s t a nt   w h i l e   he r   de g r e e   a nd  m a s t e r s   s t udi e s .   U n t i l   no w ,   s h e   ha s   publ i s he d   s e v e r a l   i nt e r n a t i o na l   i n de x e c o nf e r e nc e s   a nd   j o ur na l s .   H e r   r e s e a r c i nt e r e s t s   i nc l ud e   S e n t i m e nt   a n S o c i a l   M e di a   A na l y s i s .                 Evaluation Warning : The document was created with Spire.PDF for Python.