I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   21 ,   N o .   1 J a n u a r y   202 1 pp .   1 64 ~ 17 3   IS S N :   25 02 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 21 .i 1 . pp 164 - 173             164       Jou r n al   h o m e pa ge ht t p: / / i j e e c s . i a e s c or e . c om   C l a ss i f i c a t i o n   o f   a   C OV ID - 1 9   d a t a s e t   b y   u s i n g   l a b e l c r e a t e d   f r o m   c l u st e r i n g   a l g o r i t h m s       Layth   R af e a 1 A b d u l r ah m an   A h m e d 2 W i s am   D .   A b d u l l ah 3     1, 3 C i s c o   N e t w o r ki ng   A c a de m y ,   T i k r i t   U ni v e r s i t i ,   T i kr i t ,   I r a q   2 D e pa r t m e n t   o f   N e t w o r k   E ng i n e e r i ng \ C o l l a g e   o f   E ng i n e e n i ng ,   A l - I r a qi a   U n i v e r s i t y ,   I r a q       A r ti c l e   I n fo     A B S TR A C T   Ar t i c l e   h i s t or y :   R e c e i v e d   A pr   11 ,   20 20   R e v i s e J un   1 5 ,   20 20   A c c e pt e J un   2 7 ,   20 20       N ov e l   c o r o na v i r us   ( C O V I D - 19)   i s   a   n e w l y   di s c o v e r e i nf e c t i o us   di s e a s e   t ha t   ha s   r e c e i v e m uc a t t e n t i o i t he   l i t e r a t ur e   b e c a us e   o f   i t s   r a p i s pr e a a nd   da i l y   g l o ba l   d e a t hs   a t t r i b ut a bl e   t o   s uc d i s e a s e .   T he   W h i t e   H o us e ,   t o g e t he r   w i t a   c o a l i t i o o f   l e a d i ng   r e s e a r c g r o ups ,   ha s   pub l i s he t he   f r e e l y   a v a i l a bl e   C O V I D - 19  O pe R e s e a r c D a t a s e t   t o   he l t he   g l o ba l   r e s e a r c c o m m uni t y   a ppl y   t he   r e c e n t   a dv a nc e s   i na t u r a l   l a ng ua g e   p r o c e s s i ng   a n d   o t he r   A I   t e c hni que s   i g e ne r a t i ng   no v e l   i ns i g ht s   t h a t   c a n   s u ppo r t   t h e   o ng o i ng   f i g ht   a g a i ns t   t hi s   d i s e a s e .   I t hi s   pa pe r ,   t he   hi e r a r c hi c a l   a nd  k - m e a ns   c l us t e r i ng   t e c hni que s   a r e   us e t o   c r e a t e   a   t o o l   f o r   i de n t i f y i ng   s i m i l a r   a r t i c l e s   o C O V I D - 19  a nd  f i l t e r i ng   t h e m   ba s e o t he i r   t i t l e s .   T h e s e   a r t i c l e s   a r e   c l a s s i f i e d   by   a ppl y i ng   t h r e e   da t a   m i n i ng   t e c hn i qu e s ,   n a m e l y ,   r a nd o m   f o r e s t   ( R F ) ,   de c i s i o t r e e   ( D T )   a nd  b a g g i ng .   B y   us i ng   t hi s   t o o l ,   s p e c i a l i s t s   c a l i m i t   t he   num b e r   o f   a r t i c l e s   t he y   ne e d   t o   s t u dy   a nd  p r e - pr o c e s s   t h e s e   a r t i c l e s   v i a   da t a   f r a m i ng ,   t o ke n i s a t i o n,   no r m a l i s a t i o a nd  t e r m   f r e que n c y - i nv e r s e   do c um e nt   f r e que nc y .   G i v e i t s   2D   na t u r e ,   t he   d i m e n s i o na l i t y   o f   t hi s   da t a s e t   i s   r e duc e by   a ppl y i ng   t - S N E .   T he   a f o r e m e nt i o ne da t a   m i ni ng   t e c hni qu e s   a r e   t h e c r o s s   v a l i d a t e t o   t e s t   t h e   a c c ur a c y ,   pr e c i s i o a nd   r e c a l l   pe r f o r m a nc e   o f   t he   p r o po s e t o o l .   R e s u l t s   s ho w   t ha t   t he   pr o po s e t o o l   e f f e c t i v e l y   e xt r a c t s   t he   k e y w o r ds   f o r   e a c c l us t e r ,   w i t R F ,   D T   a nd  ba g g i ng   a c hi e v i n g   o pt i m a l   a c c ur a c i e s   o f   98. 2 67 % ,   97 . 63 3%   a nd   97 . 83 3% ,   r e s pe c t i v e l y .   Ke y w or d s :   Cl a s s i f i c a t i o n   Cl us t e r i n g   CO V ID - 19  p a n de m i c     D i m e n s i o na l i t y   r e duc t i o n   P r e - p r o c e s s i n g   T hi s   i s   an   ope n   ac c e s s   ar t i c l e   u nde r   t he   C C   B Y - SA   l i c e ns e .     Cor r e s pon di n g   Au t h or :   L a y t h   R a f e a   H a z i m   Ci s c o   N e t w o r ki n A c a de m y T i k ri t   U n i v e r s i t y   Co m put e Ce n t e B ui l di ng,   F l o o r #2   Ci s c o   A c a de m y   C e n t e r ,   R i g h t   S i de ,   T i k ri t ,   I ra q   E m a i l :   L a y t h . R . H a z i m @ t u. e du . i q       1.   I N TR O D U C TI O N     T h e   p n e um o n i a   o ut b r e a k   i W u h a n,   C h i na   l a t e   l a s t   y e a r   ha s   e ve n t ua l l y   e vo l v e i nt o   o n e   o f   t h e   w o r s t   pa n de m i c s   i n   hum a n   hi s t o r y .   T hi s   o ut b r e a k   w a s   t r i gge r e by   t h e   n o v e l   c o r o n a v i r us   t e rm e CO V ID - 19 ,   w hi c h   b e l o n gs   t o   t h e   O r t h o c o r o n a v i ri n a e   s ub f a m i l y   a n i s   di s t i n c t   f r o m   t h e   t w c o r o n a v i r us e s   r e po r t e i n   r e c e n t   hi s t o r y ,   n a m e l y ,   t h e   m i dd l e   e a s t   r e s pi ra t o r y   s y n dr o m e   a n s e v e r e   a c ut e   r e s pi ra t o r y   s y n dr o m e   (S A R S ‐C o V )   c o r o n a v i rus e s   a s   de s c r i b e i n   [1] T h e   f i r s t   c a s e   of   CO V ID - 19  w a s   r e po r t e o n   12  D e c e m b e r   2019  a nd  w a s   l a t e r   di s t i n g ui s h e f r o m   S A R S - Co V   by   t h e   Ch i n e s e   Ce nt e r   fo r   D i s e a s e   Co n t r o l   a n P r e v e n t i o n   ( CD C).   T h e   Co r o n a v i ri da e   f a m i l y   c o m pr i s e s   s i n gl e ,   pl us - s t ra n de a n l a r ge   R N A   v i r us e s   t h a t   a r e   i s o l a t e f r o m   m u l t i pl e   s pe c i e s   a n t r i gge r   c o m m o n   c o l a n di a rrh o e a   a m o n gs t   h u m a n s   [2 3] .   T h e   CO V ID - 19  o ut b r e a w a s   e ve n t ua l l y   de c l a r e a   pub l i c   h e a l t h   e m e rge n c y   by   t h e   W o r l H e a l t h   O r g a ni s a t i o n   (W H O o n   M a r c h   2020   a f t e r   100 , 000  c a s e s   a n d   3, 8 30  de a t h s   w e r e   r e po r t e i m o r e   t h a n   100  c o un t ri e s   a r o und  t h e   gl o b e   [4] ,   t h e r e b y   n e c e s s i t a t i ng  go v e r nm e n t s   t o   i m p l e m e n t   d r a s t i c   m e a s u r e s   t o   c o n t r o l   t h e   d i s e a s e   w h i l s t   s a c r i f i c i n t h e i r   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Cl as s i f i c a t i o o f   a   CO V ID - 19   da t as e t   b y   us i ng   l ab e l s   c r e at e f r om   c l us t e r i ng   al g or i t hm s   ( L ay t R a f e a )   165   e c o n o m i c   a n s o c i a l   de v e l o pm e n t .   H ow e v e r ,   t h e   t ra n s m i s s i o n   c ha ra c t e ri s t i c s   of   t h i s   di s e a s e   r e m a i n   u n k n o w n   t o   da t e   [5] ,   I n   a dd i t i o n,   c o un t ri e s   a r e   s t r u ggl i n i c o n t r o l l i n t h e   s pr e a o f   t h e   di s e a s e   gi v e n   t h e   a c c e l e r a t e ra t e   o f   gl o b a l   u r b a n i s a t i o n ,   t h e i hi g h   po pul a t i o c o n c e n t ra t i o n   a nd  s h o r t a ge   o f   m e di c a l   r e s o ur c e s .     A l t h o ug h   t h o us a n ds   of   l i t e r a t u r e   o n   v i r us e s   a n t h e i r   t ra n s m i s s i o n,   pr e v e n t i o n   a n po s s i b l e   t r e a t m e n t   h a v e   b e e n   pub l i s h e i n   r e c e nt   y e a r s ,   m o s t   o f   t h e s e   a rt i c l e s   h a v e   o n l y   fo c us e o n   S A R S - C o V .   A s   t h e   n u m b e r   o i n f e c t i o n s   a n de a t h s   a t t ri b ut a b l e   t o   CO V ID - 19  c o n t i n ue s   t o   r i s e ,   s pe c i a l i s t s   a r e   ra c i n i n   t h e i r   s e a r c h   f o r   a   c ur e   t o   t h i s   pa n de m i c .   H ow e v e r ,   gi v e n   t h e   l a rge   n um b e r   o f   r e c e n t   l i t e ra t u r e   o n   v i r us e s ,   t h e s e   s pe c i a l i s t s   s pe n m uc h   o f   t h e i r   t i m e   i n   e xt ra c t i ng  a r t i c l e s   t ha t   a r e   a c t u a l l y   r e l a t e t o   CO V ID - 19  a n b e n e f i t   f r o m   t h e i r   f i n d i n gs   [6 ] ,   I n   t h i s   c a s e ,   T e xt   m i n i ng  t o o l s   h e l b i o m e di c a l   r e s e a r c h e r s   a n c l i n i c i a n s   t o   s a v e   t i m e   a n e f fo r t   w h i c h   a r e   de v o t e fo r   a c qui ri n v a l ua b l e   i n f o r m a t i o n   f r o m   s e v e r a l   do c um e n t s .   A c t i v a t i ng,   i n t e r p r e t i ng,   a nd  c o m pr e h e n s i b l e   i n f o r m a t i o n   f r o m   m a n y   r e l a t e s o ur c e s   of   b i o m e di c a l   t e xt   a r e   r e qui ri n g   t a s ks ,   w h i c h   de m a n d   i m p r o v i n g   a nd  c r e a t i n a ut o m a t i c   t o o l s .   [7] ,   A rt i c l e s   i " CO R D - 19"   a r e   di s t r i b ut e a n ov e r   m a n y   t o pi c s ,   a n t h o us a n ds   o a r t i c l e s   pub l i s h e a   w e e kl y   b a s i s .   T h e   " c l us t e r i ng"   a r t i c l e s   w i t h   t h e   s a m e   t o pi c s   w i l l   m a c o m m o na l i t i e s   a nd  a s s i s t   t o   t h e   r e s e a r c h e r s   t o   c o n duc t   n e w   r e s e a r c h e d .   T e xt   m i ni n by   us i n " c l us t e r i ng" ,   h e l ps   r e s e a r c h e r s   us e   b i b l i o gr a p hi c   da t a s e t s   t o   ge t   a   ra pi r e v i e w   of  t h e   t o pi c s   [8] ,   " Cl us t e r i ng"   a r t i c l e s   c a n   de c i de   w h a t   t o pi c s   a r e   c ove r e i n   a   go o w a y   a n w o r t h   a   r e v i e w .   F ur t h e rm o r e ,   t h e s e   c l us t e r s   da t a s e t   h e l r e s e a r c h e r s   a n de c i s i o n - m a ke r s   t o   s pe c i fy   r e l a t e t o pi c s   i r e s e a r c h   o n   C O V ID - 1 9.   A s   w i t t h e   f un da m e nt a l   go a l   o f   t h e   t e xt   c l a s s i f i c a t i o n,   w hi c i s   a l s o   k n o w n   a s   t e xt   c a t e go r i z a t i o n,   i s   t h e   c l a s s i f i c a t i o n   o t e xt s   o f   i nt e r e s t   t o   c o rr e c t   c l a s s e s   [ 9] ,   Co n s e que n t l y ,   t e xt   c l a s s i f i c a t i o h a s   go t t e n   a   g r e a t   de a l   o f   i n t e r e s t   i n   hi e ra r c h i c a l l y   o r ga n i z i n g   t h o s e   a r t i c l e s .   U u nt i l   n o w ,   t e xt   c l a s s i f y i n w a s   s uc c e s s f ul l y   i m pl e m e n t e d   i di f fe r e nt   a r e a s   l i ke   t o pi c   de t e c t i o n   [10] ,   a n do c um e n t   c l a s s i fy i n g.   I n   c l a s s i f i c a t i o n   s t e p,   a   c l a s s i f i e r   pe r f o r m s   t h e   p r o c e dur e   of   c l a s s i f i c a t i o n   w i t t h e   us e   o f   pr e v i o us l y   k n o w n   l a b e l e da t a ,   a n do c um e n t s   a r e   c l a s s i f i e i n t o   a pp r o p r i a t e   c l a s s e s   [11] ,   A s   t h e   a r t i c l e s   i n   CO R D - 19  a re   r e p r e s e n t e w i t h   n u m e ri c   v a l ue s ,   a n y   c l a s s i f i e r   us e i n   pa t t e rn   r e c o gni t i o n   p r o b l e m s   c a b e   i nt e gra t e t o   t e xt / do c um e nt   c l a s s i f i c a t i o n   p r o c e s s   [12] ,   H ow e ve r ,   s e l e c t i o n   o f   a ppr o p r i a t e   c l a s s i f i e i n c r e a s e s   s uc c e s s   ra t i o   o f   c l a s s i f i c a t i o n .   M ul t i - s t a ge   t e xt   m i n i ng  p r e s e nt s   i s   a n   e f fe c t i ve   m e t h o f o r   c l a s s i fy i n a nd  c l us t e r i ng  a   l a rge   n um b e of   a rt i c l e s   b a s e o n   c e r t a i pa ra m e t e r s .   [ 13] ,   A c c o r di n g l y ,   i t h i s   pa pe r ,   t e xt   m i n i n g   i s   a ppl i e t o   a na l y s e   t h e   CO V ID - 19  O pe n   R e s e a r c h   D a t a s e t   (CO R D - 19),   a   da t a s e t   c o n t a i ni n 44 , 000  s c i e nt i f i c   a rt i c l e s   o n   v i r us e s   [14] ,   a n f i l t e t h e s e   a r t i c l e s   a c c o r di n t o   t h e i t i t l e s   t o   e xt r a c t   o n l y   t h o s e   w o r ks   t ha t   a r e   p a r t i c ul a rl y   r e l e v a n t   t o   s pe c i a l i s t s   i n   t h e i r   s e a r c h   f o r   a n   e ff e c t i v e   t r e a t m e nt   a g a i n s t   CO V ID - 19.   I n   o t h e r   w o r ds ,   t h i s   s t udy   pr i m a r i l y   a i m s   t o   r e a s s e m b l e   s c i e n t i f i c   a rt i c l e s   o n   v i rus e s   i a   w a y   t h a t   o nl y   t h o s e   a r t i c l e s   t h a t   a r e   di r e c t l y   r e l a t e t o   CO V ID - 19  w i l l   b e   pr e s e nt e t o   s pe c i a l i s t s .       2.   R ELA TED   WO R K S   F e w   pub l i s h e w o r ks   h a v e   a ppl i e da t a   m i ni n a n t e xt   m i n i n i n   a n   a t t e m p t   t o   f i nd  s o l ut i o n s   t o   t h e   CO V ID - 2019  pa n de m i c .   T hi s   pa pe r   o n l y   foc us e s   o n   t h o s e   t e c h n i q ue s   t ha t   a i m   t o   e s t a b l i s h   r e l a t i o n s hi ps   a m o ngs t   t h e   t e xt   a nd  c a t e go ri c a l   a t t r i b ut e s   o f   t h e   r e l e v a n t   l i t e ra t u r e .   T h i s   s e c t i o n   s u m m a r i s e s   t h e   l i t e r a t u r e   r e l a t e t o   t h i s   w o r k.     A   h y b r i c l a s s i f i c a t i o n   f ra m e w o r b a s e o n   c l us t e r i ng  (H CF C)  w a s   pr o po s e i n   [1 5] ,   T hi s   f r a m e w o r i ni t i a l l y   a ppl i e s   a   c l us t e r i n a l go ri t hm   t o   di vi de   a n   e n t i r e   t ra i ni n s a m pl e   i n t o   c l us t e r s .   A f t e r w a r ds ,   a   c l us t e r i n g - b a s e a t t r i b ut e   s e l e c t i o n   m e a s u r e   c a l l e h y b r i i n f o r m a t i o n   ga i n   r a t i o   w a s   c o n s t r uc t e t o   t r a i a   C4 . de c i s i o n   t r e e .   T w o   ve r s i o n s   o f   H CF C,   na m e l y ,   H CF C - K   a n d   H CF C - D ,   w e r e   t h e b ui l t   a n t e s t e o b e n c h m a r k   da t a s e t s   r e l a t e d   t o   h e a l t h c a r e   a n d   d i s e a s e   di a g n o s i s   a n d   15  da t a s e t s   f r o m   o t h e f i e l ds .   R e s ul t s   s h o w   t ha t   b o t H CF C - K   a n d   H CF C - D   e i t h e c o m pa r e   o o ut pe r f o r m   t h e   o t h e t hr e e   h y b r i a n s i s i n gl e   m o de l s   c o n s i de r e i n   t h e   s t udy .   B e t w e e n   t h e s e   t w o   a l go r i t hm s ,   H CF C - D   s h o w s   a   be t t e r   r e s i s t a n c e   t o   c l a s s   n o i s e .   T h e   a ut h o r s   i n   [16] ,   t e s t e t h e   fe a s i b i l i t y   of  us i n a   m o de l l i n a pp r o a c h   i n   i de nt i fy i n pa t i e n t   s a f e t y   e ve n t s   (P S E s r e l a t e t o   H IT   us a b i l i t y   f r o m   t h e   f r e e   t e xt   o f   s a f e t y   r e po r t s   a n d   s t udi e h o w   s uc h   a pp r o a c h   c a n   b e   us e by   pa t i e n t   s a f e t y   a n a l y s t s   i n   a na l y s i n e v e n t   da t a .   W i t h   a   da t a s e t   c o n t a i ni n 5 , 911  m a nua l l y   a nn o t a t e r e po rt s ,   t h e y   i de n t i f i e P S E s   r e l a t e t o   H IT   us a b i l i t y   by   u s i n t hr e e   f e a t ur e   r e p r e s e n t a t i o n s ,   na m e l y ,   b a of   w o r ds   (B O W s ),   t o pi c   m o de l l i n a nd  do c um e n t   e m b e ddi ng.   T o ge t h e w i t h   pa t i e n t   s a f e t y   a n a l y s t s ,   t h e   a u t h o r s   r e v i e w e d   t h e   r e s ul t s   of  t h e i r   a pp r o a c h   a n g a t h e r e f e e db a c k   o n   i t s   us e f ul n e s s   a n i n t e g ra t i o n   i nt o   w o r kf l ow s .   Co m b i n i ng  t e rm   f r e que n c y - i n v e r s e   d o c um e n t   f r e que n c y   (T D - ID F B O W s   w i t h   do c um e n t - e m b e ddi n f e a t u r e s   t h a t   a r e   m o de l l e v i a   s uppo r t   v e c t o r   m a c hi n e   (S V M w i t h   ra di a l   b a s i s   f un c t i o n   (R B F y i e l de t h e   b e s t   pr e c i s i o n - r e c a l l   pe r f o r m a n c e   w i t h   a n   u nde r   t h e   c ur v e   (A U C)  a n d   f s c o r e   of   72%  a n 66% ,   r e s pe c t i v e l y .   M e a n w h i l e ,   c o m pa re w i t h   t h e   S V M   R BF   m o de l ,   t h e   a ppl i c a t i o n   o do c um e n t - e m b e ddi n f e a t ur e s   r e s ul t e i n   a n   A U a n f s c o r e   of   70%  a n 6 6%,   r e s pe c t i v e l y .   Bo t h   a pp r o a c h e s   f a v o ur e s e n s i t i v i t y   a n d   s pe c i f i c i t y   ov e r   pr e c i s i o n .   P a t i e nt   s a f e t y   a n a l y s t s   a l s o   r e po r t e t h e   us e f ul n e s s   of   s uc h   a pp r o a c h   i n   t h e i po i nt   o f   r e po r t   e nt r y ,   v i s ua l   d a s h b o a rd  l a y e r s   a n da t a   r e t ri e v a l .   I n   s u m ,   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   21 ,   N o .   1 J a n u a r y   2021   :     164   -   173   166   do c um e n t   e m b e ddi n g   a n d   t e xt   m i n i ng  a pp r o a c h e s   c a n   s up po r t   t h e   i de nt i f i c a t i o n   o f   P S E s   r e l a t e t o   H IT   us a b i l i t y .   A n   e c o n o m e t r i c   m o de l   w a s   pr o po s e i n   [17 ] ,   t o   pr e di c t   t h e   s p r e a o f   CO V ID - 19.   T h e   a ut h o r s   a ppl i e a a u t o r e g r e s s i v e   i nt e gra t e m o v i n a v e r a ge   m o de l   o n   a n   e pi de m i o l o gi c a l   d a t a s e t   f r o m   J o hn s   H o pki n s   Ce nt e c ov e r i n t h e   da t e s   20  J a nua r y   t o   10  F e b r ua r y   2020  t o   p r e di c t   t h e   p r e v a l e n c e   a nd  i n c i de n c e   t r e n ds   o f   t h e   di s e a s e .   T h e   o ve r a l l   p r e v a l e n c e   of   CO V ID - 1 de m o n s t r a t e s   a n   i n c r e a s i n t r e nd  t ha t   r e a c h e s   e pi de m i c   p r o po r t i o n s ,   a n d   t h e   d i f fe r e n c e   b e t w e e n   t h e   c a s e s   r e po rt e i o n e   d a y   a n i n   t h e   p r e v i o us   da y   D   (X n - Xn - 1)  do e s   n o t   i n d i c a t e   a n y   c o n s t a nt   i n c r e a s e   i n   t h e   n u m b e r   o f   c o n f i r m e c a s e s .   A   de s c r i p t i v e   a n a l y s i s   w a s   pe r f o r m e t o   c h e c f o r   a n y   p o t e n t i a l   b i a s   a nd  t o   e v a l ua t e   t h e   i n c i de n c e   o f   n e w   c o n f i rm e c a s e s   of  CO V ID - 19.   T h e   a ut h o r s   i n   [ 18] c o m pi l e a n a n a l y s e e pi de m i o l o gi c a l   o ut b r e a i n f o r m a t i o n   o n   CO V ID 19  by   us i n t h e   o pe da t a s e t s   o f   J o h n s   H o pki n s   U n i v e r s i t y ,   W H O ,   CD C ,   N a t i o na l   H e a l t h   Co m m i s s i o a nd  D X Y .   T h e   n um b e r   o f   c o n f i r m e c a s e s ,   de a t h s   a n r e c ov e r i e s   w a s   a l s o   i n v e s t i ga t e v i a   a n   e xp l o ra t o r y   da t a   a n a l y s i s   a c c o m pa n i e w i t da t a   v i s ua l i s a t i o n s .       3.   R ES EA R C H   M ET H O D     F i gu r e   p r e s e n t s   t h e   m a i n   s t a ge s   o f   t h e   m e t h o do l o g y   a do p t e i n   t hi s   w o r k.   R e c a l l ,   p r e c i s i o n   a nd  a c c ur a c y   a r e   us e a s   pe r f o r m a n c e   m e a s u r e s .   T h e   r e s ul t s   a r e   pr o c e s s e by   us i n P y t h o n   (N o t e b oo k)  i n   o r de t o   b ui l do c um e n t   c l a s s i f i c a t i o n   m o de l s   (i n c l ud i n p r e - p r o c e s s i n g,   f e a t u r e s   e xt r a c t i o n,   f e a t ur e s   s e l e c t i o n   a n d   f e a t ur e s   m o di f i c a t i o n   m o de l s b a s e o n   t hr e e   c l a s s i f i c a t i o a l go r i t hm s ,   na m e l y ,   r a n do m   f o r e s t   (R F ),   de c i s i o n   t r e e   (D T a n d   b a ggi ng.           F i gu r e   1 .   S t a ge s   o f   t h e   r e s e a r c h   m e t h o do l o g y       3. 1 .       Pre - p r o c e s s i n g   T h e   da t a s e t   w a s   i n i t i a l l y   pr e - p r o c e s s e t o   pr e s e n t   t h e   t e xt   a r t i c l e s   i n   a   c l e a r   w o r f o r m a t .   S pe c i f i c a l l y ,   t h e   c o n t e nt s   o f   t h e s e   a rt i c l e s   w e r e   pr e - p r o c e s s e t o   r e m o v e   i rr e l e v a n t   w o r ds   i n   o r de r   t o   f a c i l i t a t e   t h e   c l a s s i f i c a t i o n   a n t o   r e duc e   t h e i r   di m e n s i o na l i t y   [19] ,   T h e   p r e - p r o c e s s i n s t a ge   i n v o l v e s   fo ur   s t e ps ,   na m e l y ,   da t a   f ra m i n g,   t o ke ni s a t i o n,   n o rm a l i s a t i o a n T F - ID F   s t o w o r ds   f e a t ur e   s e l e c t i o n.     3. 1 . 1.   D ata   fr am e   A   d a t a   f ra m e   i s   a   2 D   a r ra y - l i k e   t a b l e   w he re   e a c c o l u m c o nt a i ns   t he   v a l u e s   f o a   s i ng l e   v a ri a b l e   a nd   e a c ro w   c o nt a i ns   a   s e t   o f   v a l u e s   f o e a c c o l u m [20] ,   A   d a t a   f ra m e   s ho u l d   p o s s e s s   t he   f o l l o w i ng   c ha ra c t e ri s t i c s :   a)   T h e   n a m e s   o f   e a c h   c o l um s h o ul n o t   b e   e m pt y .   b)   E a c h   r o w   s h o ul d   b e   gi v e n   a   u ni que   na m e .   c)   T h e   da t a   c a b e   of   n u m e r i c ,   c ha r a c t e o r   f a c t o t y pe .   d)   A l l   c o l um n s   s h o ul c o nt a i t h e   s a m e   n u m b e r   o f   i t e m s .     Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Cl as s i f i c a t i o o f   a   CO V ID - 19   da t as e t   b y   us i ng   l ab e l s   c r e at e f r om   c l us t e r i ng   al g or i t hm s   ( L ay t R a f e a )   167   3. 1 . 2.   To k e n i s ati o n   In  t h e   t o ke ni s a t i o s t e p,   t h e   t e xt   da t a   a r e   s pl i t   i n t o   t o ke n s   o r   s i m p l e   i n de pe n de n t   u ni t s   o f   w o r ds   o r   t e rm s   de pe n di ng  o n   t h e i r   di s t a n c e   i n   o r de r   t o   s e pa r a t e   t h e   w o r ds   i n   t h e   t e xt   f r o m   o n e   a n o t h e r   [13] ,   T h e s e   t o ke n s   a r e   a l s o   c r uc i a l   i n   na t u r a l   l a ngua ge   p r o c e s s i n (N L P ).     3. 1 . 3.   N o r m al i s ati o n     T h e   n e xt   s t e i n   N L P   i s   p r e - p r o c e s s i n t h e   a r t i c l e s   t o   n o r m a l i s e   t h e   da t a .   I t hi s   s t e p,   di f f e r e n t   f o r m s   of   t h e   s a m e   l e t t e r   a r e   n o rm a l i s e by   c o n v e r t i ng  a l l   c ha r a c t e r s   i n t o   l o w e r   o r   uppe r   c a s e   a nd  de l e t i n a l l   s y m bo l s   a nd  n u m b e r s   [ 20] .     3. 1 . 4.   TF - I D F   m o d e l   TF - ID F   ge n e r a t e s   w e i gh t e t e r m   v e c t o r s   t h a t   w i l l   b e   s ub s e que n t l y   us e f o r   c l us t e r i ng  a n d   c l a s s i f i c a t i o n.   T h e   T F - ID F   m o de l   i s   w i de l y   a ppl i e i n   f e a t u r e   e xt r a c t i o n   a n s e l e c t i o n   [21] ,   I n   t hi s   s t e p,   t h e   a r t i c l e s   a r e   t ra n s f o r m e i n t o   a   do c um e nt   v e c t o r ,   a nd  e a c h   a r t i c l e   i s   r e p r e s e n t e by   a n   a rra y   of   w e i gh t s .   I n   t h i s   c a s e ,   t h e   c o l l e c t i o n   o f   t e xt   do c um e n t s   c a b e   r e p r e s e n t e i m a t r i x   f o r m   w h e r e   e a c do c um e n t   i s   a s s i g n e t o   a   s i n gl e   r o w   a n e a c h   f e a t u r e   i n   a   l i s t   o f   voc a b ul a r y   i s   a s s i g n e t o   e a c h   c o l um n.   E a c h   f e a t u r e   i s   a l s o   a s s o c i a t e w i t h   a   w e i gh t   t o   i n di c a t e   i t s   r e l a t i v e   i m po r t a n c e   i n   t h e   e nt i r e   do c um e n t .   T h e   pa ra m e t e r s   i n   t h e   T F - ID F   m o de l   e m pl oy e i n   t hi s   w o r i n c l u de   s t o w o r (= ' E n gl i s h ' a n m a x_f e a t u r e s   (= 2**12)  t o   gua r a nt e e   hi g c l us t e ri n g   a nd  c l a s s i f i c a t i o a c c ur a c y .       3. 2 .       T r a i n i n an d   te s t i n d a tas e ts   T h e   t r a i n i ng  a nd  t e s t i ng  s e t s   a r e   s e pa r a t e w i t h   c u t - o ff s   of   80%  a nd  20% .   T h e s e   s e t s   a r e   l a t e r   us e a s   i n pu t s   f o r   di m e n s i o n a l i t y   r e duc t i o n   a nd  f o r   b o t h   t h e   c l a s s i f i c a t i o n   a nd  c l us t e r i ng  a l go ri t hm s .   E a c h   w o r i s   t r e a t e a s   a n   a t o m i c   u n i t ,   a nd  e a c t e r m   i s   a s s i g n e d   a   w e i ght   a c c o r di n t o   t h e   T F - ID F   m o de l .       3. 3 .       D i m e n s i o n al i ty  r e d u c ti o n   w i th   t - SNE   D i m e n s i o na l i t y   r e duc t i o n   i s   a n   o pt i o na l   s t e t ha t   c a n   b e   a c h i e v e by   us i n c l a s s i f i c a t i o n   a n c l us t e r i ng  m o de l s .   T o   gua r a nt e e   a n   e xc e l l e n t   pe r f o r m a n c e ,   p r e v i o us   s t u di e s   h a v e   a ppl i e di m e n s i o n a l i t y   r e duc t i o n   t o   a dd r e s s   t i m e   a n m e m o r y   c o m pl e xi t i e s .   M o r e o ve r ,   c o n duc t i ng  p r e - p r o c e s s i n v i a   di m e n s i o na l i t y   r e duc t i o n   i s   a l s o   m o r e   e ff i c i e n t   t h a n   de v e l o pi n i n e xpe n s i v e   c l a s s i f i e r s .   T - di s t ri b ut e s t oc h a s t i c   n e i g h b o ur   e m b e ddi n ( t - S N E i s   a   n o n l i n e a r   d i m e n s i o n a l i t y   r e duc t i o n   m e t h o f o r   e m b e ddi n hi g h - d i m e n s i o n a l   da t a   t h a t   i s   w i de l y   ut i l i s e f o r   v i s ua l i s a t i o n   i n   a   l o w - di m e n s i o na l   fe a t u r e   s pa c e   [22] ,   M o r e ov e r ,   us i ng  t - S N E   c a r e duc e   a   hi g h - di m e n s i o n a l   f e a t u r e s   v e c t o r   i n t o   a   2D   pl a n e .   D uri n g   t hi s   p r o c e s s ,   t - S N E   ke e ps   s i m i l a i n s t a n c e s   t o ge t h e r   w h i l s t   pus h i n g   di f f e r e n t   i n s t a n c e s   f a r   f r o m   o n e   a n o t h e r .   A s   s h o w n   i n   F i gu r e   2,   t h e   r e s ul t i n g   2D   pl a n e   r e v e a l s   w h i c h   a r t i c l e s   a r e   c l us t e r e n e a r   o n e   a n o t h e r .   I n   t h i s   s t udy ,   t - S N E   i s   a ppl i e w i t h   t h e   pa r a m e t e r s   v e r b o s e   (= 1)  a n d   pe r pl e xi t y   (= 5)  t o   g ua ra n t e e   a e xc e l l e n t   pe r f o r m a n c e .           F i gu r e   2 .   D i m e n s i o na l i t y   r e duc t i o n   v i a   t - S N E         3. 4 .       C l u s te r i n al go r i th m s   T h e   c l us t e r i n g   a l go r i t hm   a i m s   t o   m a xi m i s e   i nt ra - c l us t e r   s i m i l a ri t y   w h i l s t   m i ni m i s i n g   i nt e r c l us t e s i m i l a ri t y ,   b o t h   o f   w h i c a r e   c a l c ul a t e by   us i n g   s e v e r a l   m e a s ur e s ,   i n c l ud i n t h e   E uc l i de a di s t a n c e s   b e t w e e n   t h e   da t a   po i nt s   a n n e a r e s t   c l us t e r   c e nt r o i ds   [13] ,   T hi s   s t e c a a l s o   b e   us e t o   c r e a t e   a   t o o l   f o r   i de n t i f y i n a r t i c l e s   t ha t   a r e   s i m i l a t o   t h e   t a r ge t   a r t i c l e ,   t h e r e by   l i m i t i n g   t h e   n u m b e r   o f   a r t i c l e s   t h a t   n e e t o   b e   a n a l y s e d.   T w o   c l us t e r i n g   a l go r i t hm s   a r e   a pp l i e d   i t hi s   w o r k,   n a m e l y ,   hi e ra r c h i c a l   c l us t e r i ng  a n d   k - m e a n s   c l us t e ri n g.   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   21 ,   N o .   1 J a n u a r y   2021   :     164   -   173   168   3. 4 . 1.   H i e r a r c h i c al   c l u s te r i n g   H i e r a r c hi c a l   m e t h o ds   c a n   b e   e i t h e r   a gg l o m e ra t i v e   (b o t t om - up  a pp r o a c h)  o r   d i v i s i v e   (t o p - dow n   a pp r o a c h )   [23] ,   H i e ra r c hi c a l   c l us t e ri n g ,   a l s o   k n o w n   a s   h i e ra r c hi c a l   c l us t e a na l y s i s ,   g r o ups   s i m i l a o bj e c t s   i n t o   gr o ups   c a l l e d   c l us t e r s   t h a t   a r e   di s t i n c t   f r o m   o n e   a n o t h e r   [13] .   A ggl o m e ra t i v e   c l us t e r i ng  t r e a t s   e a c do c um e n t   a s   a n   i nde pe n de n t   c l us t e r   a n m e rge s   a l l   h o m o ge n e o us   c l us t e r s   un t i l   n o   f ur t h e r   m e rgi n c a n   b e   pe r f o r m e d.   T o   gua ra nt e e   e xc e l l e n t   pe r f o r m a n c e ,   s e v e r a l   p a r a m e t e r s   a r e   e m p l oy e i n   t h i s   w o r k,   n a m e l y ,   n _c l us t e r s   (= 1 0),   a f f i ni t y   (= ' e uc l i de a n' )   a n d   l i n k a ge   ( = ' w a r d' ) .     3. 4 . 2.   K - M e an s   c l u s te r i n g   K - m e a ns   c l u s t e ri ng   a l g o ri t hm   c l u s t e rs   d o c u m e nt s   b a s e d   o t h e   e nt ro py   g l o b a l   t e rm   w e i g ht i ng   m e t ho a nd   a i m s   t o   d e t e rm i ne   ho w   m a ny   k   c l u s t e rs   a re   a v a i l a b l e   i t he   d a t a .   T hi s   a l g o ri t h m   i t e ra t i v e l y   m o v e s   k   c e nt re s   a nd   s e l e c t s   d a t a   p o i nt s   c l o s e s t   t o   t he   c e nt ro i [24] ,   I t hi s   w o rk ,   a u ns u p e rv i s e d   k - m e a ns   a l g o ri t h m   i s   e m p l o y e d   i c o nj u nc t i o w i t i np u t   T F - I D F   v e c t o rs   t o   de f i ne   t he   a u x i l i a ry   s u b - t a s k .   A a u x i l i a ry   s ub - t a s k   d e f i ni t i o i s   t he f o rm u l a t e d   f o e a c o f   t he   m a i N L U   t a s k s   [20] .   M e a nw hi l e ,   t he   k - m e a ns   u ns u p e rv i s e d   t e c hni q u e   i s   a p p l i e d   t o   o b t a i t he   l a b e l s   ne c e s s a r y   f o e s t a b l i s hi ng   s u p e rv i s e d   c l a s s i f i c a t i o t e c hn i q u e s   g i v e t ha t   t he   d a t a s e t   l a c k s   a ny   l a b e l .   T he   p a r a m e t e rs   c l u s t e rs   ( = 1 0 ) ,   n_ j o b s   ( = 4 )   a nd   v e rb o s e   ( = 1 0 )   a r e   e m p l o y e d   i t hi s   w o rk .     3. 5 .       C l as s i fi c at i o n   al go r i th m s   T e xt   c l a s s i f i c a t i o n   o r   c a t e go ri s a t i o n   us e s   a   s e t   o f   c l a s s - l a b e l l e do c um e n t s   f r o m   a   s pe c i f i c   do m a i n   t o   b ui l a   m o de l   t ha t   p r o v i de s   c l a s s   pr e di c t i o n s   f o r   a r b i t ra r y   doc um e n t s   f r o m   t h e   s a m e   do m a i n   [25 ] ,   T h i s   s t ud y   e m pl oy s   t hr e e   c l a s s i f i c a t i o a l go r i t hm s ,   n a m e l y ,   R F ,   D T   a n d   b a ggi n g .     3. 5 . 1.   R an d o m   fo r e s t   R F   i s   a   po pul a r   e n s e m b l e   m o de l l i n a l go ri t hm   t ha t   a c hi e ve s   e x c e l l e n t   p r e di c t i v e   pe r fo r m a n c e   by   c o m b i n i ng  m ul t i pl e   m o de l s   f r o m   t h e   s a m e   do m a i n   [26 ] ,   A n   R F   i s   r e pr e s e nt e by   a   s e t   of   un p r u n e D T s   t ha t   a r e   g r o w n   b a s e o n   m u l t i pl e   b oo t s t r a s a m p l e s   t ha t   a r e   dra w n   (w i t h   r e pl a c e m e n t s f r o m   t h e   t ra i ni n s e t   v i a   ra n do m i s e s pl i t   s e l e c t i o n .   R F   i s   a   ra pi a nd  a c c ur a t e   t e c hni que   e m pl o y e fo r   do c um e n t   c a t e go r i s a t i o n   a n d   t e xt   c l a s s i f i c a t i o n .   R F   c a n   t r a i n   t e xt   d a t a   s e t s   m uc h   f a s t e r   t ha n   o t h e r   t e c hni que s ,   i n c l udi ng  de e l e a rn i ng,   y e t   i s   s l o w   i n   m a k i n p r e di c t i o n s   a f t e t ra i ni n [ 22] ,   T hi s   s t u d y   e m pl oy s   t h e   p a r a m e t e r s   n _e s t i m a t o r s   ( = 100) ,   ra n do m _s t a t e   ( = 42)   a nds   n _j o b s   (= 4)  t o   a c hi e v e   o pt i m a l   a c c u ra c y .       3. 5 . 2.   D e c i s i o n   t r e e   D T   ha s   b e e n   s uc c e s s f ul l y   e m pl oy e i n   m a n y   f i e l ds   f o r   c l a s s i f i c a t i o n.   T hi s   t e c hni que   ha s   a   s t r uc t u r e   t h a t   r e s e m b l e s   a   h i e r a r c hi c a l   de c o m po s i t i o n   of   t h e   da t a   s p a c [27] ,   D T   pe r f o r m s   i n d uc t i v e   l e a rn i ng  f r o m   t h e   da t a   a n o b t a i n s   a   t r e e - l i ke   s t r uc t u r e   t h a t   i s   e qui v a l e n t   t o   a   s e t   o f   de c i s i o n   r ul e s   [2 8] ,   T h e   m a i i de a   o f   t hi s   a l go ri t hm   i s   t o   c r e a t e   a   t r e e   b a s e o n   t h e   a t t r i b ut e s   o f   t h e   c a t e go r i s e d a t a   po i nt s .   H ow e v e r ,   w h i c o f   t h e s e   a t t ri b ut e s   s h o ul d   b e   a s c r i b e t o   t h e   pa r e n t   o c hi l d   l e v e l   n e e ds   t o   b e   de t e r m i n e d .   D T   i s   a   v e r y   f a s t   a l go ri t hm   fo r   b o t h   l e a rni n a n p r e di c t i o n   b ut   i s   e xt r e m e l y   s e n s i t i v e   t o   s m a l l   pe rt u r b a t i o n s   i n   t h e   da t a   a nd  i s   p r o n e   t ov e r f i t t i n g .   N e v e r t h e l e s s ,   s uc h   c h a l l e n ge s   c a n   b e   a dd r e s s e by   e m pl oy i n v a l i da t i o n   a nd  p r u ni n g .   I n   t h i s   s t udy ,   t h e   D T   a l go r i t hm   i s   c o m b i n e w i t di f f e r e n t   p a r a m e t e r s .       3. 5 . 3.   B ag gi n g   B a ggi n i s   e m pl o y e t c l a s s i fy   d o c um e n t s   a n t e xt   d a t a s e t s   a n i s   ge n e r a t e by   us i n di f f e r e n t   bo o t s t r a s a m p l e s ,   w i t h   e a c h   b o o t s t r a p   ge n e ra t i ng  a   u n i f o rm   s a m pl e   f r o m   t h e   t r a i n i ng  s e t   [22] .   B a gg i n c r e a t e s   a   s e que n c e   of   c l a s s i f i e r s   i n   c o n s i de ra t i o n   o f   t h e   m o di f i c a t i o n s   a pp l i e t o   t h e   t ra i ni n s e t .   T h i s   m e t h o ha s   a l s o   be e n   a ppl i e t o   i m p r o v e   t h e   e ff i c i e n c y   of   s t a nda r m a c h i n e   l e a rn i ng  a l go r i t h m s .   T h e   c l a s s i f i e r s   c r e a t e by   b a ggi n a r e   c o m b i n e i nt o   a   c o m po un c l a s s i f i e r ,   w h i c h   p r e di c t i o n   i s   a s s i g n e a   w e i gh t e c o m b i na t i o n   o f   i n di v i dua l   c l a s s i f i e r   p r e d i c t i o n s   [29 ] ,   R e ga r dl e s s   of   t h e s e   a dv a n c e s ,   b a ggi n ha s   s e ve r a l   di s a dv a n t a ge s ,   i n c l u di n i t s   c o m put a t i o n a l   c o m pl e xi t y   a nd  l o s s   of   i n t e r p r e t a b i l i t y ,   w h i c h   p r e v e n t s   t h i s   a l go ri t hm   f r o m   r e c o gn i s i n g   t h e   i m po r t a n c e   o f   e a c h   f e a t ur e .   T h e   pa ra m e t e r s   n _e s t i m a t o r s   (= 10 0)  a n r a n do m _s t a t e   ( = 1)   a r e   e m pl oy e i t hi s   w o r k .       4.   R ES U LTS   A N D   D I S C U S S I O N     T h i s   s e c t i o n   pr e s e nt s   t h e   da t a s e t ,   l e a rn i ng  a l go ri t hm s ,   a   pe r f o r m a n c e   e v a l ua t i o n   c ri t e r i a   a n d   e v a l ua t i o n   m e a s u r e s   us e i n   t h i s   w o r k.   T h e   c l us t e ri n a nd  c l a s s i f i c a t i o n   a l go r i t hm s   t ha t   a r e   a pp l i e i n   o u r   w o r k,   de pe n d i n g   o t h e   t i t l e   i t h e   a rt i c l e s .   P y t h o n   (N o t e b ook)  i s   us e t o   p r o c e s s   t h e   r e s ul t s .         Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Cl as s i f i c a t i o o f   a   CO V ID - 19   da t as e t   b y   us i ng   l ab e l s   c r e at e f r om   c l us t e r i ng   al g or i t hm s   ( L ay t R a f e a )   169   4. 1 .       D at as e t   d e s c r i p t i o n   In  c o l l a b o r a t i o n   w i t l e a d i n r e s e a r c g r o ups   a r o u n t h e   w o r l d ,   t h e   A l l e n   I n s t i t ut e   f o r   A I   ha s   pr e pa r e t h e   CO R D - 19  da t a s e t ,   a   f r e e   r e s o ur c e   t h a t   c o n s i s t s   of   ove r   44 , 000  s c h o l a rl y   a r t i c l e s   o n   CO V ID - 19  a n t h e   c o r o n a v i r us   f a m i l y ,   of   w h i c h   m o r e   t ha n   2 9, 0 00  a rt i c l e s   a r e   p r e s e nt e i n   f ul l   t e xt   w i t 15  f e a t u r e s   a s   s h o w n   i n   T a b l e   [14] ,   T h i s   d a t a s e t   a i m s   t o   h e l r e s e a r c he r s   a pp l y   t h e   r e c e n t   a dv a n c e s   i n   N L P   t o   ob t a i n   n o v e l   i n s i g ht s   t ha t   c a s uppo rt   t h e   ra c e   f o r   a   s o l ut i o t o   t h e   CO V ID - 19  p a n de m i c .       T a b l e 1.   D e s c r i pt i o o f   da t a s e t   F e a t u r e s   N a m e   D e s c ri p t i o n   Re c o rd s   S h a     T h e   p a p e re c o r d s   h a v e   P D F s   o r   i n c l u d e   m u l t i p l e   f i l e s   ( s o m e   P M C   f i l e s   h a v e   m u l t i p l e   a s s o c i a t e d   P D F s ).     2 8 4 6 2   n o n - n u l l   S o u r c e _ x   T h e   a rt i c l e s   s o u r c e   s u c h   a s   (E l s e v i e r).   4 4 2 2 0   n o n - n u l l   T i t l e   A l l   a rt i c l e s   t i t l e   i n   t h i s   d a t a s e t   ( o u w o rk   o n   t h i s   fe a t u r e ).     4 3 9 9 6   n o n - n u l l   D o i   P o p u l a t e d   f o r   a l l   " B i o R x i v / M e d Rx i v "   p a p e re c o r d s   a n d   m o s t   o t h e   o t h e re c o rd s .   4 0 7 5 0   n o n - n u l l   P m c i d   P o p u l a t e d   f o r   a l l   P M p a p e r   re c o r d s .     2 3 3 1 9   n o n - n u l l   P u b m e d _ i d   ID   o t h e   a rt i c l e s   p o p u l a t e d   fo s o m e   o t h e   r e c o r d s .   2 2 9 4 3   n o n - n u l l   L i c e n s e     Cu s t o m _ l i c e n s e   o f   a rt i c l e s .     4 4 2 2 0   n o n - n u l l   A b s t ra c t   T h e   a b s t ra c t   o f   a l l   a rt i c l e s   t h a t   a re   a l r e a d y   t h e r e .     3 5 8 0 6   n o n - n u l l   P u b l i s h _ t i m e   P u b l i s h i n g   t i m e   f o r   a rt i c l e s .     3 4 1 9 7   n o n - n u l l   A u t h o r s   T h e   n a m e s   o a u t h o r s   i n   t h e   a r t i c l e s .     4 1 0 7 4   n o n - n u l l   J o u rn a l   T h e   n a m e s   o j o u rn a l s   p u b l i s h i n g   a r t i c l e s .   3 3 1 7 3   n o n - n u l l   M i c ro s o f t   A c a d e m i c   P a p e ID   P o p u l a t e d   f o r   s o m e   o t h e   r e c o r d s .   9 6 4   n o n - n u l l   W H O   # Co v i d e n c e   P o p u l a t e d   f o r   a l l   CZ re c o r d s   a n d   n o n e   o t h e   o t h e re c o r d s .   1 7 6 7   n o n - n u l l   H a s _ f u l l _ t e x t   N u m b e r   o t h e   " P D F s "   w e r e   p r o c e s s e d   w i t h   f u l l   t e x t .   4 4 2 2 0   n o n - n u l l   F u l l _ t e x t _ f i l e   T h e   s i g n a l   t h e   " t a r. g z "   f i l e   i n   w h i c h   t h e   f u l l   t e x t   " j s o n "   re s i d e s .   3 2 8 2 9   n o n - n u l l       4. 2 .       Pre - p r o c e s s i n g   r e s u l ts   T he   d a t a s e t   i s   p re - p ro c e s s e d   t o   f a c i l i t a t e   d a t a   f r a m i ng ,   re m o v e   t he   i r re l e v a nt   w o rd s   a nd   s y m b o l s   i t he   s e l e c t e a rt i c l e s ,   re v e rt   s o m e   w o rd s   b a c k   t o   t he i o ri g i na l   f o rm s   a nd   a p p l y   t he   T F - I D F   m o d e l .   T he   e m p l o y e d a t a s e t   c o nt a i ns   2 9 , 3 1 5   f u l l - t e x t   a rt i c l e s .   T he   d a t a   a re   e nt e re d   i n   f o u s t a g e s ,   w i t h   e a c s t a g e   a i m i ng   t o   p r o c e s s   a nd   i m p ro v e   t he   p re s e nt a t i o o f   t he s e   d a t a .   F i g u re   3   s ho w s   ho w   t he   a r t i c l e s   a re   e nt e re d   i nt o   a e a s y - to - u s e   d a t a   f ra m e ,   w he re a s   F i g u re   s ho w s   t he   d a t a s e t   a f t e t he   t o ke ni s a t i o a nd   no rm a l i s a t i o o f   t he   t e x t   a b s t ra c t s ,   b o dy   t e x t s   a nd   t i t l e s .   I F i g u r e   4 ,   w he n   c o m p a re d   t o   F i g u re   3 ,   w e   no t i c e   t h e   d i s a p p e a ra nc e   o f   t he   s y m b o l s   a nd   t o k e ns   i t he   t o k i na s a t i o n ,   a s   w e l l   a s   t he   t r a ns f o rm a t i o n   o f   a l l   t e x t s   i t he   a b s t ra c t s ,   b o dy   t e x t s   a nd   t i t l e s   i nt o   l o w e c a s e .             F i gu r e   3 .   D a t a s e t   t o   d a t a   f ra m e     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   21 ,   N o .   1 J a n u a r y   2021   :     164   -   173   170       F i gu r e   4 .   T o ke n i s a t i o n   a n d   n o rm a l i s a t i o n         4. 3 .       D i m e n s i o n al i ty  r e d u c ti o n   b t - SNE   A   s c a t t e pl o t   i s   ge n e r a t e by   us i n g   t h e   p l a i n   t e xt   f r o m   t h e   t i t l e s   of   e a c h   a r t i c l e   a s   s h o w n   i n   F i gu r e   5 .   T h e   s kl e a rn   f e a t u r e   i n   T f - ID F   V e c t o r i z e r   i s   t h e n   us e t o   t r a n s f o r m   e a c h   i n s t a n c e   i nt o   a   fe a t u r e s   ve c t o r ,   a n d   t h e   da t a s e t   i s   d i v i de a f t e r w a rds   f o r   t r a i n i n g   (80%)   a n d   t e s t i n (20%) .   D i m e n s i o na l i t y   r e duc t i o n   i s   e v e n t ua l l y   a ppl i e t o   t h e   f e a t u r e   v e c t o r s   by   us i n t - S N E   a s   s h o w n   i n   F i gur e   2 .   I t hi s   pa rt ,   a   s o l ut i o n   t o   t h e   p r o b l e m   w a s   dra w n   up  b a s e o t h e   t i t l e s   i t h e   a r t i c l e s   a n d   t h e c l a s s i f i e a c c o r di n g l y ,   a s   s h o w n   i F i g u r e   5 .             F i gu r e   5 .   T i t l e s   o f   f ul l - t e xt   a r t i c l e s       4. 4 .       C l u s te r i n r e s u l ts   T h e   c l us t e ri n pe r f o r m a n c e   of   h i e r a r c h i c a l   a nd  k - m e a n s   c l us t e r i ng  o n   a n   u nl a b e l l e CO R D - 19  da t a s e t   i s   i ni t i a l l y   e v a l ua t e d.   H i e ra r c h i c a l   c l us t e ri n r e c u r s i v e l y   m e r ge s   a   pa i r   o f   c l us t e r s   t ha t   m i ni m a l l y   i n c r e a s e s   a   gi v e l i nka ge   d i s t a n c e .   I t hi s   w o r k,   a   t o t a l   o f   10  c l us t e r s   a r e   e m p l oy e d,   a nd  t h e   ' e uc l i de a n'   di s t a n c e   a nd  l i n k a ge   (' w a r d' a r e   us e t o   c o m pa r e   t h e   pe r f orm a n c e   o f   h i e r a r c h i c a l   c l us t e r i ng  w i t h   t h a t   o f   k - m e a n s   c l us t e ri n a s   s h o w n   i n   F i gu r e s   a n 7 .   K - m e a n s   c l us t e r i ng  i s   e m pl o y e t o   g e n e ra t e   t h e   l a b e l s   fo r   t h e   s upe r v i s e c l a s s i f i c a t i o n   m o de l s .   T h e   pa ra m e t e r s   k,   n _j o b s   a n v e r b o s e   a r e   s e t   t o   10,   a n 1 0,   r e s pe c t i v e l y .   E a c h   c l us t e i s   a l s o   s ub j e c t e t o   t o pi c   m o de l l i n g   t o   o b t a i n   t h e   ke y w o r ds   fo r   e a c h   c l us t e r.       Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Cl as s i f i c a t i o o f   a   CO V ID - 19   da t as e t   b y   us i ng   l ab e l s   c r e at e f r om   c l us t e r i ng   al g or i t hm s   ( L ay t R a f e a )   17 1       F i gu r e   6 .   H i e ra r c hi c a l   c l us t e r i ng       F i gu r e   7 .   K - m e a n s   c l us t e ri n g       4. 5 .       C l as s i fi c at i o n   r e s u l ts   T h e   c l a s s i f i c a t i o n   e v a l ua t i o n   pe r f o r m a n c e   of   R F ,   D T   a n b a ggi ng  o n   CO R D - 19  i s   t h e n   e v a l ua t e d .   T h e   f i t   f un c t i o i n   P y t h o n   i s   us e w i t h   a c c ur a c y ,   pr e c i s i o n   a n r e c a l l   a s   pe r f o r m a n c e   m e a s u r e s .   T a b l e   pr e s e nt s   t h e   c l a s s i f i c a t i o n   r e s ul t s   f o r   t h e   t r a i n i ng  da t a s e t .   I n   l i n e   w i t h   o ur   e xpe c t a t i o n s ,   R F   s h o w s   t h e   b e s t   pe r f o r m a n c e   a m o n gs t   t h e   t hr e e   c l a s s i f i c a t i o n   a l go ri t hm s ,   f o l l o w e by   b a ggi n a n D T .   T a b l e   pr e s e nt s   t h e   c l a s s i f i c a t i o n   pe r f o r m a n c e   of   t h e s e   a l go ri t hm s   f o r   t h e   t e s t i n g   da t a s e t .   I n   l i n e   w i t h   T a b l e   2,   T a b l e   s h o w s   t h a t   R F   a c h i e v e s   t h e   b e s t   pe r fo r m a n c e   a m o n gs t   t h e   t hr e e   c l a s s i f i c a t i o n   a l go ri t hm s   e m pl oy e w h e n   w e   c h o s e   c l a s s i f i c a t i o b a s e o n   t h e   t i t l e   i t h e   a rt i c l e s   i n   t h i s   w o r k.       T a b l e   2 .   C l a s s i f i c a t i o r e s ul t s   f o r   t h e   t r a i n i ng  d a t a s e t   M o d e l s   RF   DT   Ba g g i n g   A c c u ra c y   9 8 . 6 2 5   9 7 . 7 5 0   9 8 . 0 7 5   P re c i s i o n   9 7 . 6 8 5   9 5 . 7 0 2   9 6 . 3 0 3   Re c a l l   9 7 . 4 7 1   9 5 . 8 8 4   9 6 . 1 4 0     T a b l e   3 .   C l a s s i f i c a t i o r e s ul t s   f o r   t h e   t e s t i n g   da t a s e t   M o d e l s   RF   DT   Ba g g i n g   A c c u ra c y   9 8 . 2 6 7   9 7 . 6 3 3   9 7 . 8 3 3   P re c i s i o n   9 6 . 6 1 2   9 5 . 3 3 2   9 5 . 7 6 6   Re c a l l   9 7 . 1 1 1   9 5 . 3 8 0   9 5 . 8 0 3         5.   C O N C LU S I O N       T hi s   w o r a i m s   t o   a i d   s pe c i a l i s t s   i u n de r s t a ndi ng  t h e   s p r e a o f   CO V ID - 19  a r o un d   t h e   w o r l a n i de v i s i n a n   e f f e c t i v e   t r e a t m e nt   a ga i n s t   t h e   v i r us .   Co n f i rm e c a s e s   a n de a t h s   a r e   m o s t l y   di s t r i b ut e i e c o n o m i c a l l y   de ve l o p e c o un t ri e s   w i t h   s t r o n g   m e di c a l   t e s t i n c a pa b i l i t i e s .   CO V ID - 19  i s   k n o w n   f o r   i t s   s t r o n i n f e c t i v i t y ,   l o n i n c ub a t i o n   pe ri o a n d i f f i c ul t y   of   d e t e c t i o n ,   a l l   of   w h i c h   c o n t ri b ut e   t o   i t s   r a pi s pr e a d .   T hi s   s t udy   a t t e m pt s   t o   un de r s t a n t h e   r e s po n s e s   of   de ve l o pi n c ount r i e s   t o   t h e   pa n de m i c   by   e xa m i n i ng  pub l i s h e a r t i c l e s   t h a t   a r e   di r e c t l y   r e l a t e t o   CO V ID - 19   i h o pe s   of   de t e rm i ni n t h o s e   f a c t o r s   t h a t   a f f e c t   t h e i a b i l i t y   t r e s po n t o   s uc h   pa nde m i c .   T h e   CO R D - 19  da t a s e t ,   w h i c h   i s   t h e   m o s t   c o m pr e h e n s i v e   da t a s e t   o f   m a c hi n e - r e a d a b l e   l i t e ra t u r e   o n   C O V ID - 1 a nd  c o r o na v i rus e s   a v a i l a b l e   t o   da t e ,   p r e s e nt s   a u n s upe r v i s e l e a rni n pr o b l e m   t h a t   c a n   o n l y   b e   s o l ve by   us i n t e xt   a n d a t a   m i n i n t o o l s   [14] .   T hi s   s t udy   a t t e m p t s   t o   a dd r e s s   s uc h   pr o b l e m   by   us i n a   f o ur - s t a ge   m e t h o do l o g y .   F i r s t l y ,   t h e   a r t i c l e s   i n c l ude i t h e   CO R D - 19  d a t a s e t   a r e   p r e - pr o c e s s e d,   i n   w h i c h   t h e s e   a rt i c l e s   a r e   c l e a n e a n f i l t e r e v i a   t o ke n i s a t i o n,   v i s ua l i s a t i o n   a n a pp l i c a t i o n   of  TF - ID F ,   r e s ul t i n g   i n   a   f i n a l   d a t a s e t   c o n t a i n i ng  29 , 315   f ul l - t e xt   a rt i c l e s   t ha t   i s   d i v i de i n t o   a   t r a i n i ng  a nd  t e s t i n da t a s e t   a t   a   80: 2 ra t i o .   S e c o n dl y ,   t h e   di m e n s i o n a l i t y   of   t h e   da t a s e t   i s   r e duc e by   u s i n t - S N E T ,   hi e ra r c h i c a l   a n k - m e a n s   c l us t e ri n a r e   a pp l i e d,   w h e r e   t he   a rt i c l e s   i n   t h e   f i n a l   d a t a s e t   a r e   g r o upe i n t o   c l us t e r s   b a s e o n   t h e   s i m i l a ri t i e s   i n   t h e i r   t i t l e s ,   L a b e l s   a r e   a l s o   ge n e r a t e by   k - m e a n s   c l us t e ri n g.   F o u r t hl y ,   t h t hr e e   da t a   m i ni n t e c hni que s   R F ,   D T   a n b a gg i n a r e   a pp l i e t o   c l a s s i fy   t h e   s i m i l a a rt i c l e s   b a s e o n   t h e i t i t l e s   a nd  t o   de t e r m i n e   w h i c h   o f   t h e s e   a l go r i t hm s   s h o w   t h e   b e s t   pe r fo r m a n c e .   T h e   p r o po s e t o pi c   m o de l   A CCM   o ut pe r f o r m s   t h e   o t h e r   m o de l s   t ha t   ha v e   b e e n   a pp l i e o n   t h e   CO R D - 19  da t a s e t   i n   t e rm s   o f   (t i t l e c l us t e r i ng  a n d   a rt i c l e   c l a s s i f i c a t i o n,   a n d   t h e   R F   t e c hni que   i s   t h e   b e s t   r e s ul t s   i t h e   c l a s s i f i c a t i o n .       A C K N O WL ED G E M EN TS     T h i s   w o rk   w a s   f u nd e d   b y   t he   A l l e I ns t i t u t e   f o A I ,   w hi c p re p a re d   t he   C O R D - 1 9   d a t a s e t   i p a r t ne rs hi p   w i t l e a d i ng   re s e a rc g ro u p s ,   a nd   K a g g l e ,   w hi c ho s t e d   t he   C O V I D - 1 9   O pe R e s e a rc D a t a s e t   C ha l l e ng e .   W e   ho p e   t ha t   t he   f i nd i ng s   o f   t hi s   w o rk   c a n   c o nt r i b u t e   t o   t he   e x t a n t   k no w l e d g e   o t he   C O V I D - 1 9   p a nd e m i c .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   21 ,   N o .   1 J a n u a r y   2021   :     164   -   173   172   R EF ER EN C ES     [ 1]   N .   Z hu  e t   al . ,   A   no v e l   c o r o na v i r us   f r o m   pa t i e n t s   w i t pn e um o ni a   i C h i na ,   2 019 ,   N .   E ng l .   J .   M e d. ,   v o l .   382 ,   no .   8,   pp .   727 733 ,   2020 ,   do i :   10. 10 56 / N E J M o a 2001 017 .   [ 2]   C .   D r o s t e et   al . ,   I de nt i f i c a t i o o f   a   nov e l   c o r o na v i r us   i pa t i e n t s   w i t s e v e r e   a c ut e   r e s pi r a t o r y   s y ndr o m e ,   N .   E ngl .   J .   M e d. ,   v o l .   348 ,   no .   20 ,   p p.   19 67 1 976 ,   2003 ,   do i :   10. 1 056 / N E J M o a 030 747 .   [ 3]   Y .   C h e n,   Q .   L i u ,   a nd  D .   G uo ,   E m e r g i ng   c o r o na v i r us e s :   G e no m e   s t r uc t ur e ,   r e pl i c a t i o n,   a nd   pa t ho g e ne s i s ,   J .   M e d.   V i r o l . ,   v o l .   9 2,   no .   4 ,   p p.   41 8 42 3,   20 20 ,   do i :   10 . 100 2/ j m v . 256 81.   [ 4]   W o r l H e a l t h   O r g a n i z a t i o ( W H O ) ,   N o v e l   C o r o na v i r us   (   20 19 - nC o V   )   S i t ua t i o R e po r t   -   21  J a nu a r y   2020,   W H O   B ul l . ,   no .   J A N U A R Y ,   pp .   1 7 ,   2020 .   [ 5]   C D C   C e n t e r s   f o r   D i s e a s e   C o nt r o l   a nd   P r e v e nt i o n,   2020 .   H e a l t hc a r e   P r o f e s s i o na l s   F r e que nt l y   A s ke Q u e s t i o ns   a nd   A ns w e r s ,   2020   [ 6]   A .   J .   R o dr i g ue z - M o r a l e s   e t   al . ,   C l i ni c a l ,   l a bo r a t o r y   a nd  i m a g i ng   f e a t ur e s   o f   C O V I D - 19 :   A   s y s t e m a t i c   r e v i e w   a n m e t a - an a l y s i s ,   T r a v e l   M e d.   I nf e c t .   D i s . ,   no .   F e b r ua r y ,   p.   101 623 ,   2 020,   do i :   10. 1016 / j . t m a i d. 2020 . 1 0162 3.   [ 7]   R .   M i s hr a   e t   al . ,   T e xt   s um m a r i z a t i o i t h e   b i o m e di c a l   do m a i n:   A   s y s t e m a t i c   r e v i e w   o f   r e c e nt   r e s e a r c h,   J .   B i om e d.   I n f o r m . ,   v o l .   52 ,   pp .   457 467 ,   2014 ,   do i :   10. 1 016 / j . j bi . 20 1 4. 06 . 0 09.   [ 8]   L .   A m a do r   P e ni c he t ,   D .   M a g da l e no   G ue v a r a ,   a nd  M .   M .   G a r c í a   L o r e nz o ,   N e w   s i m i l a r i t y   f unc t i o f o r   s c i e nt i f i c   a r t i c l e s   c l us t e r i ng   ba s e o t he   bi b l i o g r a ph i c   r e f e r e nc e s ,   C om put .   y   Si s t . ,   v o l .   22,   no .   1,   pp .   93 1 02 ,   2018 ,   do i :   10. 1 3053 / C y S - 22 - 1 - 2763.   [ 9]   A .   K .   U y s a l   a nd  S .   G una l ,   A   nov e l   pr o ba b i l i s t i c   f e a t ur e   s e l e c t i o m e t ho f o r   t e xt   c l a s s i f i c a t i o n,   K now l e dge - B as e S y s t . ,   v o l .   36 ,   pp .   226 235 ,   2012 ,   do i :   10. 1 016 / j . kno s y s . 2012 . 06 . 00 5.   [ 10]   M .   G h i a s s i ,   M .   O l s c hi m k e ,   B .   M o o n,   a nd  P .   A r na udo ,   A ut o m a t e t e xt   c l a s s i f i c a t i o us i ng   a   dy na m i c   a r t i f i c i a l   ne ur a l   ne t w o r m o de l ,   E x pe r t   Sy s t .   A p pl . ,   v o l .   39 ,   no .   12 ,   pp .   1096 7 10 976 ,   20 12 ,   do i :   10. 1 016 / j . e s w a . 201 2. 03. 027 .   [ 11]   J .   H a n ,   M .   K a m be r ,   a n J .   P e i ,   D a t a   M i n i ng   T e c hn i qu e s ,   T h i r d   E di t i o n,   p.   84 7,   20 11.   [ 12]   D .   B r a h a ,   D a t a   M i n i ng   f or   D e s i g n .   20 02.   [ 13]   A .   K .   A ba s i ,   A .   T .   K ha de r ,   M .   A .   A l - B e t a r ,   S .   N a i m ,   S .   N .   M a kh a d m e h,   a nd   Z .   A .   A .   A l y a s s e r i ,   L i nk - ba s e d   m u l t i - v e r s e   o pt i m i z e r   f o r   t e xt   do c um e nt s   c l us t e r i ng ,   A pp l .   So f t   C om put .   J. ,   v o l .   87 ,   p .   1 060 02,   20 20,   do i :   10. 1 016 / j . a s o c . 2019 . 106 002 .   [ 14]   A .   I .   f o r   A .   i pa r t n e r s hi w i t t he   C .   Z .   I ni t i a t i v e ,   C O V I D - 19  O pe R e s e a r c D a t a s e t   C h a l l e ng e   ( C O R D - 19 ) ,   s e m ant i c   s c ho l a r ,   20 20.   [ O nl i ne ] .   A v a i l a b l e :   ht t ps : / / p a g e s . s e m a n t i c s c ho l a r . o r g / c o r o na v i r us - r e s e a r c h.   [ A c c e s s e d:   20 - M a r - 2020] .   [ 15]   J .   X i a o ,   Y .   T i a n,   L .   X i e ,   X .   J i a ng ,   a nd   J .   H u a ng ,   A   H y br i C l a s s i f i c a t i o F r a m e w o r B a s e d   o C l u s t e r i ng ,   I E E E   T r ans .   I n d.   I nf or m a t i c s ,   v o l .   16 ,   no .   4 ,   pp .   217 7 21 88,   2 020 ,   do i :   10. 11 09/ T I I . 2019. 29 3367 5.   [ 16]   A .   F o n g ,   T .   K o m o l a f e ,   K .   T .   A da m s ,   A .   C o he n ,   J .   L .   H o w e ,   a nd  R .   M .   R a t w a n i ,   E x pl o r a t i o a nd  I ni t i a l   D e v e l o pm e nt   o f   T e xt   C l a s s i f i c a t i o M o de l s   t o   I de nt i f y   H e a l t I nf o r m a t i o T e c hno l o gy   U s a bi l i t y - R e l a t e P a t i e n t   S a f e t y   E v e nt   R e po r t s ,   A p pl .   C l i n.   I nf o r m . ,   v o l .   1 0,   no .   3 ,   pp.   5 21 527,   2 019 ,   do i :   10. 105 5/ s - 0039 - 16 9342 7.   [ 17]   D .   B e nv e nut o ,   M .   G i o v a ne t t i ,   L .   V a s s a l l o ,   S .   A ng e l e t t i ,   a n M .   C i c c oz z i ,   A ppl i c a t i o o f   t he   A R I M A   m o de l   o t h e   C O V I D - 2019  e p i de m i c   da t a s e t ,   D a t a   B r . ,   v o l .   29 ,   p.   10 5340 ,   202 0 ,   do i :   10. 101 6/ j . di b. 2 020 . 10 5340 .   [ 18]   S .   K .   D e y ,   M .   M .   R a hm a n ,   U .   R .   S i dd i q i ,   a n A .   H o w l a de r ,   A na l y z i ng  t he   e pi de m i o l o g i c a l   o ut br e a o f   C O V I D 19:   A   v i s ua l   e x pl o r a t o r y   da t a   a na l y s i s   a ppr o a c h,   J .   M e d .   V i r ol . ,   no .   F e b r u a r y ,   pp .   1 7,   20 20,   do i :   10. 1 002 / j m v . 2 5743 .   [ 19]   A .   K .   U y s a l   a nd  S .   G una l ,   T h e   i m pa c t   o f   pr e pr o c e s s i ng   o t e xt   c l a s s i f i c a t i o n ,   I n f .   P r oc e s s .   M anag . ,   v o l .   50,   no .   1,   pp.   10 4 11 2,   20 14,   do i :   10. 1016 / j . i pm . 201 3. 0 8. 006 .   [ 20]   E .   M é t a i s ,   F .   M e z i a ne ,   S .   V a de r a ,   V .   S ug um a r a n ,   a nd   D .   H u t c hi s o n ,   P r oc e s s i n and .   2019 .   [ 21]   B .   A l t ı ne l   a nd  M .   C .   G a ni z ,   S e m a n t i c   t e x t   c l a s s i f i c a t i o n:   A   s ur v e y   of   pa s t   a nd  r e c e n t   a dv a nc e s ,   I n f .   P r oc e s s .   M an ag. ,   v o l .   5 4,   no .   6,   p p.   11 29 1 153 ,   2018 ,   do i :   10. 1 016 / j . i pm . 2 0 18. 0 8. 001 .   [ 22]   K .   K o w s a r i ,   K .   J .   M e i m a nd i ,   M .   H e i da r y s a f a ,   S .   M e ndu ,   L .   B a r n e s ,   a nd  D .   B r o w n,   T e xt   c l a s s i f i c a t i o a l g o r i t hm s :   A   s ur v e y ,   I n f . ,   v o l .   10 ,   no .   4,   pp .   1 6 8,   20 19,   do i :   10 . 339 0/ i nf o 10040150 .   [ 23]   M .   A .   E l a z i z ,   N .   N a b i l ,   A .   A .   E w e e s ,   a n S .   L u,   A ut o m a t i c   D a t a   C l us t e r i ng   ba s e o H y br i A t o m   S e a r c h   O pt i m i z a t i o a nd  S i n e - C o s i ne   A l g o r i t hm ,   2 019  I E E E   C ongr .   E v ol .   C om pu t .   C E C   20 19  -   P r oc . ,   pp.   231 5 23 22 ,   2019 ,   do i :   10. 110 9/ C E C . 2 019 . 879 0361 .   [ 24]   J .   R a s h i d ,   S .   M .   A .   S h a h ,   a nd  A .   I r t a z a ,   A E f f i c i e nt   T o pi c   M o de l i ng   A ppr o a c f o r   T e xt   M i ni ng   a nd  I nf o r m a t i o Re t r i e v a l   t hr o ug K - m e a ns   C l us t e r i ng ,   M e hr a U ni v .   R e s .   J .   E ng.   T e c hnol . ,   v o l .   39,   no .   1,   pp .   213 222 ,   202 0,   do i :   10. 2 2581 / m ue t 1 982 . 200 1. 20.   [ 25]   F .   V a n   B r a a m   H o uc kg e e s t ,   M .   J .   S c hu l t z ,   a nd   P .   E .   S pr o nk ,   U n s e t t l e i s s ue s   r e g a r di ng   i nt e ns i v e   i ns u l i t he r a py   i t he   i nt e ns i v e   c a r e   uni t ,   N e t he r l a nds   J .   C r i t .   C ar e ,   v o l .   13 ,   no .   5,   pp .   266 267 ,   2009 .   [ 26]   P .   C i c ho s z ,   A   c a s e   s t udy   i t e x t   m i ni ng   o f   di s c us s i o f o r um   po s t s :   C l a s s i f i c a t i o w i t ba g   o f   w o r ds   a nd  g l o ba l   v e c t o r s ,   I n t .   J .   A pp l .   M a t h.   C om put .   Sc i . ,   v o l .   2 8,   no .   4,   p p.   78 7 8 01,   20 18,   do i :   10. 2478 / a m c s - 201 8 - 0060 .   [ 27]   D .   M .   M a g e r m a n,   S t a t i s t i c a l   d e c i s i o n - t r e e   m o de l s   f o r   pa r s i ng ,   pp .   276 283 ,   199 5,   do i :   10. 3115 / 98 1658 . 9 8169 5.   [ 28]   H .   F a n ,   F .   X u e ,   a nd  H .   L i ,   P r o j e c t - ba s e a s - ne e d e i nf o r m a t i o r e t r i e v a l   f r o m   uns t r uc t ur e A E C   do c um e nt s ,   J .   M an ag.   E n g. ,   v o l .   31 ,   no .   1,   pp .   1 1 1,   20 14 ,   do i :   10 . 106 1/ ( A S C E ) M E . 1943 - 54 79 . 000 0341 .   [ 29]   K .   M a c ho v á ,   F .   B a r č á k ,   a nd  P .   B e dná r ,   A   ba g g i ng   m e t ho us i ng   de c i s i o t r e e s   i t h e   r o l e   o f   ba s e   c l a s s i f i e r s ,   A c t a   P ol y t e c h.   H u ngar i c a ,   v o l .   3 ,   no .   2,   p p.   12 1 13 2,   20 06.       Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       Cl as s i f i c a t i o o f   a   CO V ID - 19   da t as e t   b y   us i ng   l ab e l s   c r e at e f r om   c l us t e r i ng   al g or i t hm s   ( L ay t R a f e a )   173   B I O G R A P H I ES   O F   A U T H O R S         L ay t h   R af e H az i m   i s   a n   a s s i s t a nt   t e a c he r   a t   t h e   C i s c o   N e t w o r ki ng   A c a de m y ,   T i kr i t   U ni v e r s i t y ,   I r a q.   H e   r e c e i v e h i s   B S c   de g r e e   i C o m put e r   S c i e nc e   f r o m   T i kr i t   U n i v e r s i t y   i n   2007 ,   M s c   de g r e e   f r o m   t he   A l t i nba s   U n i v e r s i t y ,   T ur k e y   i 201 8.   H e   w o r ke a s   a   h e a o f   E l c t r o ni c   C o m put e r   C e m t e r   E C C   a t   T i k r i t   U ni v e r s i t y   dur i ng   t he   pe r i o 202 unt i l   no w .             A b d u l r ah m an   A h m e d   Jas i m   i s   a a s s i s t a n t   l e c t ur u r e r   a t   D e pa r t m e nt   o f   N e t w o r E ng i ne e r i ng \ C o l l a g e   o f   E n g i ne e n i ng ,   A l - I r a qi a   U n i v e r s i t y .   H e   r e c e i v e h i s   B S c   de g r e e   i n   C o m put e r   E ng i n e e r i ng   f r o m   D i j l a U n i v e r s i t y   i 2012,   M s c   de g r e e   i E l e c r t r i c a l   a nd  c o m put e r   E ng i ne e r i ng   f r o m   A l t i nb a s   U ni v e r s i t y ,   T u r ke y   i 2018 .         Wi s am   D aw o o d   A b d u l l ah   r e c e i v e h i s   B . S c .   de g r e e   i c o m put e r   s c i e nc e   f r o m   T i kr i t   U ni v e r s i t y ,   I r a a nd  h i s   M . S .   de g r e e   i I nf o r m a t i o T e c hno l o gy   ( w i t c o nc e nt r a t i o i n   T e l e c o m m uni c a t i o ns   a n N e t w o r ks )   f r o m   t he   U n i v e r s i t y   U t a r a   M a l a y s i a   ( U U M ) .   H e   r e c e i v e a n   e xpe r t   c e r t i f i c a t i o ns   f r o m   C i s c o   N e t w o r ki ng   A c a de m y   C C N P ,   C C N A , C C N A   S e c ur i t y ,   I o T ,   E nt r e p r e n e ur s h i p ,   G r i d ,   V o i c e ,   W i r e l e s s   C l o u d ,   L i nux,   C C N A   C y b e r s e c ur i t y   a nd  I T ,   a l s o   he   i s   a   N e t A c a a dm i n i s t r a t o r   i C i s c o   N e t w o r ki ng   A c a de m y ,   I r a q,   c ur r e n t l y   he   i s   l e c t ur e r   i t he   T i k r i t   U ni v e r s i t y ,   C i s c o   N e t w o r ki ng   A c a de m y ,   m e m be r   i I E E E .   R e s e a r c i nt e r e s t :   P r o t o c o E ng i ne e r i ng ,   N e t w o r A na l y s i s ,   I nt e r ne t   A r c hi t e c t u r e   a nd  T e c hno l o g i e s ,   W i r e l e s s   P e r f o r m a nc e s ,   N e t w o r T r a f f i c   E ng i n e e r i n g ,   D a t a   M i n i ng ,   F u t ur e   I nt e r ne t ,   I nt e r ne t   o f   T h i ng s ,   A I ,   M L .       Evaluation Warning : The document was created with Spire.PDF for Python.