I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   18 ,   N o .   3 J u n e   20 20 ,   pp .   13 03 ~ 1310   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 1 8 .i 3 . pp 1 30 3 - 1 310             1303       Jou r n al   h o m e pa ge ht t p: / / i j e e c s . i a e s c or e . c om   T e x t   a n a l y s i o n   h e a l t h   p r o d u c t   r e v i e w s us i n g   r   a p p r o a c h       N as i b ah   H u s n M o h d   K ad i r S h a r i fah   A l i m an   F a c ul t y   o f   C o m put e r   a nd   M a t he m a t i c a l   S c i e nc e s ,   A dv a nc e A na l y t i c s   E ng i ne e r i ng   C e n t e r ,   M a l a y s i a       A r ti c l e   I n fo     A B S TR A C T     Ar t i c l e   h i s t or y :   R e c e i v e O c t   7 ,   2019   R e v i s e D e c   9 ,   2 019   A c c e pt e D e c   23 ,   2 01 9       I t he   s o c i a l   m e di a ,   pr o duc t   r e v i e w s   c o nt a i o f   t e xt ,   e m o t i c o n,   nu m be r s   a nd   s y m bo l s   t ha t   ha r t o   i de nt i f y   t he   t e x t   s um m a r i z a t i o n.   T e x t   a na l y t i c s   i s   o ne   of   t he   k e y   t e c hni que s   i e xp l o r i ng   t he   u ns t r uc t u r e da t a .   T he   pur po s e   o f   t hi s   s t udy   i s   s o l v i ng   t he   un s t r uc t u r e d   da t a   by   s o r t   a nd   s um m a r i z e s   t he   r e v i e w   da t a   t hr o ug a   W e b - B a s e T e xt   A na l y t i c s   us i ng   R   a ppr o a c h.   A c c o r di ng   t o   t he   c om pa r a t i v e   t a bl e   b e t w e e s t ud i e s   i N a t u r a l   L a ng ua g e   P r o c e s s i ng   ( N L P )   f e a t u r e s ,   i t   w a s   o bs e r v e t ha t   W e b - B a s e d   T e xt   A na l y t i c s   us i ng   R   a pp r o a c c a a na l y z e   t he   u ns t r uc t ur e d a t a   by   us i ng   t h e   da t a   pr o c e s s i ng   pa c ka g e   i R .   I t   c o m bi ne s   a l l   t he   N L P   f e a t ur e s   i n   t h e   m e n p a r t   o f   t he   t e xt   a na l y t i c s   pr o c e s s   i s t e p s   a nd  i t   i s   l a b e l e t o   m a ke   i t   e a s i e r   f o r   us e r s   t o   v i e w   a l l   t he   t e x t   s um m a r i z a t i o n.   T hi s   s t udy   us e s   he a l t pr o duc t   r e v i e w   f r o m   S ha kl e e   a s   t he   da t a   s e t .   T he   pr o po s e a ppr o a c s ho w s   t he   a c c e pt a b l e   p e r f o r m a nc e   i t e r m s   o f   s y s t e m   f e a t ur e s   e x e c ut i o c o m pa r e d   w i t t h e   ba s e l i ne   m o de l   s y s t e m .   Ke y w or ds :   B i da t a   R   pr o g r a m m i n g   T e xt   a n a l y s i s   U n s t ruc t u r e d a t a   C opy r i gh t   ©   2020   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   S ha r i f a h   A l i m a n ,     F a c ul t y   of   Co m put e r   a n d   M a t h e m a t i c a l   S c i e n c e s ,   A dv a n c e A n a l y t i c s   E ngi n e e ri n g   Ce n t e r ,   U n i v e r s i t i   T e kn o l o gi   M A R A ,   S ha A l a m ,   S e l a n go r,   M a l a y s i a .   E m a i l :   s ha ri f a ha l i @ t m s k . ui t m . e du . m y       1.   I N TR O D U C TI O N     P r o duc t   r e v i e w   pl a y s   a n   i m po rt a nt   r o l e   i n   t h e   c o n s um e r   p ur c h a s e   de c i s i o n   a n t h e   m a n uf a c t u r e b us i n e s s   i n s i g ht s   [1] T h e   m a nuf a c t ur e r s   t e n t o   ha v e   t h e   i n s i g h t s   f r o m   c o n s u m e r e v i e w s   of   t h e   p r o duc t s ,     t o   h e l i ge n e ra t i ng  i de a s   f o r   m a r ke t i ng  s t ra t e gi e s   t o   e xpa nd  t h e   p r o duc t s   [2].   P e o pl e   i n   v a r i o us   b us i n e s s e s   c a n   de r i v e   us e f ul   i n f o r m a t i o n   f r o m   s o c i a l   n e t w o r da t a   t o   unde r s t a n t h e i r   c o n s um e r s   m o r e   c o m pr e h e n s i v e l y   a n p r e c i s e l y   by   ut i l i z i n g   v a ri o us   t y pe s   of   s o c i a l   m e di a   a n a l y t i c   t oo l s   [3].   I n   r e a c hi n t h e   v a r i a t i o n   o f   s oc i a l   m e di a   d a t a ,   c o n s um e r s   p r o duc t s   r e v i e w   i n   s o c i a l   m e di a   a r e   i n   u n s t r uc t u r e f o r m   [4 - 6] .   T h e   r e v i e w   c o n t a i n s   of   t e xt ,   e m o t i c o n ,   num b e r s   a n s y m bo l s   t h a t   h a r t o   i de n t i f y   t h e   t e xt   s um m a r i z a t i o n   w h i c h   i s   ha r de r   t o   s o r t   a n c a t e go r i z e   t h e m   i nt o   t h e   us e f ul   s um m a ri e s   [7] .   T h i s   s t u d y   c o n t ri b ut i o c ov e r i n t h e   R   a pp r o a c h   o f   t e xt   a n a l y t i c s   us i n w e b - b a s e d   i n   t h e   h e a l t h   p r o duc t s   c o n s um e rs   o n l i n e   r e v i e w   i n   c a pt u ri n i n s i g h t s   a nd  v i e w   f r o m   s o c i a l   m e di a   d a t a   f o r   t h e   h e a l t h   p r o duc t s .   T h e   l a c k   o f   w e b   i nt e r f a c e   i n   t h e   a na l y t i c s   a r e a   m a ke s   m a r ke t e r   a n d   pe o pl e   i b us i n e s s   w o r l c a nn o t   ha v e   t h e   da t a   t ra n s l a t i o n   f r o m   t h e   b i d a t a .     F urt h e rm o r e ,   f r o m   v a r i o us   s o ur c e s   of   s o c i a l   m e di a   [8] ,   a   b us i n e s s   w i l l   t ra di t i o na l l y   l o o f r o m   o n e   t o n e   pl a t f o r m   t o   ge t   f e e d b a c o n   t h e i r   p r o duc t s   [9 - 10] .   D i s t ri b ut i o n   a nd   s pl i t   o t h i s   a ppl i c a t i o n   a l s o   c a us e   e ff i c i e n c y   i n t e rr up t i o n   i n   ge n e r a t i n i n f o rm a t i o n   f r o m   c o n s um e r   r e v i e w   da t a   [11].   M a n y   a na l y s t s   c a n   do   a n a l y t i c s   pr o duc t s   t o   de t e rm i n e   t h e   de t a i l s   o f   da t a   i nt e n t   b ut   l a c o f   i nt e g r a t i o b e t w e e n   da t a   t r a n s l a t i o w i t h   th e   w e i nt e r f a c e .   I n   a na l y z i ng  t h e   u n s t r uc t u r e t e xt ua l   da t a ,   B a t ri n c a   e t   a l   [12]  c a t e go ri z e t h e   ke y   t e c hn i q ue s   i nt o   s i t h a t   a r e   na t u r a l   l a ngua ge   pr o c e s s i n (N L P )   [13],   n e w s   a n a l y t i c s ,   o pi n i o n   m i ni n [14 - 1 6],   da t a   s c r a p i n g ,   s e nt i m e nt   a na l y s i s   [9 17 - 23]  a n t e xt   a n a l y t i c s   [10,   24].   In   t h i s   s t udy ,   i n i t i a l l y ,   n a t u ra l   l a n gu a ge   p r o c e s s i n i s   t h e   p r o c e dur e   o f   s t r a t e gy   t o   s e pa r a t i n g   s i g ni f i c a nt   d a t a   f r o m   r e gu l a r   l a ngua ge   i n pu t   a n c r e a t i n t e n de n c y   da t a   m e a n i n g .   T h e   s e c o n t e c hni que ,   t e xt   a na l y t i c s   i s   us e t o   di s t i ngui s a n d   e xt r i c a t e   e m o t i o n a l   d a t a   i n   s o ur c e   m a t e ri a l s .   T h e s e   t w o   t e c h n i que s   a re   r e l y i n e a c h   o t h e r   b e c a us e   t h e s e   e l e m e n t s   us e   t h e   s a m e   f e a t ur e s   i n   o b t a i n i ng  t e xt   o r   s e n t i m e n t   s u m m a r i z a t i o n .   T hi s   s t udy   c o n s i s t s   o f   S e c t i o n   t ha t   e xpl a i n s   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   18 ,   N o .   3 J u n e   20 2 :     1303   -   1 310   1304   t h e   r e l a t e w o r ks   f r o m   t h e   c o m pa ri s o n   t a b l e   o f   t h e   N L P   s t udi e s ,   S e c t i o t ha t   e xpl a i n s   t h e   p r o po s e d     s y s t e m   R   a pp r o a c h,   S e c t i o 4   di s c us s   t h e   r e s ul t s   o f   t h e   a pp r o a c a nd  S e c t i o 5   c o n t a i t h e   c o n c l us i o n s .       2.   R ELA TED   WO R K   T h e r e   a r e   s i m i l a r   a pp l i c a t i o n s   r e l a t e t o   t e xt   a n a l y t i c s   m e t h o d.   F o r   t h e   da t a   us e by   t h e s e   s i m i l a a ppl i c a t i o n s   a r e   f r o m   s oc i a l   m e di a   s o ur c e s   s uc h   a s   F a c e boo [25],   T w i t t e r   [26 ,   27]  a n t h e r e   a r e   s o m e   r e s o ur c e s   t a ke n   f r o m   a   b us i n e s s - t h e m e   w e b s i t e   s uc h   a s   o n l i n e   r e v i e w   da t a   f r o m   h o t e l   b o o ki n w e bs i t e s   [24 a n o nl i n e   p r o duc t   s a l e s .   F r o m   t h e   c o m pa ra t i v e   s t udi e s   m a de   a l l   o f   t h e   da t a   t a ke n   f r o m   o nl i n e   s o ur c e s   a n r e qui r e s   t h e   pr o c e s s   of  i de n t i fy i n t h e   r e qui r e da t a   a nd  da t a   fo r m s .   T h i s   i s   b e c a us e   da t a   o b t a i n e f r o m   o n l i n e   s o ur c e s   a r e   n o t   t h e   s a m e   a c c o r di ng  t o   t h e   t y pe   a n fo r m   o f   t h e   da t a b a s e   us e by   t h e   o n l i n e   s o ur c e   pl a t f o r m .   T h e r e f o r e ,   e a c h   s i m i l a r   a ppl i c a t i o n   us i n d i f f e r e n t   t o o l s   a n m e t h o ds   i n   o b t a i n i n d a t a   e xt ra c t e f r o m   t h e   o n l i n e   s o ur c e   pl a t f o r m .   E n l i g h t e nm e nt   f o r   t hi s   e xt ra c t i o n   d a t a   i s   i m po r t a n t   a s   t h e   i n f o r m a t i o r e qui r e b y   t h e   m a n uf a c t u r e r   de pe n ds   o n   t h e   f r e que n c y   of   d a t a   a n t h e   num b e r   o f   r e s po n s e s   f r o m   c us t o m e r s   t o   t h e i r   p r o duc t   o b us i n e s s .   R e fe rr i n g   t o   t h e   r e l a t e w o r ks ,   t h e r e   a r e   t w o   t y pe s   of   N a t u ra l   L a ngua ge   P r o c e s s i n us e by   s i m i l a a ppl i c a t i o n s   p r e v i o us l y   c a l l e S e n t i m e n t   A n a l y s i s   a n d   T e xt   A na l y t i c s .   F o r   s e nt i m e nt   a n a l y s i s ,   i t   w a s   c a rr i e o ut   t o   f i n o ut   t h e   s i t u a t i o n   a nd  t e n de n c y   i n   a   s i t ua t i o n   s uc h   a s   t h e   e xa m p l e   i n   t h e   s t udy   of   A l - S a ff a r ,   e t   a l .   [18]  w h i c h   s t u di e s   t h e   M a l a y   T e xt   M o de l   Cl a s s i f i c a t i o n   us i n s e nt i m e nt   a na l y s i s .   N e xt ,   e t   a l .   [19]  a n d   K a m y a b ,   e t   a l .   [1 7]  ha v e   us e t h e   s e n t i m e n t   a na l y s i s   m e t ho i n   t h e i r   s t udy   i n   i de n t i f y i n s o c i a l   s e n t i m e nt   t hr o ugh   s o c i a l   m e d i a ,   us i n T w i t t e r   po s t   da t a   a n t h e   c o u nt r y ' s   w e bs i t e   a ga i n s t   t h e   c o un t r y   a n po l i t i c a l   i s s ue s .   T h i s   s u gge s t s   t ha t ,   s e nt i m e nt   a na l y s i s   a n t e x t   a na l y t i c s   a r e   a m o n g   t h e   w a y s   t o   pr o c e s s   t e xt s   a n d   o pi n i o n s   t ha t   a r e   v o i c e by   p e o pl e   t hr o ug h   s o c i a l   m e di a   m e di um s .   T hi s   m e t h o i s   w i de l y   us e be c a us e   t hr o ugh  r e s e a r c h   t h a t   ha s   b e e n   m a de ,   a r e a s   t ha t   us e   s e nt i m e nt   a na l y s i s   a n t e xt   a n a l y t i c s   i n c l ude   h e a l t h c a r e ,   po l i t i c s ,   c o unt r y   a n d   b us i n e s s .   T h e s e   a r e   t h e   m a j o r   a r e a s   t h a t   i n v o l ve   di r e c t   c o n t a c t   w i t h   h u m a n s .   F r o m   t h e   ob t a i n e s t udy ,   i t   a l s o   s h ow s   t h a t   i n   2 018  v a r i o us   s t udi e s   w e r e   c o n duc t e o n   s e n t i m e n t   a n a l y s i s .   W h i l e   f o r   t e xt   a n a l y t i c s   i s   s t i l l   l o w .   T hr o ug h   t hi s   o b s e r v a t i o n ,   i t   c a n   b e   c o n c l ude t h a t   t h e   a b o ve   s t udi e s   do   n o t   h a v e   us e r   i n t e r f a c e s   t ha t   m a y   b e   due   t a   n o n - f o c us e s t ud y   ob j e c t i ve   of   t h e   us e r   i nt e r f a c e   o r   a   l i m i t e r e s e a r c h   c a pa b i l i t y   o n   t h e   ge n e ra t i o n   o f   t h i s   us e r   i nt e r f a c e .   In   a ddi t i o n ,   a l l   o f   t h e   a bo ve   s t udi e s   h a v e   fe a t ur e s   t ha t   a r e   us e i n   d i s pl a y i n g   a n a l y t i c a l   r e s ul t s   f r o m   s e nt i m e nt   a n t e x t   a na l y s i s   w o r ks   t ha t   ha v e   be e n   do n e .   A s   o b s e r v e d,   t h e   e xt r a c t i o n   a n t e r m   f r e q ue n c y   da t a   p r o c e s s   i s   a   m a nda t o r y   pr o c e s s   t ha t   h a s   b e e n   do n e   by   a l l   of   t h e   a bo ve   s t udi e s .     N e xt   a r e   t h e   f e a t ur e s   a na l y s i s   r e s ul t s   us e by   t h e s e   s t udi e s   a r e   W o r C l o ud  a n B a r   P l o t .   T h e s e   t w o   fe a t u r e s   a r e   gr a p h i c a l   da t a   s um m a ri z a t i o n   t o   t h e   s e n t i m e n t s   a n t e xt   a na l y t i c s   pe r fo r m e by   t h e   s t udi e s .   U n de r s t a n di ng  o n   w h a t ' s   b e h i n t h i s   m a t t e r,   s e nt i m e n t   a nd  t e xt   a na l y s i s   t h a t   c a n   gi v e   i n s i g ht s   s h o ul b e   f ur t h e r   e xp a n de t o   ga i t h e   b r e a d t o f   ge n e r a t i ng  i n f o r m a t i o a nd  t h e   qu a l i t y   of   a i n s i g h t .       3.   P R O P O S ED   F R A M E W O R K   W E B - B A S ED   TEX T   A N A LY TI C S     T h e   m a i n   o bj e c t i v e   of   t h i s   s t udy   i s   t o   s o l v e   t h e   un s t r uc t u r e d   da t a   b y   s o r t   a nd  s um m a ri z e   t h e   r e v i e w   da t a   us i n a   W e b - B a s e T e xt   A n a l y t i c s   us i n R   a pp r o a c h.   T h e   p r o c e s s   o f   t e xt   a n a l y t i c s   w a s   i n c l ud i n g   s c r a p i n da t a   o n   t h e   s o c i a l   m e di a   us i n s c h e m a t i c   c o de   a nd  t oo l s ,   a s s o c i a t i o n   a n a l y s i s   a n v i s ua l i z a t i o n   i o r de r   t o   pr e di c t i v e   a n a l y t i c s .   A s   t h e   n a t u r e   a n t y pe   of   s oc i a l   da t a   r e pr e s e nt   t h e   u n i que   a t t r i b ut e s   o b i da t a   i n   a s pe c t s   of   vo l um e ,   v a r i e t y ,   ve l o c i t y ,   v e r a c i t y   [4] F i gu r e   s h o w s   t h e   pr o po s e f r a m e w o r o f   w e b - b a s e d   t e xt   a n a l y t i c s   fo r   t h e   s t udy .   T h e   f i r s t   p ha s e   o bj e c t i ve   i s   t o   e xt r a c t   t h e   o nl i n e   c o n s um e r e v i e w s   f r o m   s o c i a l   m e di a   r e l a t e t o   S ha kl e e   h e a l t h   p r o duc t s   r e v i e w s .   In   i de nt i fy i n t h e   r e l a t e d   h e a l t h   p r o duc t   a nd  t h e   s o c i a l   m e di a   pl a t f o r m ,     w e   pe r f o r m   t h e   c o m pa ra t i v e   t a b l e   of   s i m i l a r   a ppl i c a t i o n   a b out   t e xt   a n a l y t i c s   a n t h e   po t e n t i a l   s y s t e m   de s i gn .   T h e   da t a   e xt r a c t i o n   t o o l   i s   t h e   i m po r t a n t   e l e m e n t   t o   e xt r a c t   t h e   da t a   r e v i e w   f r o m   t h e   s o c i a l   m e di a .   In  r e t r i e v i n t h e   s o c i a l   m e di a   p r o duc t   r e v i e w   da t a ,   s y s t e m   de v e l o pe r   n e e ds   t o   h a v e   pe rm i s s i o f o r m   t h e   s oc i a l   m e di a   o w n e r   e xc e pt   t h e   o pe n   pub l i c   s o c i a l   m e di a .   S o m e   s oc i a l   m e di a   l i ke   T w i t t e r   a n F a c e boo n e e d   t o   a ppr o v e   t h e   pe r m i s s i o n   o f   e n t e r i n t h e i r   da t a   s y s t e m .   T h e   A P pe r m i s s i o n   f r o m   s o c i a l   m e di a   o w n e r   c o n s i s t s   o f   ke y s   a n a c c e s s   t o ke n   s e c r e t   f o r   r e s e a r c h e a c c e s s i n t h e   s o c i a l   m e di a   d a t a .   T h e   e xt ra c t e da t a   t h e n   i s   t ra n s f o r m e i n t o   t h e   CS V   f i l e   fo r m a t   a s   t h e   da t a s e t   w i l l   b e   us e i n   t h e   t e xt   a n a l y t i c s   s y s t e m .   A   w e ha s   a   h u g e   a m o u n t   o f   da t a   a n t h e   w e b   a l s o   de ve l o pe us i n a   c o m b i na t i o n   o f   di ff e r e n t   p r o g r a m m i n o r   de pe n di n g   o n   t h e   de v e l o pe r   o f   t h e   w e b .   T h e r e f o r e ,   t o   ge t   t h e   de s i r e da t a   f r o m   a   w e b ,   w e b   s c r a pi ng  i s   a   t e c hn i q ue   f o r   e xt ra c t i n da t a   f r o m   a   w e b   s i t e .   W e b   s c r a pi n w i l l   e xt r a c t   u n s t r uc t u r e o s e m i - s t ruc t u r e da t a   i n t o   a   d a t a b a s e   t ha t   ha s   a n   o r ga ni z e s t r uc t u r e   b e c a us e   t h e   s t ruc t ur e d   i nt e nt   h e r e   i s   s t ruc t u r e d.   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       T e x t   ana l y s i s   on   he al t pr o duc t   r e v i e w s   us i ng  r   a ppr oac ( N as i bah  H us na  Mohd   Kad i r )   1305       F i gu r e   1 .   P r o po s e f r a m e w o r w e b - b a s e t e xt   a n a l y t i c s       N e xt ,   t h e   s e c o n p h a s e   o bj e c t i v e   i s   t o   a n a l y z e   t h e   o n l i n e   c on s u m e r   r e v i e w s   us i n t e xt   a n a l y t i c s   b y   us i n R   pa c ka ge s   a pp r o a c h.   R   pa c ka ge s   i n c l ude s   t h e   t e x t   p r e - p r o c e s s i n m e t h o t o   pe r f o r m   l o w e r c a s e   t r a n s f o r m a t i o n ,   r e m o v e   pun c t ua t i o n,   r e m o v e   s t o w o r ds ,   re m ov e   s pe c i a l   c ha ra c t e r s   a n w o r s t e m m i ng.     T e xt   p r e - p r o c e s s i n pe r f o r m s   t h e   r e v i e w   t r a n s f o r m a t i o n   i n   o r de r   t o   s t a nda r d i z e   t h e   o ut put   o f   t h e   t e xt   r e v i e w   b e fo r e   t h e   t e xt   b e e n   a na l y z e   a n p r o c e s s e d.   A c c o r di n t o   [8]  t h e r e   a r e   f o ur   pr o c e s s   r e l a t e t o   t e xt   a na l y s i s   w o r t h a t   a r e   i m po rt i n t h e   da t a s e t ,   c l e a n i ng  a n p r e - p r o c e s s i n t h e   r a w   da t a ,   r e p r e s e n t i n g ,   f i l t e r i n a n d   w e i ght i n t h e   t o ke n s   a n l a s t l y   i s   a n a l y z i n g .   F i r s t   s t e s t a r t s   w i t h   i m po rt i n t h e   m a n y   t y pe s   of   t e xt   fo r   e xa m pl e   i n   . pdf ,   . c s v   o r   e xc e l   f i l e s   i n t o   t h e   R   t e xt   c o r pus   us i n t h e   R   pa c ka ge   f o r   r u nni n t h e   o pe r a t i o n s .   S e c o n t e c hn i que   i s   c l e a ni n a n p r e - p r o c e s s i n t h e   do c u m e nt s .   I n   t h i s   s t e p,   i t   c o ve r s   t h e   s t e m m i z a t i o n ,   r e m o v e   s t o w o r ds ,   pu n c t u a t i o a n d   t ra n s f o r m   t h e   s t ri n g   i nt o   t h e   l o w e r   c a s e   a nd  t h e t hi s   s t ri n g   b e c o m e   i nt t o ke n s .   T h e n,   t h e   t hi r p r o c e dur e   i s   r e p r e s e n t i n g ,   f i l t e r i ng  a n w e i gh t i n t h e   t o ke n s   i nt o   D T M   (D o c um e n t   T e rm   M a t ri x) ,   T o ke n   l i s t   a nd  T F - ID F   i r e p r e s e n t i n g   t h e   t o ke n s   c o r pus   o f   t h e   do c um e nt   f i l e s   da t a s e t s .   L a s t l y ,   i s   a n a l y z i n t h e   D T M   a n T o ke n   l i s t   i n t o   t h e   v i s ua l i z a t i o n   of   gr a p h   o r   b a r   p l o t   o r   i n   t h e   s um m a ri z a t i o n   o w o r ds   o f   w o r c l o ud.   A t   t h e   l a s t   p r o c e s s ,   t h e   t e xt   s u m m a ri z a t i o n   w i l l   r e s ul t   t h e   d a t a   i nt o   f o ur   (4)  f e a t u r e s   t h a t   a r e   w o r c l o ud,   w o r t o ke n i z e r,   w o r b r e a kdo w n   a nd  w o r c o un t   b a p l o t   by   us i n g   t h e   R   S hi n y   a ppl i c a t i o n .   T h e   l a s t   p ha s e   obj e c t i v e   i s   de v e l o pi n p r o t o t y pe   w e b - b a s e of   t e xt   a n a l y s i s   of   h e a l t h   p r o duc t   r e v i e w s .   T h e   R   S h i n y   w a s   i m pl e m e n t e i n   t h e   R   S t udi o   t pe r f o r m   t h e   w e b - b a s e s y s t e m .   R   S h i n y   i s   t h e   pa c k a ge s   t ha t   c o m b i n i n g   t h e   e l e m e n t   o f   upl o a da t a   m o dul e s ,   v i e w   da t a   m o dul e s ,   w o r b r e a kdo w n   f un c t i o n ,   w o r t o ke n i z e r   f u n c t i o n,   w o r c l o ud  f un c t i o n   a n b a r   p l o t   fun c t i o n.   R   S h i n y   a s   t h e   t o o l s   t o   pe r fo r m   t h e   da t a   i n t o   w e b - b a s e d   s y s t e m   a n ha v e   a   w i de   of   R   pa c k a ge s   t o   s u ppo r t i ng  t hi s   a n a l y t i c s   pr o j e c t .   R .   S h i n y   c o n n e c t s   b e t w e e n   c o d e s   a n i n t e r f a c e s   t h a t   h e l f a c i l i t a t e   p r o duc t   ow n e r s   t o   un de r s t a n t h e   c o n t i nuo us l y   c h a r g i n o b i da t a   r e v i e w s   a b o ut   t h e i r   p r o duc t s .   T h e   p r o c e s s   f o r   us i n g   S h i n y   i s   t h a t   w e   i n s t a l l   R   S h i n y   pa c ka ge   i n t o   R   us i n g   ‘i n s t a l l . pa c kag e   (s h i n y )’   c o de ,   n e x t   t o   us e   R   S hi n y   us e   l i b r a r y   c o d e   (s h i n y t o   i n s e r t   t h e   p a c ka ge   i nt o   t h e   l i b ra r y .   S e l e c t i o n   o f   R   S h i n y   i s   ve r y   e ffe c t i ve   be c a us e   R   pr o v i de s   a   l o t   of   l i b r a ri e s   n o t   o n l y   t o   do   t e xt   a n a l y s i s   pr o c e s s ,   b ut   a l s o   t o   l o a a l l   a na l y s i s   pr o c e s s e s   i nt o   t h e   i n t e r f a c e   a n d   t h e   w e b .   R   i s   o pe n   s o ur c e   [10]  a n d   t h e   e n v i r o nm e nt   f o r   s t a t i s t i c a l   c o m put i n g   o r   s t a t i s t i c a l   p r o gra m m i ng  l a n gu a ge   a n g ra p hi c   t ha t   i s   f r e que n t l y   be e n   us e by   s t a t i s t i c i a n s   a n d   p r o f e s s i o n a l s   f r o m   m a n y   f i e l ds   t pe r f o r m   d a t a   a n a l y s i s   [28,   29]   O n e   o f   t h e   m a i pu r po s e s   fo r   R   i s   t o   gr o up  t h e   da t a   s e t   o f   pr o duc t   r e v i e w   i nt da t a   c l a s s i f i c a t i o n   [30] .   A s   s t a t e i n   t hi s   r e s e a r c h   p r o j e c t   [31] ,   t h e r e   a r e   594  R   pa c ka ge s   r e c o r ds   t ha t   a r e   us e fo r   a   v a r i e t y   of   us e s   i . e .   s o l v i n b us i n e s s   p r o b l e m s   r e l a t e t o   ke y   a r e a s   s uc h   a s   R e t a i l ,   H e a l t h ,   I n s u ra n c e   a n d   P o l i t i c s   [14] .     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   18 ,   N o .   3 J u n e   20 2 :     1303   -   1 310   1306   R e fe rr i n g   t o   t h e   s t udy   i [17 - 1 9],   a l l   o f   t h e s e   p r o j e c t s   us e   R   a s   a   t o o l   t o   a n a l y z e   t h e   da t a   o b t a i n e a c c o r di n t o   t h e i r   r e s pe c t i v e   f i e l of   s t ud y .   G e n e r a l l y ,   a l l   da t a   p r o c e s s i n us e s   D a t a   P r o c e s s   E xt ra c t i o n,     T e rm   F r e que n c y   fo r   T D M - D T M   a n f o r   t w o   fe a t ur e s   a r e   W o r Cl o ud  a n B a r   P l o t .   I n s i de   R ,   t h e   pa c k a ge s   us e t o   c a rr y   o ut   t h e s e   s t ud i e s   a r e :   R   P a c ka ge s   f o r   n o t   w e b - b a s e D a t a   A na l y s i s   i n   R ,   [31] :   a)   ‘t m     f o r   t e xt   m i n i ng   b)   ‘S n o w b a l l C’     f o r   t e xt   s t e m m i n g   c)   ‘w o r dc l o ud’    f o r   w o r c l o ud  ge n e r a t o r   d)   ‘R Co l o r B r e w e r ’    f o r   c o l o r   p a l e t t e s       4.   R ES U LTS   A N D   A N A L Y S I S   O F   EX P ER I M EN TS     T h i s   s t udy   us e d   t h e   R   a s   t h e   pr o g r a m m i n t o o l s ,   S h i n y   a s   t h e   t o o l s   t o   p e r f o r m   t h e   da t a   i n t o   w e b - b a s e s y s t e m   a n ha v e   a   w i de   of  R   pa c ka ge s   t o   s upp o r t i ng  t hi s   a n a l y t i c s   pr o j e c t .   F o r   t hi s   s t udy ,   w e   e xe c ut e d   t h e   pr o t o t y pe   us i n W i n do w s   10  o p e r a t i n s y s t e m ,   I n t e l   c o re - i a n 4G B   i n s t a l l e R A M .   W e   us e S h a kl e e   [32]   r e v i e w   da t a   a s   t h e   h e a l t h   p r o duc t   d a t a s e t .   T h e   d a t a s e t   ob t a i n e f r o m   t h e   Car i   F or um   w e b s i t e   [27,   33]   In   o u r   da t a s e t   t h e r e   a r e   2 , 515  o f   o n l i n e   m e s s a ge   r e v i e w s   w e   e xt r a c t e f r o m   t h e   Car i   F or um   us i ng  t h e   Im por t . i o   t o o l s .       4 .1 .       We b - B as e d   I n te r fa c e   S i n c e   w e b - b a s e i nt e r f a c e s   a r e   t h e   i nt e rm e di a r i e s   o f   t h e   r e l a t i o n s h i b e t w e e n   da t a   a nd  h u m a n s   v i a   t h e   w e b ,   t h i s   s t udy   h a s   de v e l o pe t h e   f r o nt - e n d   a n b a c k - e nd  i n t e r f a c e .   T h e   f r o n t - e n w i l l   b e   us e by   us e r s   w h o   m a n i pul a t e   t h e   da t a ,   w hi l e   b a c k - e n d   i s   a n   i n f ra s t r uc t u re   t ha t   s uppo rt s   a l l   m o v e m e n t   o f   da t a   t ha t   w i l l   b e   us e by   e n us e r s   [34]   F i gu r e   s h o w s   t h a t   t h e   b a c k - e n i n t e r f a c e   i s   i m po r t a n t   t o   i n f o r m   us e r s   a b o ut   h o w   o n l i n e   da t a   i s   e xt ra c t e d.   T h e   e xt r a c t e da t a   i s   o n l i n e   s t r e a m i n da t a   w hi c h   r e qu i r e s   c e r t a i n   t o o l s   t o   r e a l i z e   t h e   a l i g nm e n t   b e t w e e n   t h e   s y s t e m   a nd  t h e   da t a   t ha t   i s   t o   b e   o b t a i n e d.   T h i s   m e a n s   t ha t   t h e   d a t a   w e   w a n t   t o   ge t   i s   c o m i n g   f r o m   t h e   s o ur c e   of   t h e   w e b   o r   t h e   u n k n o w n   p a ge   o f   t h e   i n f ra s t r uc t u r e   a nd  t h e   s y s t e m   b e h i n t h e   w e b   o r   t h e   pa ge .   T h e r e f o r e ,   t h e   t o o l s   us e i n   t h e   pr o j e c t   e n a b l e   t h e   da t a   t o   b e   r e a o n   t h e   s ur f a c e   o n l y   w h i c h   do e s   n o t   i n v o l ve   t h e   m e r ge r   o c o n s o l i da t i o n   o f   a n y   s y s t e m   of   s y s t e m s .   T h e   c o n c l us i o n   i s   t ha t   t h e   da t a   e xt r a c t i o pr o c e s s   i s   f a s t e r   a n m o r e   e f f i c i e n t   b y   us i n t o o l s   be c a us e   t h e   us e c a n   s e l e c t   t h e   pa rt   o f   t h e   r e v i e w   da t a   t h a t   i s   t o   b e   us e o n l y   t h a t   i s   r e l a t e t o   t h e   p r o duc t   a n d   t h e   da t a   o b t a i n e i s   i m uc qu a n t i t y .   F i gu r e   s h o w s   t h e   f r o n t - e n i n t e r f a c e   fo r   upl o a d i n d a t a .   T hi s   i nt e r f a c e   pe rm i t s   t h e   us e t o   upl o a d   t h e   o n l i n e   r e v i e w   da t a   w h i c h   i n   t h e   T X T   o r   CS V   f i l e   fo rm a t   i n t o   t h e   s y s t e m .   T h e   us e r   t h e n   c l i c ks   o n   t h e   upl o a da t a   b ut t o n   t o   pe r f o r m   t h e   f i l e   upl o a pr o c e s s .   T h e   f i l e   m us t   i n   t h e   . t x t   o r   . c s v   f i l e   fo r m a t   a n t h e   t e xt   f i l e   i s   a   da t a   i n pu t   t o   t h e   s y s t e m   p r o c e s s .   U pl o a da t a   i s   i t he   s e c o n p h a s e   o f   f r a m e w o r b e c a us e   t h e   upl o a d   da t a   w i l l   b e   p r o c e s s e us i n g   t h e   b a c k - e n p r o c e s s .           F i gu r e   2 .   D a t a   e xt ra c t i o n   i n t r o duc t i o i nt e r f a c e   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       T e x t   ana l y s i s   on   he al t pr o duc t   r e v i e w s   us i ng  r   a ppr oac ( N as i bah  H us na  Mohd   Kad i r )   1307       F i gu r e   3 .   F i l e   up l o a i n t e r f a c e       A f t e r   t h e   da t a   h a v e   be e n   upl o a di n i n   t h e   s y s t e m ,   t h e   s y s t e m   pe rm i t s   t h e   us e r   t o   v i e w   t h e   da t a   upl o a d.   I n   t h e   w e b - b a s e s y s t e m   a l s o   s h o w s   t h e   i n s e rt e d a t a   t ha t   c a b e   v i e w   by   us e r   us i n t h i s   m o dul e .     T h e   r e v i e w   da t a   t ha t   ha s   b e e n   i n s e rt e i n t o   t h e   d a t a b a s e   ha s   b e e n   di s pl a y e i n   t h e   v i e w i n s pa c e   o f   t h o s e   r e v i e w s .   O v e r a l l   r e v i e w   da t a   w i l l   b e   di s pl a y e d a n t h e   d a t a   i s   c o n n e c t e t o   e a c h   o t h e r.   T h e   r e v i e w   da t a   i s   t h e   o r i gi na l   r e v i e w   da t a   t ha t   ha s   s t o w o r ds ,   s y m bo l s ,   s pe c i a l   c ha r a c t e r s   a n num b e r s   t h a t   ha v e   n o t   b e e n   r e m o v e a n w i l l   b e   di s c a r de du ri n t h e   p r e - p r o c e s s i n p r o c e s s   t o   r un   t h e   n e xt   p r o c e s s   o f   t e xt   a na l y s i s .     I n   c o n c l us i o n ,   t h i s   t e xt   p r e v i e w   i s   ve r y   i m po r t a nt   f o r   us   t o   s e e   t h e   s um m a r y   a n c o m b i n a t i o n s   o f   r e v i e w s   o n   t h e   p r o duc t   r o ug h l y   f ur t h e r   m a ke   t h e   d i f f e r e n c e   b e fo r e   a n d   a f t e r   t h e   da t a   a r e   a na l y z e d.     4. 2 .       Ex p l o r ato r A n a l ys i s   an d   R   S h i n y   I m p l e m e n tati o n   E xpl o r a t o r y   a n a l y s i s   i s   a   c r i t i c a l   p r o c e s s   t o   i n v e s t i ga t e   da t a   t o   s e e   pa t t e rn s   o f   da t a ,   t o   de t e c t   a n o m a l i e s ,   t o   c o n duc t   h y po t h e s i s   t e s t i n a n t o   e xa m i n e   t h e   b udge t   w i t h   t h e   h e l o f   s um m a r y   s t a t i s t i c s   a n gra p hi c a l   r e p r e s e n t a t i o n s   [35] .   T h e r e f o r e ,   s um m a r y   s t a t i s t i c s   a n g ra p hi c a l   r e p r e s e n t a t i o n   i n   t hi s   pr o j e c t   a r e   fo ur   W o r d   B r e a kdo w n ,   W o rd  T o ke n i z e r,   W o r d   Cl o ud  a n B a r   p l o t .   F o r   s um m a r y   s t a t i s t i c s ,   t h e r e   a r e   t w f e a t ur e s ,   W o r B r e a kdo w n   a n W o r T o ke n i z e r,   w h i l e   f o r   gra p h i c a l   r e p r e s e n t a t i o n   a r e   W o r Cl o ud  a n d   B a pl o t .   F o e a c h   f e a t u r e ,   i t   ha s   i t s   o w n   us e s   i n   h e l pi ng  t o   ga i i n s i g h t s   t o   us e r s .           F i gu r e   4 .   W o r d   t o ke ni z e r   i nt e r f a c e     F i gu r e   s h o w s   t h e   s e c o n e xpl o r a t o r y   a na l y s i s   of   t e xt   a n a l y t i c s   w h i c i s   t h e   b a c k - e n i n t e r f a c e ,   W o r T o ke n i z e r   I n t e r f a c e .   B e fo r e   t hi s   w o r t o ke n i z e r   i s   ge n e r a t e d,   t h e   s y s t e m   c a l l e t h e   da t a   p a r a m e t e r   t o   pe r f o r m   t hi s   a n a l y s i s .   W o r d   t o ke n i z e r   i s   t h e   p r o c e s s   t o   s e e   t h e   w o r ds   t h a t   c o m e   o ut   w i t h   a   c e r t a i n   w o r d.     A s   t h e   e xa m p l e   s h o w n   i n   F i gu r e   w h e n   w e   s e l e c t   t h e   w or ' b e l l y ' ,   t h e   a ut o m a t i c   s y s t e m   w i l l   d i s pl a y   a l l   e n t ri e s   f r o m   t h e   da t a b a s e s   t ha t   a r e   r e l a t e t o   t h e   ' s t o m a c h'   i . e .   t h e i r   t o ke ni z e w o r ds   a r e   ' t h e   a b do m e n, '   ' J us t   s t o m a c h'   a n o t h e r   e nt r i e s   t ha t   ha v e   t h e   t e r m   i n   i t .   F r o m   t hi s   v i e w ,   t hi s   W o r T o ke n i z e r   f un c t i o n   i s   i m po rt a nt   i n   ge n e r a t e s   i de a   a n i n s i g ht   a b o ut   t h e   f r e que n c y   t e r m   of   w o r ds   a n t h e   w o r ds   c o m e   w i t h   t h a t   t hr o w n   b y   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   18 ,   N o .   3 J u n e   20 2 :     1303   -   1 310   1308   co n s um e r   a c c o r di n t o   t h e   p r o duc t s .   I a dd i t i o n   t o   t h e   m a i n   f un c t i o n   o f   r e m o v i n t h e   W o r T o ke ni z e r   v i e w ,   t h i s   pa ge   a l s o   h a s   t h e   o pt i o n   o T o k e n i z e r   m i n   a n m a f o r   us   t o   s e l e c t   t h e   t o ke n   o r   w o r v a l ue   t h a t   w e   w a n t   t o   s e e   a n d   s t u dy .   F i gu r e   s h o w s   a n o t h e r   b a ck - e n i nt e r f a c e   c a l l e W o r Cl o ud  i n t e r f a c e   of   t e xt   a na l y t i c s .     T h i s   i nt e r f a c e   s h o w s   t h e   s y s t e m   c a n   ge n e r a t e   t h e   w o r c l o u b a s e o n   t h e   t e rm   f r e que n c y   of   t h e   o n l i n e   da t a   r e v i e w .   W o r Cl o ud  w i l l   s h o w   t h e   us e r   t h e   f r e que n t   w o r ds   i n c o m i n f r o m   t h e   c o n s um e r   a b o ut   t h e   pr o duc t s .   T h e   o ut go i n w o r w i l l   b e   a rra n ge a s   c l o ud,   w hi c h   ha s   g re a t   v a l ue   v a r y i n by   t h e   f r e que n c y   v a l ue   of   t h e   w o r d.   F r o m   t hi s   w o r c l o ud  a na l y s i s ,   i t   p r o v i de s   a   h o l i s t i c   v i e w   of   t h e   w o r t h a t   c o m e s   a bo ut   t h e   p r o duc t .   U s e r s   c a n   s e e   c l e a r l y   t h e   w o r ds   us e by   c o n s um e r s   t h a t   m a y   c o n s i s t   o w o r ds   a bo ut   pr o duc t   v a l ue ,   pr o duc t   qua l i t y   a n s a t i s f a c t i o n   w h e us i n g   t h e   p r o duc t .           F i gu r e   5 .   W o r d   c l o ud  I nt e r f a c e       4. 2 .   G r ap h i c al   A n al ys i s Wo r d   C l o u d   T h e   gra p h i c a l   r e s ul t s   for   t e xt   a na l y s i s   a r e   s h ow n   i n   W o r Cl o ud  fo r m .   W o r Cl o ud  w i l l   c o l l e c t   a l l   t e rm s   w i t h   f r e que n c y   t e r m s   f r o m   h i g h   t o   l o w .   N e xt   i t   w i l l   b e   s h o w n   i t h e   f o r m   o f   c l o uds   h a v i n t h e   di f fe r e n c e   i n   t h e   s i z e   o f   t h e   w r i t i n g   a c c o r di n g   t o   t h e   f r e que n c y   t e r m s   w h i c h   i s   l a rge   f o r   t h e   h i g f r e que n c y   v a l ue ,   w h i l e   t h e   s m a l l e f o r   t h e   l o w   f r e que n c y   v a l ue .   T h e r e   w e r e   12  t e r m s   r e t ri e v e (s e e   F i gur e   6)  f r o m   pa ge s   ge n e r a t e t hr o ug h   t h e   W o r Cl o ud  a n a l y s i s   pr o c e s s .   T h e   w o r ds   c o l l e c t e w e r e   S h a kl e e   h e a l t h   p r o duc t s   r e l a t e t e r m s   s uc h   a s   t h e   p r o duc t   c a t e go r i e s ,   p r o duc t s   e ffe c t i ve n e s s ,   a n i n v o l ve m e n t   o f   m e m b e r s   i n   S h a k l e e   a c t i v i t i e s .   T hr o ugh   t h i s   r e s ul t ,     w e   c a n   de t e r m i n e   t h e   i m po rt a n c e   o f   a   pr o duc t .   F r o m   t h e   a bo ve   e xa m pl e ,   t h e   p r o duc t   na m e s   a r e   E S P   a n d   A l f a l f a ,   bo t h   o w h i c h   a r e   S h a k l e e   pr o duc t s   t h a t   a r e   hi g h l y   t e r m e i n   t h e   r e v i e w   da t a .   T h i s   m e a n s   t ha t   t h e s e   t w o   pr o duc t s   m a y   b e   S h a kl e e ' s   f a vo r i t e   p r o duc t   o h o t   ke y   pr o duc t   a s   t h e   a b i l i t y   of   t h e   p r o duc t   t o   h e l p   t r e a t   v a r i o us   di s e a s e s   o r   i n   b a l a n c i n n ut ri e n t s   i n   t h e   bo d y .   A s   s uc h ,   t hi s   c o m pa n y   c a n   i n c r e a s e   t h e   m a r ke t i n g   a c t i v i t i e s   o f   o t h e p r o duc t s   t o o   fo r   c o n s um e r s   t o   s e e   a n d   c o n s um e .       “v i t ”, ”v i t am i n , ”e s p , ”b e r a t , ”m u k a”, ”k u l i t , ”b ad an ”, al f a l f a ”, ”m e m b a n t u , p e n g gu n a” , ”b e l i , ”h a r ga     F i gu r e   6 .   L i s t   o f   w o r t e r m s   t o   b e   ge n e r a t e       4. 2 .   G r ap h i c al   A n al ys i s Bar   C h ar t   In s i de   W e b - b a s e d,   t h e   b a r   c ha r t   p r o v i de s   a   s m o o t h e r   v i s ua l   a n s t ruc t u r e i p r o v i di n a n   o v e r v i e w   t hr o ugh  t h e   b a r   c ha r t .   T h e   r e s ul t i ng  b a r   c ha r t   di s p l a y s   t h e   r e s ul t   o f   f r e que n c y   t e r m s   v i a   t h e   b a r .   T h e   h i g h e s t   b a r   r e pr e s e nt s   t h e   t e rm   t ha t   h a s   t h e   h i g h e s t ,   a s   w e l l   a s   fo r   t he   m e di um   a n t h e   l o w e s t   r e pr e s e n t s   t h e   l o w   t e r m   f r e que n c y .   F i gu r e   s h o w s   t h e   t e rm ’s   f r e que n c y   of   t h e   h i g h e s t   f r e que n c y   a n s e que nt i a l   t o   l o w   f r e que n c y   t e r m s .   T h e   c h a rt   s h o w e 10  t e r m s   -   v i t am i n ,   v i t s ,   b adan ,   e s p,   b e l i ,   bol e h ,   be r a t ,   m m g ,   k ul i t   a n na i k .   T h e   h i g h e s t   w o r f r e que n c y   i s   v i t am i n   a nd  t h e   l o w e s t   i s   k ul i t .   A c c o r di n t o   S M E ,   m o s t   of   w o r ds   gi v e   t h e   b us i n e s s   i n s i g h t   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       T e x t   ana l y s i s   on   he al t pr o duc t   r e v i e w s   us i ng  r   a ppr oac ( N as i bah  H us na  Mohd   Kad i r )   1309   s uc h   a s   v i t a m i n,   b a da n,   e s p,   b e l i ,   b e r a t ,   ku l i t   a n na i k .   T h e s e   t e r m s   s h o w   a b o ut   t h e   pr o duc t s   e ffe c t s   t c o n s um e r s   f r o m   m a n y   pa r t s   o f   pe r s pe c t i v e s .   T h i s   b a r   c h a rt   i s   a   c o m p r e h e n s i v e   ov e r v i e w   t h a t   do e s   n o t   put   s pe c i f i c   v a l ue s   o n   e a c h   b a r .   H ow e ve r ,   t h e   hi g h l i g ht e t e r m   i s   h e l pf ul   i n   a na l y s t s   t a s s e s s   t h e   l e ve l   of   us a ge   a n t h e   f r e que n c y   of   t e rm s   m e nt i o n e i t h e   r e v i e w   da t a   o f   t h e   p r o duc t .             F i gu r e   7 .   G ra p h i c a l   a na l y s i s   of   b a r   c h a rt   i w e b - b a s e d       5.   C O N C LU S I O N   A s   a   c o n c l us i o n ,   t h e   us e of   R   l i b r a ri e s   a n i t s   t e xt   a n a l y t i c s   pa c ka ge s   i n   de v e l o pi n t h e   w e b - b a s e d   pr o t o t y p e   i s   qui t e   pr o m i s i n g .   T h e   s t udy   h a s   do n e   t h e   i nt e gra t i o n   o f   f r o n t - e n a nd  b a c k - e n i nt e r f a c e   fo r   w e b - b a s e t e xt   a n a l y t i c s   us i ng  R   pl a t f o r m   gi v e s   t r a n s pa r e nt   t e xt   a n a l y s i s   a t   e a c h   m o dul e .   A t   e a c h   m o dul e ,     us e r   us e t h e   f r o n t - e n i nt e r f a c e   t o   l oo a t   t h e   i m pl e m e nt a t i o n   r e s ul t s   w i t h o ut   l o o ki n a t   t h e   b a c k - e n pr o c e s s e s   s uc h   a s   s t e m m i ng,   ge n e r a t i ng  f r e que n c y   a n d   ge n e r a t i n g   s ui t a b l e   c h a rt s   f o r   v i s ua l i z a t i o n .     T h e   r e s ul t s   o f   w o r c l o ud  fo r   S ha kl e e   h e a l t h   p r o duc t s   r e v i e w s   m i ght   h e l S h a kl e e   us e r s   t o   l o o w h a t   a r e   b e s t   pr o duc t s   i n   m a rke t   a n d   S h a k l e e   o ut l e t s   t o   s t r e n g t h e t h e i r   b u s i n e s s   a n m a r ke t i ng  s t ra t e g i e s .         A C K N O WL ED G E M EN TS   T h e   a ut h o r s   w o ul l i ke   t o   t ha n F a c ul t y   of   C o m put e r   a n M a t h e m a t i c a l   S c i e n c e s ,   U n i v e r s i t i   T e kn o l o gi   M A R A ,   S h a A l a m ,   S e l a n go r,   f o r   s po n s o r i ng  t h i s   r e s e a r c h .       R EF ER EN C ES   [ 1]   L i ,   M . ,   e t   al . ,   ( 201 3) .   H e l pf ul ne s s   o f   o nl i ne   p r o duc t   r e v i e w s   a s   s e e by   c o ns um e r s :   S o ur c e   a nd  c o nt e nt   f e a t u r e s ,   I nt e r n at i on al   J o ur n al   o f   E l e c t r on i c   C om m e r c e ,   17 ( 4) ,   101 - 13 6.   [ 2]   A l z a hr a ni ,   H .   ( 2 016 ) .   S o c i a l   M e d i a   A na l y t i c s   us i ng   D a t a   M i n i ng .   G l oba l   J ou r na l   of   C om p ut e r   Sc i e nc e   and  T e c hnol o gy .   [ 3]   G r e e n e ,   J .   A . ,   e t   al . ,   ( 201 1) .   O n l i n e   s o c i a l   ne t w o r ki ng   b y   pa t i e nt s   w i t di a be t e s :   a   qua l i t a t i v e   e v a l ua t i o of   c om m uni c a t i o w i t F a c e bo o k” ,   J our na l   o f   ge ne r al   i nt e r na l   m e di c i ne ,   26 ( 3 ) ,   28 7 - 292 .   [ 4]   G a ndo m i ,   A . ,   e t   a l . ,   ( 20 15) .   B e y o nd  t he   hy pe :   B i g   da t a   c o nc e pt s ,   m e t ho ds ,   a n a na l y t i c s ,   I nt e r n at i ona l   j ou r na l   o f   i nf or m a t i on   m anage m e n t ,   1 37 - 144 .   [ 5]   F a n,   W . ,   e t   a l . ,   ( 2014 ) .   T he   po w e r   o f   s o c i a l   m e di a   a na l y t i c s .   C om m uni c at i on   A c m ,   57 ( 6) ,   74 - 81 .   [ 6]   B ha t t ,   A . ,   e t   a l . ,   ( 2015 ) .   A m a z o R e v i e w   C l a s s i f i c a t i o a nd  S e nt i m e n t   A na l y s i s ,   I n t e r na t i o nal   J ou r na l   of   C om put e r   Sc i e nc e   an I n f or m a t i on   T e c hno l og i e s ,   6 ( 6 ) ,   51 07 - 5110 .   [ 7]   T undj ung s a r i ,   V .   ( 201 3) .   B u s i n e s s   I nt e l l i g e nc e   w i t S o c i a l   M e d i a   a nd  D a t a   M i n i ng   t o   S uppo r t   C u s t o m e r   S a t i s f a c t i o i T e l e c o m m uni c a t i o I ndus t r y ,   I nt e r n at i on al   J o ur na l   o f   C om pu t e r   Sc i e nc e   and  E l e c t r on i c s   E ngi ne e r i n ( I J C SE E ) ,   V o l um e ,   1   [ 8]   W e l be r s ,   K . ,   e t   a l . ,   ( 20 17) .   T e xt   a na l y s i s   i R ,   C om m un i c at i on   M e t hods   and   M e as u r e s ,   1( 4) ,   245 - 265 .   [ 9]   B ha t t ,   A . ,   e t   a l . ,   ( 2015 ) .   A m a z o R e v i e w   C l a s s i f i c a t i o a nd  S e nt i m e n t   A na l y s i s ,   I n t e r na t i o nal   J ou r na l   of   C om put e r   Sc i e nc e   an I n f or m a t i on   T e c hno l og i e s ,   6 ( 6 ) ,   51 07 - 5110 .   [ 10]   R ua n,   G . ,   e t   a l . ,   ( 201 4) .   T e x t r w e b:   L a r ge - s c al e   t e x t   ana l y t i c s   w i t h   r   o t he   w e b ,   P r o c e e di ng s   o f   t he   2014   A nnua l   C o nf e r e nc e   o E x t r e m e   S c i e nc e   a n E ng i ne e r i ng   D i s c o v e r y   E nv i r o nm e nt ,   p.   6 3.   [ 11]   D o l go br o d,   M .   ( 30   M a y ,   2013 ) .   S e m a nt i c   S c ho l a r .   R e t r i e v e f r o m   S e m a nt i c   S c ho l a r :   ht t ps : / / pdf s . s e m a n t i c s c ho l a r . o r g / 308 a / 92b8 e 2bc 03f 855 dc 76f 805c 98 1a f 3d061 e f c . pdf     [ 12]   B a t r i nc a ,   B . ,   e t   a l . ,   ( 201 5) .   S o c i a l   m e di a   a n a l y t i c s :   a   s ur v e y   of   t e c hni qu e s ,   t o o l s   a n p l a t f o r m s ,   A i   &   Soc i e t y ,     89 - 116.   [ 13]   S .   M u t huk um a r a n ,   e t   al . ,   ( 2017 ) .   T e xt   A na l y s i s   f o r   P r o duc t   R e v i e w s   f o r   S e n t i m e nt   A na l y s i s   u s i ng   N L P   M e t ho ds ,   I nt e r n at i on al   J o ur n al   o f   E ngi ne e r i ng  T r e nds   an T e c h no l ogy   ( I J E E T) ,   47 4 - 480   [ 14]   I s l a m ,   M . ,   e t   a l . ,   ( 2 011 ) .   A   s y s t e m a t i c   r e v i e w   o he a l t hc a r e   a na l y t i c s :   A ppl i c a t i o a nd  t he o r e t i c a l   pe r s pe c t i v e   o f   da t a   m i ni ng ,   H e al t hc a r e ,   V o l .   6 ,   N o .   2 ,   p.   5 M u l t i d i s c i p l i na r y   D i g i t a l   P u bl i s h i ng   I ns t i t u t e .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   18 ,   N o .   3 J u n e   20 2 :     1303   -   1 310   1310   [ 15]   V a r a ng a o nka r ,   A .   ( 18   D e c e m be r ,   20 1 7) .   U s e f ul   R   P a c ka g e s   f o r   N L P   &   T e xt   M i n i ng .   R e t r i e v e f r o m :   ht t ps : / / hu b. p a c kt p ub. c o m / 9 - us e f u l - r - pa c ka g e s - f o r - nl p - t e xt - m i ni ng /   [ 16]   P .   K ha nn a ,   e t   al . ,   ( 20 17) .   S e nt i m e n t   A na l y s i s :   A A ppr o a c t o   O p i ni o n   M i n i ng   f r o m     T w i t t e r   D a t a   us i ng   R .   I n t e r na t i ona l   J ou r na l   of   A d v anc e d   R e s e ar c h   i C om put e r   Sc i e n c e ,   8 ( 8 ) ,   25 2 - 256   [ 17]   K a m y a b,   M . ,   e t   a l . ,   ( 201 8) .   Se n t i m e nt   A na l y s i s   on  T w i t t e r :   A   t e x t   M i ni n A pp r oa c t t he   A f g han i s t an  St a t u s   R e v i e w s .   P r o c e e d i ng s   o f   t h e   2018   I nt e r n a t i o na l   C o nf e r e nc e   o A r t i f i c i a l   I nt e l l i g e nc e   a nd   V i r t ua l   R e a l i t y ,   14 - 19.   [ 18]   Al - S a f f a r ,   e t   a l . ,   M .   ( 201 8) .   M a l a y   s e nt i m e nt   a n a l y s i s   ba s e d   o c o m bi ne c l a s s i f i c a t i o a pp r o a c he s   a nd   S e n t i - l e x i c o a l g o r i t hm ,   P l oS   one ,   1 3 ( 4 ) .   [ 19]   C hi u ,   S .   I . ,   e t   al . ,   ( 20 18 ) .   P r e di c t i ng  P ol i t i c al   T e nde nc y   o f   P os t s   on  F ac e book .   P r o c e e di ng s   o f   t he   2018  7 t h   I nt e r na t i o na l   C , o nf e r e nc e   o S o f t w a r e   a nd  C o m pu t e r   A ppl i c a t i o ns ,   110 - 114 .   [ 20]   K o nt o po ul o s ,   E . ,   e t   al . ,   ( 2 013 ) .   O n t o l o gy - ba s e s e n t i m e nt   a na l y s i s   o f   t w i t t e r   po s t s .   E x pe r t   s y s t e m s   w i t h   appl i c at i on s ,   40 ( 10 ) ,   4 065 - 407 4.   [ 21]   F i kr i ,   M . ,   e t   a l . ,   ( 201 9) .   A   C o m pa r a t i v e   S t udy   of   S e nt i m e n t   A na l y s i s   us i ng   S V M   a nd   S e n t i W o r dN e t .   I n done s i an   J our nal   o f   E l e c t r i c a l   E ngi ne e r i ng   and   C om p ut e r   Sc i e nc e   ( I J E E C S) ,   13 ( 3) ,   902 - 90 9.   [ 22]   S a f r i n ,   R . ,   e t   a l . ,   ( 2 017 ) .   S e n t i m e n t   a na l y s i s   o o nl i ne   pr o duc t   r e v i e w .   I nt .   R e s .   J .   E ng i ne e r i ng .   T e c hnol o gy ,   4( 0 4) .   [ 23]   K ha nna ,   P . ,   e t   a l . ,   ( 201 7) .   S e n t i m e nt   a na l y s i s :   a a pp r o a c t o   o pi ni o m i n i ng   f r o m   T w i t t e r   da t a   us i ng   R .   I n t e r na t i ona l   J ou r na l   of   A d v anc e d   R e s e ar c h   i C om put e r   Sc i e n c e ,   8 ( 8 ) ,   1 - 5.   [ 24]   T i ng ,   P .   J .   L . ,   e t   a l . ,   ( 2 017 ) .   U s i ng   bi g   da t a   a n t e xt   a na l y t i c s   t o   unde r s t a nd  ho w   c us t o m e r   e xpe r i e nc e s   po s t e o y e l p.   c o m   i m pa c t   t h e   ho s p i t a l i t y   i ndus t r y .   C o nt e m por ar y   M an age m e nt   R e s e ar c h ,   13 ( 2)   [ 25]   F a c e bo o k”   [ O nl i ne ] ,   A v a i l a b l e   f r o m :   ht t ps : / / f a c e bo o k. c o m     [ 26]   T w i t t e r   [ O nl i ne ] ,   A v a i l a bl e   f r o m :   ht t p s : / / t w i t t e r . c o m   [ 27]   L a ks a na ,   J . ,   e t   a l . ,   ( 201 4) .   I ndo ne s i a T w i t t e r   t e x t   au t ho r i t y   c l a s s i f i c at i on   f o r   g ov e r nm e nt   i B a ndu ng .   I n   2014   I nt e r na t i o na l   C o nf e r e nc e   o f   A dv a nc e I nf o r m a t i c s :   C o n c e pt ,   T he o r y   a nd  A ppl i c a t i o ( I C A I C T A )     ( pp .   129 - 134 ) .   I E E E .   [ 28]   K o hl i ,   S . ,   e t   al . ,   ( 201 4) .   D a t ana l y s i s   w i t R .   P r o c e e di ng s   o f   t he   2014   I E E E / A C M   7t h   I nt e r n a t i o na l     C o nf e r e nc e   o U t i l i t y   a nd  C l o ud  C o m put i ng ,   53 7 - 538.   [ 29]   V a r a ng a o nka r ,   A .   ( 18   D e c e m be r ,   201 7) .   U s e f ul   R   P a c ka g e s   f o r   N L P   &   T e xt   M i n i ng .   R e t r i e v e f r o m :   ht t ps : / / hu b. p a c k t p ub. c o m / 9 - us e f u l - r - pa c ka g e s - f o r - nl p - t e xt - m i ni ng /   [ 30]   P r o j e c t s ,   C . - r .   ( 17  J une ,   20 19) .   C R A N   P a c ka g e s .   R e t r i e v e f r o m   C R A N : ht t ps : / / c r a n . r - pr o j e c t . o r g / w e b/ pa c ka g e s / a v a i l a b l e _ pa c ka g e s _by _na m e . ht m l   [ 31]   S T H D A .   ( M a y ,   2019) .   T e xt   M i ni ng   a nd  W o r C l o u F unda m e nt a l .   R e t r i e v e f r o m   S T H D A :   w w w . s t hda . c o m / e ng l i s h/ w i k i / t e x t - m i n i ng - a nd - w o r d - c l o ud - f unda m e nt a l s - in - r - 5 - s i m p l e - s t e ps - you - s ho ul d - kno w   [ 32]   C a r i   F o r um   [ O n l i ne ] ,   A v a i l a b l e   f r o m :   ht t ps : / / m f o r um . c a r i . c o m . m y .   [ 33]   S ha k l e e   [ O nl i ne ] ,   A v a i l a b l e   f r o m :   ht t ps : / / w w w . s ha kl e e . c o m . m y /   [ 34]   M e h r e n ,   R .   ( 1 J a n ua r y ,   2017) .   C r e a t i ng   W e I nt e r f a c e .   R e t r i e v e f r o m   M a k e U s e O f :   ht t ps : / / w w w . m a ke u s e o f . c o m / t a g / c r e a t i ng - w e b - i nt e r f a c e s - s t a r t /   [ 35]   P a t i l ,   P .   ( 23   M a r c h ,   20 18) .   W ha t   i s   E xp l o r a t o r y   D a t a   A na l y s i s ? "   R e t r i e v e d   f r o m   M e d i um :   ht t ps : / / t o w a r ds d a t a s c i e nc e . c o m / e xpl o r a t o r y - da t a - a na l y s i s - 8f c 1c b20f d15   [ 36]   S .   S a ng a m ,   e t   al . ,   ( 20 19) .   S e n t i m e nt   C l a s s i f i c a t i o o f   S o c i a l   M e d i a   R e v i e w s   u s i ng   E ns e m bl e   C l a s s i f i e r .   I ndo ne s i an   J our nal   o f   E l e c t r i c a l   E ngi ne e r i ng   and   C om p ut e r   Sc i e nc e   ( I J E E C S) ,   16 ( 1) ,   355 - 36 3       B I O G R A P H I ES   O F   A U T H O R S       N a s i ba h   H us n a   M o hd  K a d i r   i s   a   M a s t e r   o f   C o m put e r   S c i e nc e   ( W e T e c hno l o gy )   a t   t he   F a c ul t y   o f   C o m put e r   a nd  M a t he m a t i c a l   S c i e nc e s ,   U n i v e r s i t i   T e kno l o g i   M A R A ,   S ha A l a m ,   S e l a ng o r ,   M a l a y s i a .           S ha r i f a A l i m a i s   a   c o m put e r   s c i e nc e   s e n i o r   l e c t ur e r   w ho s e   i n t e r e s t s   a r e   i s o c i a l   c o m put i ng ,   i nf o r m a t i o a nd   s o c i e t y ,   s o c i a l   m e di a   a na l y t i c s   a s   w e l l   a s   s c i e n t i f i c   a nd   I nf o r m a t i o n   v i s ua l i z a t i o n.   S he   i s   a a c t i v e   m e m b e r   o f   t w o   r e s e a r c g r o ups :   A d v a nc e A na l y t i c s   E ng i ne e r i ng   C e nt e r   ( A A E C )   a nd  I nt e r a c t i v e   C o m put i ng   &   C o m m uni c a t i o T e c hno l ogy   ( I C C T ) .   C ur r e n t l y ,   s he   i s   P o s t g r a d ua t e   R e s e a r c C o o r di na t o r   a t   F a c ul t y   o f   C o m put e r   a nd  M a t h e m a t i c a l   S c i e nc e s ,   U i T M   S ha A l a m .   H e r   pr o f e s s i o na l   m e m b e r s h i ps   a r e   M a l a y s i a   B o a r o f   T e c hno l og i s t s   ( 2018 - 2019 ) ,   I E E E   M e m b e r ,   I E E E   C o m put e r   S o c i e t y   M e m be r   a nd  M i c r o s of t   C e r t i f i c a t e   A ppl i c a t i o D e v e l o pm e nt   ( 200 7 - 2008 ) .   S he   r e c e i v e h e r   P hD   i n   I T   a nd  Q ua n t i t a t i v e   S c i e nc e s   ( 2017 )   f r o m   U i T M ,   M S c .   i I T   ( 2001 )   f r o m   U ni v e r s i t i   P u t r a   M a l a y s i a   a nd  B S c .   i C o m put e r   S c i e nc e   a nd   m i no r   i M a t he m a t i c s   ( 1991 ) ,   M i dw e s t e r S t a t e   U ni v e r s i t y ,   T e xa s ,   U S A .   S he   c o nt i nue s   t r a i n i ng   t e a c he r s   a s   s he   g o t   t h e   c e r t i f i e t r a i n e r   f o r   C o m put a t i o na l   T h i n ki ng   a nd  C o m pu t e r   S c i e nc e   T e a c hi ng   i n   201 by   M a l a y s i a   D i g i t a l   E c o no m y   C o r po r a t i o n( M D E C ) .     Evaluation Warning : The document was created with Spire.PDF for Python.