I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   a n d   C o m p u te r   S c i e n c e   V o l .   22 ,   N o .   2 M a y   2021 ,   pp .   119 9 ~ 1207   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 22 .i 2 . pp 119 9 - 1207             1199       Jou r n al   h o m e pa ge ht t p: / / i j e e c s . i a e s c or e . c om   A l g o r i t h m   f o r   e x t r a c t i n g   p r o d u c t   f e a t u r e   f r o m   e - c o mm e r c e   c o mm e n t       C h an i d K ae w p h e t N aw ap o r n   Wi s i tp o n gp u n   F a c ul t y   o f   I nf o r m a t i o T e c hno l o gy   a nd  D i g i t a l   I nnov a t i o n,   K i ng   M o ng kut ' s   U ni v e r s i t y   of   T e c hno l o gy   N o r t B a ng ko k,   T ha i l a n d       A r ti c l e   I n fo     A B S TR A C T   ( 1 P T )   Ar t i c l e   h i s t or y :   R e c e i v e d   M a r   4 ,   20 20   R e v i s e D e c   5 ,   2 0 20   A c c e pt e J an   11 ,   20 2 1       R e v i e w s   o f   e - c o m m e r c e   pl a y   a n   i m po r t a n t   r o l e   i n   o n l i n e   pu r c ha s i ng   de c i s i o ns .   C o ns um e r s   a r e   l i k e l y   t o   r e a d   r e v i e w s   a nd   c o m m e nt s   o n   p r o duc t s   f r o m   o t he r   c o ns um e r s .   I a dd i t i o t o   t ho s e   o pi n i o ns   t ha t   r e f l e c t   c o ns um e r s '   t r us t   i n   pr o duc t s ,   i t   a l s o   pr o v i de s   e a c h   pr o duc t ' s   d i s t i nc t i v e   pr o pe r t i e s .   T o da y ,   t h e r e   a r e   m a ny   o nl i ne   r e v i e w s ,   r e s u l t i ng   i n   e no r m o us   c o m m e nt s   a n d   s u g g e s t i o ns .   H o w e v e r ,   a s   f u l l y   r e a di ng   r e v i e w s   i s   qui t e   d i f f i c ul t ,   t hi s   a r t i c l e   pr e s e n t s   3   a l g o r i t hm s   f o r   a u t o m a t i c   e x t r a c t i o o f   p r o duc t   f e a t u r e s   h i d de n   i n   e - c om m e r c e   r e v i e w s :   a   t r a d i t i o na l   f r e que nc y - ba s e pr o duc t   f e a t ur e   e x t r a c t i o n   ( F - P F E ) ,   s y nt a a n a l y z e r   s y s t e m   ( S A S ) ,   a nd   t he   hy br i d   a p pr o a c c a l l e t h e   f r e que nc y   a nd   s y nt a x - ba s e d   p r o duc t   f e a t ur e   e x t r a c t i o n   ( F a S - P F E ) .   T h e   p r o po s e a l g o r i t hm s   w e r e   t e s t e a g a i ns t   di f f e r e nt   t y pe s   o f   pr o duc t s :   s ha m po o ,   s ki nc a r e ,   m o bi l e   pho ne ,   a n d   t a bl e t ,   u s i ng   r e v i e w s   f r o m   a m a z o n. c o m .   B a s e d   o n   t he   pr o duc t   r e v i e w   us e i t hi s   s t u dy ,   i t   w a s   f o und  t ha t   t he   S A S   c a he l p   i m pr o v e   t he   p e r f o r m a nc e   i n   t e r m s   o f   pr e c i s i o n   by   15%   w h e n   c o m pa r e d   w i t t he   t r a d i t i o na l   F - P E E   a p pr o a c h.   W he c o ns i de r i ng   bo t t he   w o r f r e que nc y   a nd  s y nt a x ,   F a S - P F E   c l e a r l y   o ut pe r f o r m s   t he   o t h e r   t w o   a pp r o a c he s   w i t h   94. 0 0%   p r e c i s i o a nd   95 . 13 %   r e c a l l .   Ke y w or d s :   F e a t u r e   e xt r a c t i o   F r e que n c y - b a s e d   S y n t a x   a na l y z e r   S y n t a x - b a s e   TF - ID F     T hi s   i s   an   ope n   ac c e s s   ar t i c l e   u nde r   t he   C C   B Y - SA   l i c e ns e .     Cor r e s pon di n g   Au t h or :   Cha n i da   K a e w ph e t   F a c ul t y   of   In f o r m a t i o n   T e c hn o l o g y   a nd  D i gi t a l   I nn o v a t i o n   K i n M o n gkut ' s   U ni v e r s i t y   of   T e c hn o l o g y   N o r t B a n gko k   518  P ra c ha r a t   R o a d,   W o ngs a w a ng,   B a n gs ue ,   B a ngko 108 00,   T ha i l a n d   E m a i l :   C h a ni d a . k @ e m a i l . k m ut n b . a c . t h       1.   I N TR O D U C TI O N     N ow a da y s ,   t h e   g r o w t h   o f   t e c hn o l o g y   ha s   r e s ul t e i t h e   de v e l o pm e n t   o f   w e bs i t e s   t o   a   g r e a t   l e a p ,   e s pe c i a l l y   i t h e   e - c o m m e r c e   b us i n e s s ,   w h i c i s   m o r e   t ha a o nl i n e   s h o ppi n g   w e b s i t e .   F o o v e r   a   de c a de ,   a   gr e a t   v a r i e t y   of   pr o duc t s   a n d   s e r v i c e s   h a v e   m a de   t h e i r   w a y   o n t o   e - c o m m e r c e   pl a t f o r m s .   A   go o e xa m pl e   of  t h e s e   i n c l ude s   e n t e r t a i nm e nt ,   f o o d,   e l e c t r o n i c s ,   t ra v e l ,   a n d   b e a ut y   [1].   T h e   e - c o m m e r c e   pl a t f o r m s ,   n o w a da y s ,   c a l e a rn  c us t o m e r s   l i ke s   a nd  d i s l i ke s   a n d   p r o v i de   a   r e c o m m e n d a t i o t o   h e l p   c us t o m e r s   b uy   pr o du c t s   w i t c o n f i de n c e .   I r e t u rn,   c us t o m e r s   a l s o   c o nt r i b ut e   by   pr o v i di n g   c o m m e n t s   o o pi ni o n s   o t h e   p r o duc t s   t ha t   t h e y   bo ugh t .   T h e s e   o n l i n e   r e v i e w s   c a b e   us e t o   e v a l ua t e   c o n s u m e a t t i t ude s   t o w a r ds   p r o duc t s ,   s e r v i c e s ,   o r   o r ga ni z a t i o n s .   P u r c h a s i ng  de c i s i o n s   a r e   us ua l l y   i n f l ue n c e o a f f e c t e by   f e e db a c ks   o r   o pi ni o n s   e xp r e s s e o n   e - c o m m e r c e   r e v i e w s   [2].   T h e r e f o r e ,   c o m pa ni e s   us e   s o ph i s t i c a t e a l go r i t h m s   t o   u n de r s t a nd  t h e   b uy i n b e h a v i o r s   o f   c o n s um e r s   t o   i n c r e a s e   t h e   e ff i c i e n c y   of   t h e i r   pr o duc t s   a nd  o rga ni z a t i o n .   H ow e ve r ,   a s   i t   i s   n o t   po s s i b l e   fo r   m o s t   c o n s um e r s   t o   r e a d   m a n y   r e v i e w s   t o   f i n o ut   w h e t h e t o   b uy   a   p r o duc t   o r   n o t ,   t h e y   n e e a   s y s t e m   t ha t   c a n   a ut o m a t i c a l l y   di s t i ngui s p r o duc t   f e a t u r e s   f ro m   e - c o m m e r c e   r e v i e w s   a nd  c l a s s i fy   w h e t h e t h e   c o n s um e h a s   po s i t i v e   o r   n e g a t i v e   f e e l i n gs   t o w a r t h e   p r o duc t s   [3 ] ,   [ 4].     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   22 ,   N o .   2 M a y   202 1   :     1199   -   1 207   1200   To   e xt ra c t   t h e   p r o duc t   f e a t u r e s   p r e s e n t e i e - c o m m e r c e   r e v i e w s ,   M i n qi ng  H u,   a n B i n g   L i [ 5 us e t h e   r ul e - b a s e t e c hni que   t o   e xt ra c t   p r o duc t   f e a t u r e s   b a s e o n   f r e que n t l y   us e w o r ds .   W hi l e   t hi s   i s   a   s i m pl e   a nd  us e f ul   t e c hn i q ue ,   i t   c a o n l y   e xt r a c t   f e a t u r e s   t h a t   w e r e   r e p re s e n t e by   n o u n s .   If   f e a t u r e s   a r e   r e p r e s e n t e d   b y   v e r b s   o r   w o r ds   t ha t   a r e   r a r e l y   fo un d,   s uc f e a t u r e s   w i l l   b e   i g no r e by   t hi s   t e c hni que .   A l s o ,   t h e   f r e que n c y - b a s e d   t e c hn i q ue   i g n o r e s   i m p l i c i t   f e a t u r e s   hi dde n   i n   t h e   r e v i e w s .   H a o   W a n g,   e t   al .   [ 6 i m p r o v e t h e   t r a d i t i o na l   f r e que n c y - b a s e pr o duc t   f e a t ur e   e xt ra c t i o n   ( T F - ID F b y   us i n g   t h e   po i nt   m u t ua l   i n f o r m a t i o (P M I)   t o   r e duc e   t h e   di m e n s i o n s   o f   t h e   a p p r o pri a t e   f e a t u r e s   u n de t h e   c o ndi t i o n s   s pe c i f i e d.   N e v e r t h e l e s s ,   P M I   r e qu i r e s   a   c o n s i de r a b l e   a m o unt   o f   t i m e   f o r   c a l c ul a t i o n s .   A n i t h a   a nd  K a r p a ga m   [ 7 ]   us e f r e que nt   pa t t e rn   m i ni n g   a l go ri t hm s   a n d   a s s o c i a t i o m i ni n g   a l go ri t hm s   f o e xt r a c t i ng  p r o duc t   f e a t ur e s   f r o m   c o m m o n   w o r d   pa t t e rn s .   A ni s ha   a n N i r a n j a n   [ 8 ]   us e t h e   a p r i o r i   a l go r i t h m   f o r   f e a t ure   e xt ra c t i o a n d   c l a s s i f i e p r o duc t   f e a t u r e s   us i n g   a n   u n s u pe r v i s e S e nt i W o r dN e t   m e t h o d.   T h e   e xt ra c t e f e a t u re   a l o n g   w i t h   i t s   P O S   t a g :   a dj e c t i v e ,   a dv e r b ,   v e r b ,   t h e   n o u n   w a s   us e t o   s e l e c t   o pi n i o w o r ds .   F i na l l y ,   n e ga t i o r u l e s   a r e   us e f o r   t h e   c l a s s i f i c a t i o o f   r e v i e w s   i n t o   po s i t i v e   a n d   n e ga t i v e .   S e ve r a l   s t udi e s   f o c us   o n   a na l y z i n t h e   s e nt e n c e   s t r uc t u r e   t o   e xt r a c t   p r o duc t   f e a t ur e s .   S h e ng  H ua n g,   e t   al .   [ 9 ]   p r o po s e a   p r o duc t   f e a t u r e   c a t e go r i z a t i o t e c hni que   t ha t   r e l i e s   o t h e   us e   o f   s e m a nt i c   k n o w l e dge   f r o m   W o r dN e t   t o   c a l c ul a t e   t h e   s i m i l a r i t y   b e t w e e n   p r o duc t   f e a t ur e s .   H a n qi a n   W U ,   e t   al .   [ 10 c r e a t e di f f e r e n t   c o n n e c t i o r u l e s   us i n g   t h e   de pe nde n c y   pa r s i n g   a n a l y s i s   t o o l   i t h e   C hi n e s e   l a n g ua ge   s t r uc t u r e   t o   pe r f o r m   m o r e   e xpl i c i t   f e a t ur e   e xt ra c t i o n .   H ow e ve r ,   a s   t h e   m e t h o ds   f o r   t h e   s t ruc t u r e   o f   t h e s e   l a ngua ge s   de pe n o n   do m a i n s   a n r e qu i r e   a ut o m a t i c   a nn o t a t i o n s   o f   i m p l i c i t   p r o pe rt i e s ,   t h e   c r e a t i o n   o f   r ul e s   f o r   l a n g ua ge   s t r uc t u r e   i s   u na b l e   t o   c ove r   t h e   l a n gu a ge   p ri n c i pl e s   t h o r o ughl y .     H a n i ,   e t   a l .   c r e a t e l a ngua ge   s t ruc t u r e   r ul e s   a s   c ri t e r i a   f o r   e xt ra c t i n g   p r o duc t   f e a t u r e s   [ 11 ].   T h i s   t e c hn i q ue   i s   qu i t e   po pul a a s   i t   c a b e   a pp l i e d   a n d   c r e a t e   s y n t a x   l a n gu a ge   r u l e s   f o l l ow i n g   t h e   c r i t i que s   o f   m a n y   l a n gu a ge s ,   i n c l ud i n c o m pl e l a n gu a ge s ,   s uc h   a s   C h i n e s e   a n d   A r a b i c   [1 2 ].   A n   o n t o l o g y   t e c hn i que   i s   a l s o   us e t o   e xt r a c t   p r o duc t   f e a t u r e s   f r o m   o n l i n e   r e v i e w s .   T e j a ,   e t   a l .   [1 3 pr o po s e fe a t u r e   e xt r a c t i o n   f r o m   c o m m e nt s   us i ng  th e   f e a t u r e   o n t o l o g y   t r e e   (F O T )   t e c hni que   a l o n g   w i t h   l a t e nt   di r i c h l e t   a l l o c a t i o n   ( L D A ),   a u n s upe r v i s e l e a rni ng   m o de l .   T h e   m o de l   i t hi s   r e s e a r c w i l l   c r e a t e   t o pi c s   o pr e - de f i n e d   w o r ds   f r o m   t h e   do c um e nt   s e t   a nd  e xt ra c t   t h e   p r o duc t   f e a t u r e s   us i n g   t h e   O W L   c l a s s   o r   w e b   o n t o l o g y   l a n gu a ge .   P i t c h a y a s e e ,   et  al ,   [1 4 p r e s e n t   a   k n o w l e dge   e xt r a c t i o n   s y s t e m   f r o m   o n l i n e   t o u r i s t   r e v i e w s   by   us i n g   o n t o l o g y   t e c h n o l o g y   a s   a   k n o w l e dge   b a s e   fo r   w o r a n a l y s i s .   J i t a m o n   A ngs a ku l   p r o po s e t o   us e   t h e   o n t o l o g y   t e c hn i q ue   a s   a   k n o w l e dge   b a s e   fo r   e xt ra c t i ng   a n d   s t o r i ng   k now l e dge ,   a s   w e l l   a s   t r a n s l a t i o t o o l s ,   t o   h e l p   w i t s e m a n t i c   a na l y s i s   fo r   T h a i   t o u r i s m   b us i n e s s e s   [1 5 ] .   H ow e ve r ,   w hi l e   t h e   us e   o f   k n o w l e dge   a b o ut   t o uri s m   m a ke s   t h e   r e s ul t s   m o r e   a c c u r a t e ,   t h e s e   s t a t i s t i c a l   t e c hni que s   m a y   n o t   b e   r e l i a b l e   i f   t h e   s i z e   o f   kn o w l e dge   i s   t o o   s m a l l .   M o h a m m a d   F i k ri   a n d   R i y a n a rt o   S a rn o   [ 16 ]   p r e s e n t   a   c o m pa ra t i v e   s t u dy   of   s e n t i m e n t   a na l y s i s   us i n g   S V M   a n S e n t i W o rdN e t .   I t h i s   r e s e a r c h,   t h e   s e nt i m e n t   a n a l y s i s   us e s   t h e   rul e - b a s e m e t h o w i t t h e   h e l p   of   t h e   S e n t i W o rdN e t   a n s u ppo r t   v e c t o r   m a c hi n e   (S V M a l go ri t hm   w i t h   t e rm   f r e que n c y - i n v e r s e   do c um e n t   f r e que n c y   (T F - ID F a s   a   f e a t u r e   e xt ra c t i o n   m e t h o d.     T h i s   r e s e a r c h   f o c us e s   o n   t h e   a ut o m a t i c   e xt r a c t i o n   o f   pr o duc t   f e a t ur e s   us i n t h r e e   di f f e r e n t   a l go r i t hm s .   T h e   f i r s t   pr o po s e a l go r i t h m   i s   t h e   f r e que n c y - b a s e pr o duc t   f e a t ur e   e xt r a c t i o n   (F - P F E w h i c h   i s   a n   e n h a nc e v e r s i o n   o f   t h e   t r a di t i o n a l   f r e que n c y   m e t h o w h i c h   o n l y   e xt r a c t s   c o m m o n   w o r ds   b a s e o n   t h e i r   o c c ur r e n c e   f r e que n c y .   T h e   e f f i c i e n c y   o f   F - P F E   i s   i n c r e a s e b y   s i m pl y   c a t e go r i z i n t h e   l i s t   o f   c o m m o n   w o r ds   us i n t h e i r   a s s o c i a t e s y n o n y m s   a n a n t o n y m s .   T h e   s e c o n a l go r i t h m   i s   t h e   s y n t a a n a l y z e r   s y s t e m   (S A S w h i c h   r e l i e s   o n   t h e   l a n gua ge   s t r uc t ur e   r ul e s   f o r   e xt r a c t i n g   c a n di da t e   f e a t ur e   t e r m s   a n us e s   t h e   s y n o n y m s   a n a n t o n y m s   c o r pus   f o r   c a t e go r i z i n f e a t ur e   w o r ds .   H o w e v e r ,   f r e que n c y - b a s e f e a t ur e   s e l e c t i o n   m a y   n e gl e c t   r a r e   f e a t ur e s   w h i c h   do   n o t   o c c ur   f r e que n t l y ,   w h i l e   t h e   s y n t a x - b a s e a ppr o a c h   m a y   o m i t   c e r t a i n   f e a t ur e s   w h i c h   o c c ur   f r e que n t l y   b ut   do   n o t   c o n f o r m   t o   t h e   pr e - s pe c i f i e r ul e s .   H e n c e ,   w e   pr o po s e a   f r e que n c y   a n s y n t a x - b a s e d   pr o duc t   f e a t ur e   e xt r a c t i o n   (F a S - P F E w h i c h   i s   a   h y b r i a ppr o a c h   t h a t   a i m s   t o   o v e r c o m e   t h e   b a r r i e r s   o f   b o t h   F - P F E   a n S A S .   T h e   r e m a i n de o f   t h i s   a r t i c l e   i s   o r ga n i z e a s   f o l l o w s :   S e c t i o n   pr e s e n t s   t h e   pr o po s e pr o duc t   f e a t ur e   e xt r a c t i o n s .   S e c t i o n   pr e s e n t s   t h e   r e s ul t s   a n di s c us s i o n ,   a n f i n a l l y   i n   s e c t i o n   c o n c l ude s   t h e   f i n di ng  o f   t h i s   s t udy .       2.   R ES EA R C H   M ET H O D   2. 1 .       F r e q u e n c y - b as e d   p r o d u c fe atu r e   e x tr ac t i o n   (F - P F E )   T h e   p r o c e s s   o f   e xt r a c t i n g   p r o duc t   f e a t ur e s   f r o m   e - c o m m e r c e   r e v i e w s   us i n g   f r e que n c y - b a s e pr o duc t   f e a t ur e   e xt ra c t i o (F - P F E )   i s   di v i de i n t o   t hr e e   m a i s t e ps   a s   f o l l ow s   F i gur e   1 :   S t e 1:   T e xt   p r e - p r o c e s s i n g :   R e v i e w s   o r   o pi n i o n s   f r o m   a m a z o n . c o m   w i l l   b e   p r e - p r o c e s s e by   us i n g   w o r s e gm e nt a t i o n   a nd  s t o p - w o r r e m o v a l .   T h i s   s t e a l s o   i nc l ude s   t h e   r e m o v a l   o f   s y m bo l s   i n   s e n t e n c e s ,   s uc a s   p a r e nt h e s e s ,   b ul l e t s ,   o o t h e s y m b o l s   s uc h   a s   #,   * ,   - ,   e t c .   [ 17 - 19] .   S t e 2:   S t e m m i n a n L e m m a t i z a t i o n:     T h e   o ut put   f r o m   t h e   p r e v i o us   s t e p,   w i l l   b e   t r a n s f o r m e i n t o   t h e i r   r o o t   f o r m .   F o r   e xa m pl e :              Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A l gor i t hm   f or   e x t r a c t i ng  pr o duc t   f e a t ur e   f r om   e - c om m e r c e   c om m e nt   ( Chani da   Ka e w phe t )   1201   o i l y     o il   m o i s t u r i z e   m o i s t u r e     S t e 3.   F r e que n c y - b a s e pr o duc t   f e a t ur e   e xt r a c t i o n   (F - P F E i n   t h i s   s t e c o n s i s t s   o f   s ub - s t e ps   a s   f o l l o w s :     1)   R e m o v e   i r r e l e v a n t   w o r ds :   A f t e r   t h e   de r i v a t i o n   o f   r o o t   w o r ds   f r o m   t h e   r e v i e w   da t a ,   t h e   n e xt   s t e i s   t o   r e m o v e   i r r e l e v a n t   w o r ds   t h a t   o f t e n   a ppe a r   i n   t h e   c o m m e n t s .   It   i s   n e c e s s a r y   t o   r e m o v e   t h e m   f r o m   s e n t e n c e s   b e f o r e   c o un t i n t h e i r   c o r r e s po n di n o c c ur r e n c e   f r e que n c y .   E xa m pl e   o f   s uc h   w o r ds   i s   s pe c i f i c   w o r ds ,   da t e s ,   t i m e s ,   pl a c e s ,   pe o pl e ,   pr o duc t   c a t e go r i e s ,   w o r ds   t h a t   e xpr e s s   f e e l i n gs ,   w o r ds   t h a t   a r e   o f t e n   f o un i n   c o m m e n t s   a n n o t   a   f e a t ur e   s uc h   a s   " r e c o m m e n d" ,   " r e v i e w " ,   " c o m m e n t " ,   " f r e e " ,   " pr o duc t " ,   e t c .                 F i gu r e   1 . F r e que n c y - b a s e pr o duc t   f e a t ur e   e x t r a c t i o n   (F - P F E a l go ri t hm       2)   Co m put e   T F - ICF   (T e r m   f r e que n c y - i n v e r s e   c o m m e n t   f r e que n c y ):   T h i s   i s   a   c a l c ul a t i o n   t h a t   i s   b a s e o n   T F - ID F   w h i c h   i s   a n   a l go r i t hm   t h a t   pr o v i de s   s c o r e s   o f   e a c h   w o r o r   t e r m   i n   a   do c um e n t   b y   c o n s i de r i n t he   pr o po r t i o n   o f   w o r ds   c o n t a i n e i n   t h e   do c um e n t   a n c o m pa r i n t o   t h e   n um b e r   a ppe a r a nc e   o f   t h e   m o s t   c o m m o n   w o r ds .   E a c h   c o m m e n t ,   i n   t h i s   c a s e ,   i s   e qui v a l e n t   t o   o n e   do c um e n t   [ 20 - 21 ].   T h e   t e r m - f r e que n c y   ( tf t , c )   o f   e a c h   w o r c a n   b e   de r i v e f r o m   t h e   n um b e r   o f   t i m e s   t h e   w o r a ppe a r s   i n   a   c o m m e n t   di v i de b y   t he   n um b e r   o f   o c c ur r e n c e s   o f   t h e   m o s t   f r e que n t   w o r i n   t h e   c o m m e n t   f o r m ul a   [ 22 - 23 ],   a s   i s   s h o w n   i n   (1) ;      , =   , m a x   { ,   }                                                                                                                                                                                                                         (1)     w h e r e   ,      i s   t h e   n um b e r   o f   t i m e s   t h e   w o r t   a ppe a r s   i n   t h e   c o m m e n t s   c .   T h e   i n v e r s e   c o m m e nt   f r e que n c y ,   de n o t e b y   icf  c a n   b e   e xpr e s s e b y   (2)      = | {  ( ) :   } |                                                                                                                                             ( 2 )     w he re        i s   t he   t o t a l   nu m b e o f   c o m m e nt s   a nd    ( )   i s   t he   nu m b e r   o f   c o m m e nt s   w hi c c o nt a i n   t he   w o rd   t .   F i na l l y ,   t he   T F - I C F   o t he   t e rm   f re q u e nc y - i nv e rs e   c o m m e nt   f re q u e nc y   c a b e   c a l c u l a t e d   b y   (3).      _  , =    ,   ×    ,                                                                                                             ( 3 )     3)   F i n r e pr e s e n t a t i v e   t e r m   ( F F - PFE o f   e a c h   w o r b y   us i n s y nony m s   &   ant ony m s   c or pus   f r o m   W o r dN e t .   I n   t h i s   s t e p,   w e   w i l l   c o n s t r uc t   t h e   s y n o n y m s   a n a n t o n y m s   c o r pus   ( C sa b y   f i n di n t h e   s e t   o f   s y n o n y m s   a nd  a n t o n y m s   ( W sa c o r r e s po n di n t o   e a c h   w o r ( w i o b t a i n e f r o m   t h e   T F - ICF   pr o c e s s .   B e s i de s ,   t he   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   22 ,   N o .   2 M a y   202 1   :     1199   -   1 207   1202   r e pr e s e n t a t i v e   t e r m   ( f o f   e a c h       W sa   w i l l   b e   e l e c t e b a s e o n   t h e   T F - ICF   v a l ue   o f   e a c h   w o r i n   t h e   s e t .   M o r e   s pe c i f i c a l l y ,   t h e   w o r w i t h   t h e   h i gh e s t   T F - ICF   v a l ue   w i l l   b e   e l e c t e a s   t h e   r e pr e s e n t a t i v e   t e r m .   T he   n e w   T F - ICF   v a l ue   a s s i gn e t o   t h i s   r e pr e s e n t a t i v e   t e r m   w i l l   b e   a n   a v e r a ge   o f   t h e   T F - ICF   o f   a l l   t h e    ,     a s   c a n   b e   de s c r i b e b y   (4).        _  ( ) =    _ ( ) = 1                                                                                                                                                 (4)       w h e r e      _  ( )         i s   t h e   T F - ICF   o f   e a c h   w o r   i a   s e t   o f   s y n o n y m s   a n d   a nt o n y m s   W sa               i s   t h e   num b e o f   w o r ds   i a   s e t   o f   s y n o n y m s   a n d   a nt o n y m s   W sa        _  ( )   i s   a n   a v e r a ge   T F - ICF   v a l ue   a s s i gn e t o   t h e   r e pr e s e n t a t i v e   t e r m   ( f )     T h e   a l go r i t h m   f o r   c o n s t r uc t i n C sa   i s   s h o w n   i n   F i gur e   2.                                     F i gu r e   2 .   A l go r i t hm   f o r   c o n s t ruc t i n g   S y n o n y m s   a n d   A n t o n y m s   Co rpus           F i n a l l y ,   t h e   TF - ICF   o f   t h e   r e pr e s e n t a t i v e   t e r m s   w i l l   b e   n o r m a l i z e a n t h e   f i n a l   s e t   o f   t h e   pr o duc t   f e a t ur e s   c o m pr i s e s   r e pr e s e n t a t i v e   t e r m s   ( F F - PFE w i t h   a s s o c i a t e T F - ICF   o f   gr e a t e r   t h a n   25%.       2. 2 .     S yn tax   an al y z e r   s ys t e m   (S A S )     T h e   s y n t a a n a l y z e r   s y s t e m   e xt r a c t s   pr o duc t   f e a t ur e s   b y   us i n r ul e s   de r i v e f r o m   s y n t a s t r uc t ur e   t ha t   m a y   l i ke l y   r e s ul t s   i n   pr o duc t   f e a t ur e s .   T h e r e   a r e   t h r e e   s t e ps   i n v o l v e i n   b u i l di n t h e   s y n t a a n a l y z e r   s y s t e m   as   i s   s h o w n   i n   F i gur e   3.     S t e 1   T e xt   pr e - pr o c e s s i n g:   S i m i l a r   t o   t h e   f r e que n c y - b a s e p r o duc t   f e a t ur e   e xt r a c t i o n   a ppr o a c h,   c us t o m e r s ’  c o m m e n t s   w e r e   pr o c e s s e b y   us i n w o r s e gm e n t a t i o n   a n s t o p - w o r r e m o v a l .     S t e 2   S t e m m i n a n L e m m a t i z a t i o n :   In   a ddi t i o n   t o   c o n v e r t i n o ut put   w o r s e t   f r o m   s t e i n t o   t he i r   r o o t   f o r m s   ( R ) ,   e a c h   w o r w i l l   b e   l a b e l e w i t h   its   c o r r e s po n di n g   pa r t   o f   s pe e c h   [ 24 - 25 ]   n o un s   (N N ,   N N S ),   a dj e c t i v e s   (J J S ,   J J R ),   a dv e r b s   (R B ,   R B R ),   v e r b s   (V B ,   V B D ),   e t c .   [ 26 - 28 ] .   S t e 3   S y n t a x - b a s e f e a t ur e   e xt r a c t i o n T h i s   p r o c e s s   c o n s i s t s   o f   3   s ub - s t e ps   a s   f o l l o w s :   1)  S i m i l a r   t o   t h e   f r e que n c y - b a s e a ppr o a c h ,   i r r e l e v a n t   a n s pe c i f i c   w o r ds   w i l l   b e   r e m o v e b e f o r e   f ur t h e r   pr o c e s s i n g.   2)  S y n t a a n a l y z e r   c o n s i de r s   a   bi gr am ,   w h i c h   i s   a   w o r d - pa i r   o r   t w o   c o n s e c ut i v e   w o r ds   i n   a   s e n t e n c e If   a   b i gra m   c o n f o r m s   t o   a n y   o f   t h e   s pe c i f i e s y n t a r ul e s t h e r e   i s   a   h i dde n   pr o duc t   f e a t ur e   w i t h i n   t h e   b i gr a m .   T h e   r ul e   us e i n   t h i s   s t udy   i s   b a s e o n   P ar t - of - Spe e c h   o r   P O S   t a gs .   F o r   t h e   ut m o s t   c o n v e n i e n c e   a n e a s e   o f   us e ,   w e   c o n s i de r e d   o n l y   f o ur   di f f e r e n t   t a gr o ups   i n   t h e   s y n t a a n a l y s i s   r ul e ,   i n c l udi n g   n o un s :   N N ,   N N S ,   v e r b s :   V B ,   V B D ,   V B G ,   V B N ,   V B P ,   V B Z .   A dv e r b s :   R B ,   R B R ,   R B S ,   a n a dj e c t i v e s :   J J ,   J J R ,   J J S F o r   e xa m pl e ,   t he   s e n t e n c e .     A l go r i t h m  : C o n s t r u c t i n g   S y n o n y m s   &   A n t o n y m s   L e xi c o n   I n p u t :   S e t   o f   w o r ( W ),   S y no ny m s   a nd  A nt o ny m s   C o r pus   ( C sa ) ,   O u t p u t :   S y n o n y m s   a nd  A nt o ny m s   C o r pus   ( C sa )   S t e p s :   f o r   e a c w i   i n   W     f o r   e a c  i C sa               i f   w i        f   =   r e pr e s e nt a t i v e   t e r m   o f                                      i f   T F _I C F   ( w i )   >   T F _I C F ( f )                 f   w i         c ha ng e   t h e   r e p r e s e n t a t i v e   t e r m   o f        t o   t he   ne w   w o r f           e nd     e l s e      f i n d_s e t _o f _s y no n y m _a nd_a n t o n y m ( w i )   i nc l ud e      i C sa           e nd       e nd     e nd                   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A l gor i t hm   f or   e x t r a c t i ng  pr o duc t   f e a t ur e   f r om   e - c om m e r c e   c om m e nt   ( Chani da   Ka e w phe t )   1203   m ak e s   m y   ha i r   c l e an,   s of t ,   an s m oo t w i t hout   w e i ghi ng   i t   d o w n!  T ouc hab l e   v ol um e   a nd  s i l k y   f i ni s h .     w i l l   b e c o m e :   m ak e s   h ai r   c l e an   s of t   s m oo t w i t hout   w e i gh   t ouc v ol um e   s i l k   f i ni s h ”.                                                         F i gu r e   3 .   S y n t a x   A na l y z e r   S y s t e m       A f t e r   t e xt   pr e - pr o c e s s i n g.   T h e   b i gr a m   r e pr e s e n t i ng  t h i s   s e n t e n c e   i s   s h o w n   i n   F i gur e   4.   E a c h   w o r i n   a   b i gr a m   pa i r   w i l l   b e   t a gge w i t h   i t s   c o r r e s po n di n P O S   a n w i l l   b e   a n a l y z e o n e   b y   o n e   [ 29 ] .           F i gu r e   4 .   S h o w s   t h e   s t e o f   w o r pa i r i ng  o n e   by   o n e       A c c o r di n t o   F i gur e   4,   S A S   o ut put s   10  b i gr a m s   w i t h   t h e   f o l l o w i n P O S   s t r uc t ur e s :   V B Z + N N ,   N N + J J ,   J J + J J ,   J J + J J ,   J J + IN ,   IN + V B G ,   V B G + J J ,   J J + N N ,   N N + J J ,   a n J J + N N .     B y   l a b e l i n t h e   f e a t ur e   i n   t h e   t r a i ni ng  da t a   s e t ,   w e   c a n   o b t a i n   t h e   r ul e s   b y   us i n a   de c i s i o n   t r e e   a l go r i t h m .   E xa m pl e s   o f   r ul e s   a r e :               1)      F e a t ur e   o f   h a i r   ( NN +   c l e a n   ( JJ )”     i s   c l e a n           2     F e a t ur e   o f     v o l um e   ( NN   +   s i l k   ( JJ )       i s   s i l k       SAS   c l a s s i f i e s   a l l   w o r ds   f r o m   c o m m e nt s   i n t o   a   s e t   o f   f e a t ur e   t e r m s .   F r o m   400 0   c o m m e n t s   f r o m   4   di f fe r e nt   t y pe s   of   pr o duc t s   (1000   c o m m e n t s   pe p r o duc t ) ,   w e   w e r e   a b l e   t o   de r i v e   10   s y n t a x   rul e s .   H ow e ve r ,   due   t o   t h e   di v e r s i t y   o f   t h e   l a n gu a ge s   us e d   i t h e   c o m m e nt s ,   w e   c a o n l y   c ov e r   c o m m o c a s e s   i c o n s um e r s’   r e v i e w s   a n d   w e r e   n o t   a b l e   t o   c r e a t e   r ul e s   t ha t   c ov e r   a l l   po s s i b l e   c a s e s .   3)   S y n o n y m s   &   a n t o n y m s   c o r pus   f r o m   W o r dN e t   i s   us e d   i t hi s   s t e t o   f i n d   t h e   s e t   o f   r e p r e s e nt a t i v e   f e a t ur e s   f o e a c w o r d.   T hi s   p r o c e s s   i s   s i m i l a t f i n di ng  t h e   r e p r e s e n t a t i v e   f e a t ur e   t e rm   i n   t h e   l a s t   s t e o f   t h e   f r e que n c y - b a s e p r o duc t   f e a t ur e   e x t r a c t i o n.     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   22 ,   N o .   2 M a y   202 1   :     1199   -   1 207   1204   2. 3 .     F r e q u e n c an d   s yn tax - b as e d   p r o d u c fe atu r e   e x tr ac t i o n   (F aS - P F E)     T h e   f r e que n c y   a n s y n t a x - b a s e f e a t ur e   e xt r a c t i o n   (F a S - P F E i s   a   h y b r i a ppr o a c h   t h a t   a i m s   t o   o v e r c o m e   t h e   dr a w b a c o f   b o t h   F - P F E   a n S A S .   M o r e   s pe c i f i c a l l y ,   F - P F E   s e l e c t s   w o r ds   b a s e o n   o c c ur r e n c e   f r e que n c y ,   h e n c e ,   r a r e   f e a t ur e   t e r m s   m a y   n o t   b e   s e l e c t e b y   F - P F E .   O n   t h e   o t h e r   h a n d,   S A S   s e l e c t s   f e a t ur e   t e r m s   b a s e o n   s e m a n t i c   r ul e s   s o   f r e que n t l y   o c c ur r e f e a t ur e   t e r m s   m a y   n o t   ge t   c h o s e n   b y   S A S   i f   t h e y   a ppe a r   i n   a   s e n t e n c e   t h a t   do e s   n o t   c o n f o r m   t o   t h e   r ul e s   a s   i n   F i gur e   5.       H e n c e ,   F a S - F E   c o n s i de r s   t h e   f e a t ur e   t e r m   s e l e c t e b y   b o t h   a l go r i t h m s   us i n a   c e r t a i n   c r i t e r i o n   a s   c a n   b e   de s c r i b e b y   (5).       =                                                                                                         ( 5 )         w h e r e       i s   t h e   s e t   o f   f e a t ur e s   o b t a i n e f r o m   F - P F E   w i t h   oc c ur r e nc e   f r e que nc y   ( OF h i gh e r   t ha n   t h e   t h r e s h o l th .   T h e   t e r m   t   i s   a   m e m b e r   o f        i f   i t s   o c c ur r e n c e   f r e que n c y   OF ( t ),   t h e   n um b e r   o f   c o m m e n t s   i n   w h i c h   t e r m   t   a ppe a r s   di v i de b y   t h e   t o t a l   n um b e r   o f   c o m m e n t s ,   i s   a b o v e   t h e   pr e - de f i n e t h r e s h o l th   A c c o r di n t o   ( 4 ) ,   F a S - P F E   c h o o s e s   f e a t ur e   t e r m s   a c c o r di n t o   t h e   pr e - de f i n e c o n di t i o n .   In   F a S - P F E ,   t h e   r e pr e s e n t a t i v e   f e a t ur e   t e r m s   c o n s i s t   o f   t h e   f e a t ur e   t e r m s   o b t a i n e f r o m   S A S   o r   F SAS   a n f e a t ur e s   o b t a i n e f r o m   F - P F E   w i t h   o c c ur r e n c e   f r e que n c y   a b o v e   a   c e r t a i n   t h r e s h o l d.   In   t h i s   s t udy ,   w e   s e t   t h e   t h r e s ho l t o   b e   25% .   F o r   e xa m pl e ,   i f   a   c e r t a i n   f e a t ur e   t e r m   a ppe a r s   i n   250  c o m m e n t s   f r o m   t h e   t o t a l   n um b e r   o f   3, 000  c o m m e n t s ,   t he   o c c ur r e n c e   f r e que n c y   o f   t h i s   pa r t i c ul a r   f e a t ur e   t e r m   i s   25%.         F i gu r e   5.   F r e que n c y   a n S y n t a b a s e P r o duc t   F e a t u r e   E x t r a c t i o n       3.   R ES U LTS   A ND  D IS C U S S I O N   (10   P T)   T o   e v a l ua t e   t h e   pe r f o r m a n c e   o f   t h e   p r o po s e pr o duc t   f e a t ure   e xt r a c t i o a l go r i t hm s ,   w e   us e 12, 000   pr o duc t   r e v i e w   c o m m e n t s   f r o m   t h e   a m a z o n . c o m   w e bs i t e   w h i c c o n s i s t s   o f   3, 000   c o m m e n t s   o n   s ha m po o ,   3 , 000     c o m m e n t s   o n   s ki n c a r e   p r o duc t s ,   3, 0 00  c o m m e n t s   o n   t a b l e t s ,   a n 3, 00 c o m m e n t s   o n   m o b i l e   ph o n e s .   E xp e r t s   w e r e   a s ke d   t o   r e a d   e a c h   p r o duc t ’s   c o m m e nt s   a n d   l i s t e a l l   t h e   f e a t u r e s   a s s o c i a t e w i t e a c p r o duc t .   T h e s e   a c t ua l   f e a t u r e s   w i l l   l a t e b e   us e f o r   e v a l ua t i n g   t h e   p r e c i s i o n,   r e c a l l ,   a n d   o v e r a l l   pe r f o r m a n c e   i t e rm s   o f   t h e   F s c o r e   of   t h e   p r o po s e a l go r i t hm   [30] .   L e t   F   b e   a   s e t   o f   fe a t u r e s   o b t a i n e f r o m   t h e   p r o po s e a l go ri t hm   a n d   F A   b e   t h e   a c t ua l   f e a t u r e s   l i s t e b y   e xpe r t s ,   t h e   (6) - (8)   de s c r i b e   t h e   de f i ni t i o o f   e a c h   pe r f o r m a n c e   m e t ri c .        =   |       | |  |                                                                                                                               ( 6 )      =   |       | |  |                                                                                                                                           (7)     B o t h   pr e c i s i o n   a n r e c a l l   i n di c a t e   t h e   a b i l i t y   o f   t h e   a l go r i t hm s   t o   e xt r a c t   c o r r e c t   pr o duc t   f e a t ur e s .   I n   pa r t i c ul a r,   pr e c i s i o n   m e a s ur e s   t h e   f r a c t i o n   o f   t h e   r e t r i e v e pr o duc t   f e a t ur e s   t h a t   a r e   a c t ua l   f e a t ur e s .   O n   t h e   o t h e r   h a n d,   t h e   r e c a l l   i s   t h e   f r a c t i o n   o f   t h e   r e l e v a n t   pr o duc t   f e a t ur e s   t h a t   a r e   s uc c e s s f ul l y   r e t r i e v e d.   H o w e v e r ,   a n   a l go r i t h m   w i t h   h i gh   pr e c i s i o n   do e s   n o t   n e c e s s a r i l y   i m pl y   h i gh   pe r f o r m a n c e   i n   t e r m s   o f   r e c a l l   a n v i c e   v e r s a .     H e n c e ,   b o t h   pr e c i s i o n   a n r e c a l l   s h o ul a l w a y s   b e   c o n s i de r e w h e n   e v a l ua t i n t h e   pe r f o r m a n c e   o f   a n   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A l gor i t hm   f or   e x t r a c t i ng  pr o duc t   f e a t ur e   f r om   e - c om m e r c e   c om m e nt   ( Chani da   Ka e w phe t )   1205   a l go r i t h m .   A l t e r n a t i v e l y ,   t h e   F s c o r e ,   w h i c h   i s   t h e   m e a n   o f   t h e   pr e c i s i o n   a n r e c a l l ,   c a n   b e   us e t o   m e a s ure   t h e   pe r f o r m a n c e   o f   a n   a l go r i t h m   a n c a n   b e   e xpr e s s e b y   (8),     1 =   2 ×   ×  |   +                                                                                                                  ( 8 )     3. 1 .      P e r fo r m an c e   o F r e q u e n c y - b as e d   P r o d u c F e atu r e   Ex tr ac ti o n   ( F - PFE )   T a b l e   1   s h o w s   t h e   e ff i c i e n c y   of   F - P F F .   It   w a s   f o un d   t ha t   t h e   a v e r a ge   p r e c i s i o a n r e c a l l   a r e   7 7. 6 8%  a n 90 . 91 %,   r e s pe c t i v e l y .   T h e   r e s ul t s   i n d i c a t e   t ha t   F - P F E   m a y   n o t   b e   a b l e   t o   c a pt ur e   ra r e   f e a t ur e   t e rm s   t ha t   do   n o t   a p p e a f r e que n t l y   i t h e   c o m m e n t s .   H e n c e ,   t h e   p r e c i s i o i s   o n l y   77. 68 %.   H ow e ve r ,   90 . 91 %   o f   t h e   f e a t u r e   t e rm s   e x t r a c t e d   by   F - P F E   w e r e   a c t ua l   f e a t u r e s .   W h e c o n s i d e r i n g   h o w   w e l l   F - P F E   pe r f o r m s   a c r o s s   di f f e r e n t   t y p e s   of   pr o duc t s ,   w e   f o un t ha t   F - P F E   pe r f o r m s   b e t t e o IT   p r o duc t s   (t a b l e t s   a n d   m o b i l e   p h o n e s t ha o b e a ut y   pr o duc t s   (s h a m po o   a nd  s ki n c a r e ) .   T hi s   m a y   be   b e c a us e   IT   p r o duc t s   ha v e   e xpl i c i t   s pe c i f i c a t i o n s   t ha t   c o n s um e r s   o f t e n   c o n s i de w h e n   c h o o s i n g   t h e   p r o duc t s .   I p a rt i c ul a r,   c o n s um e r s   a r e   us u a l l y   c o n s i de r e w e i g h t ,   c a m e ra ,   b a t t e r y   l i f e t i m e ,   e t c .   w h e b u y i n g   a   t a b l e t   a n d   m o b i l e   p h o n e .     O t h e   o t h e ha n d ,   t h e   f e a t u r e   o f   b e a ut y   pr o duc t s   w a s   s l i g h t l y   h a r de r   t o   e xt r a c t   b e c a us e   c o n s um e r s   m a y   us e   c o m pl e a n d   c o m pl i c a t e s e nt e n c e s   t e xpr e s s   w h a t   t h e y   l i ke   a n d   do   n o t   l i ke   a b o ut   t h e   p r o duc t s .       T a b l e   1 .   T h e   e f f i c i e n c y   of   t h e   f r e que n c y - b a s e pr o duc t   f e a t u r e   e xt ra c t i o n .   P ro d u c t   P re c i s i o n   Re c a l l   F1   S h a m p o o   7 3 . 0 8 %   9 5 . 0 0 %   8 2 . 6 1 %   S k i n c a r e   7 5 . 0 0 %   8 8 . 2 4 %   8 1 . 0 8 %   T a b l e t   7 7 . 7 8 %   9 1 . 3 0 %   8 4 . 0 0 %   M o b i l e   p h o n e   8 4 . 8 5 %   8 9 . 1 0 %   8 6 . 9 2 %   O v e ra l l   ( A v e ra g e )   7 7 . 6 8 %   9 0 . 9 1 %   8 3 . 6 5 %       3. 2 .       P e r fo r m an c e   o S yn tax   an al y z e r   s ys t e m   (S A S )     S h o w n   i n   T a b l e   2,   S A S   i m pr o v e s   pe r f o r m a n c e   i n   t e r m s   o f   pr e c i s i o n   s i gn i f i c a n t l y .   M o r e   s pe c i f i c a l l y ,   t h e   o v e r a l l   pr e c i s i o n   i m pr o v e s   b y   a l m o s t   15%.   T h e   r e c a l l ,   o n   t h e   o t h e r   h a n d,   dr o ps   r o ugh l y   b y   12%  w h e n   S A S   i s   us e t o   e xt r a c t   s h a m po o   f e a t ur e s .   T h i s   m a y   b e   du e   t o   t h e   f r e e - f o r m a t   n a t ur e   o f   t h e   l a n gua ge   us e f o r   r e v i e w i n t h e   s h a m po o   pr o duc t s   c o n s i de r e i n   t h i s   s t udy .   In t e r e s t i ngl y ,   t h e   r e c a l l s   o f   o t h e r   pr o duc t s ’  f e a t ur e s   w e r e   s l i gh t l y   b e t t e r   t h a t h o s e   o b t a i n e f r o m   F - P F E .   T o   c o m pa r e   t h e   o v e r a l l   pe r f o r m a n c e ,   S A S   pe r f o r m s   m uc h   b e t t e r   t h a n   F - P F E   a s   i s   i n di c a t e b y   t h e   F s c o r e .       T a b l e   2 T h e   e f f i c i e n c y   of   t h e   s y n t a a na l y z e r   s y s t e m .   P ro d u c t   P re c i s i o n   Re c a l l   F1   S h a m p o o   9 2 . 3 1 %   8 2 . 7 6 %   8 7 . 2 7 %   S k i n c a r e   9 2 . 3 1 %   8 8 . 8 9 %   9 0 . 5 7 %   T a b l e t   9 2 . 5 9 %   9 2 . 5 9 %   9 2 . 5 9 %   M o b i l e   p h o n e   9 3 . 3 0 %   9 6 . 6 0 %   9 4 . 9 0 %   O v e ra l l   ( A v e ra g e )   9 2 . 6 3 %   9 0 . 2 1 %   9 1 . 3 3 %       3. 3 .       P e r fo r m an c e   o th e   F r e q u e n c an d   S yn tax - b as e   P r o d u c F e atu r e   Ex tr ac t i o n   (F aS - P F E)     W h e n   c o n s i de r i n b o t h   f a c t o r s ,   f r e que n c y - b a s e ,   a n s y n t a x - b a s e ,   F a S - P F E   c l e a r l y   o ut pe r f o r m s   t he   o t h e r   a ppr o a c h e s .   A s   i s   s h o w n   i n   T a b l e   3,   t h e   a v e r a ge   pr e c i s i o n   a n r e c a l l   o f   t h i s   a ppr o a c h   a r e   94. 00%  a nd  95. 13%,   r e s pe c t i v e l y .   T h i s   i s   h i gh e r   t h a n   t h a t   o f   t h e   o t h e r   t w o   a ppr o a c h e s .   B e s i de s ,   F a S - P F E   pe r f o r m s   e qua l l y   w e l l   a c r o s s   a l l   di f f e r e n t   t y pe s   o f   pr o duc t s .     T a b l e   3 T h e   e f f i c i e n c y   of   t h e   f r e que n c y   a n d   s y n t a x - b a s e p ro duc t   f e a t ur e   e xt ra c t i o n .   P ro d u c t   P re c i s i o n   Re c a l l   F1   S h a m p o o   9 6 . 1 5 %   9 2 . 5 9 %   9 4 . 3 4 %   S k i n c a r e   9 0 . 4 8 %   9 5 . 0 0 %   9 2 . 6 8 %   T a b l e t   9 2 . 5 9 %   9 6 . 1 5 %   9 4 . 3 4 %   M o b i l e   p h o n e   9 6 . 7 7 %   9 6 . 7 7 %   9 6 . 7 7 %   O v e ra l l   ( A v e ra g e )   9 4 . 0 0 %   9 5 . 1 3 %   9 4 . 5 3 %           Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   22 ,   N o .   2 M a y   202 1   :     1199   -   1 207   1206   4.     C O N C LU S I O N   (1 0   P T)   In  t hi s   s t udy ,   w e   pr o po s e t hr e e   di f f e r e n t   t e c hni que s   us e f o r   e xt ra c t i n g   p r o duc t   f e a t ur e s   f r o m   o n l i n e   r e v i e w   c o m m e n t s :   f r e que n c y - b a s e pr o duc t   f e a t ur e   e xt ra c t i o n   (F - P F E ) ,   s y n t a a n a l y z e r   s y s t e m   (S A S ),   a n d   f r e que n c y   a n d   s y n t a x - b a s e p r o duc t   f e a t u r e   e xt ra c t i o (F a S - P F E ).   F - P F E   us e t h e   f r e que n c y   o f   w o r o c c urr e n c e s   i t h e   c o m m e nt s   de s c r i b e by   T F - ICF   t o   e xt ra c t   c a n di da t e   p r o duc t   f e a t u r e s .   T hi s   a pp r o a c h   a c hi e v e s   77. 68 p r e c i s i o a n d   90 . 91%   r e c a l l .     S A S ,   o n   t h e   o t h e h a nd,   us e s y n t a rul e s   t o   e l e c t   f e a t ur e s   t e rm   f r o m   t h e   b i gra m .     By   c o n s i de ri n t h e   s y n t a x,   S A S   w a s   a b l e   t o   e xt ra c t   f e a t u r e   t e rm s   b e t t e r   t ha n   F - P F E .   It   c a n   a c hi e v e   92. 63%   p r e c i s i o a n d   90 . 21 r e c a l l .   L a s t   b ut   n o t   l e a s t ,   w h e c o m b i n i ng  t h e   r e s ul t   o f   bo t F - P F E   a n d   S A S   us i n g   a   t hr e s h o l d - b a s e c ri t e r i o n ,   t h e   h y b r i a pp r o a c o F a S - P F E   i s   a   c l e a r - c ut   w i nn e r   a m o n g   t h e   t hr e e   a pp r o a c h e s .   T h e   p r e c i s i o n   a n r e c a l l   o f   F a S - P F E   a r e   94 . 00 a n 95. 1 3% ,   r e s pe c t i v e l y .   W h e n   c o n s i de r i n g   di f fe r e nt   p r o duc t   t y pe s ,   w e   fo un t h a t   a l l   t hr e e   a l go ri t hm s   p e r f o r m   b e t t e w h e n   e x t r a c t i n g   f e a t ur e s   f r o m   t h e   pr o duc t s   w i t m a n y   e xpl i c i t   f e a t u r e   s pe c i f i c a t i o n s   s uc a s   IT   p r o duc t s   (t a b l e t s   a n d   m o b i l e   p h o n e s ).   H ow e ve r ,   F a S - P F E   i s   r o b us t   e n o ug h   t o   pe r f o r m   e qua l l y   w e l l   o a l l   p r o duc t   t y pe s .       A C K N O WL ED G E M EN TS   (10   P T)   F i r s t l y ,   w e   a r e   g r a t e f ul   t o   e xpr e s s   s i n c e r e   t h a nks   t o   o ur  f a c ul t i e s   w h o   ga v e   s uppo r t .   S e c o n dl y ,   w e   w o ul l i ke   t o   e xp r e s s   o u r   g r a t i t ude   t o   a l l   t h e   a u t h o r s   o f   t h e   p a pe r s   i n c l ude i t hi s   r e s e a r c h.   F i na l l y ,   a   s pe c i a l   t h a n ks   t o   t h e   c o n f e r e n c e   t e a m   f o r   a c c e pt i ng  o u r   r e s e a r c h.       R EF ER EN C ES   (10   P T)   [ 1]     E l e c t r o ni c   T r a ns a c t i o ns   D e v e l o pm e nt   A g e nc y ,   E T D A   r e v e a l s   t ha t   t he   v a l ue   o f   T ha i   e - C o m m e r c e   ha s   g r o w n   c o ns i s t e nt l y   S ho o t s   up  t o   3. t r i l l i o ba ht   i 2018 ”  2018.   [ O nl i ne ] .   ht t ps : / / w w w . e t da . o r . t h/   [ 2]     C .   C ho t i l da ki t i ka ,   T he   a t t i t ude   a nd  s o c i a l   m e di a   m a r ke t i ng   t ha t   a f f e c t i ng   pur c ha s e   de c i s i o o f   pe r s o na l i z e pr o duc t s   v i a   o nl i ne   c ha nne l ,   B a ng ko U ni v e r s i t y ,   P a t hum t ha ni ,   T ha i l a nd,   2018.   [ 3]   H .   K a ur   , V .   M a ng a t   a nd  N i dhi ,   A   S ur v e y   o f   S e nt i m e nt   A na l y s i s   t e c hni que s ,   2017     I nt e r nat i onal   c onf e r e nc e   on  I - SM A C   ( I oT   i Soc i al ,   M obi l e ,   A nal y t i c s   and  C l oud) ,   pp.   921 - 925,   2017,   do i :   10. 1109/ I - S M A C . 2017. 8058315   [ 4]   V .   M .   P r a dha n,   J .   V a l a   a nd  P .   B a l a ni ,   A   S ur v e y   o S e nt i m e nt   A na l y s i s   A l g o r i t hm s   f o r   O pi ni o M i ni n g ,   I nt e r nat i onal   J our nal   of   C om put e r   A ppl i c at i ons   ( 0975 -   8887) ,   v o l .   133,   no .   9,   pp  7 - 11,   2016.   [ 5]     H .   M i nqi ng   a nd  L .   B i ng ,   M i ni ng   o pi ni o f e a t ur e s   i c us t o m e r   r e v i e w s ,   i P r oc e e di ngs   of   t h e   19t nat i o n a l   c onf e r e nc e   on  A r t i f i c i al   i nt e l l i ge nc e ,   S a J o s e ,   C a l i f o r ni a ,   2004,   pp.   755 - 760.   [ 6]     W .   H a o ,   Y .   Y a ng ,   K .   J i e ,   Z .   X i nhui ,   W .   C ha o   a nd  D .   J i a ny o ng ,   R e s e a r c o F e a t ur e   M i ni ng   A l g o r i t hm   B a s e o n   P r o duc t   R e v i e w s ,   2019  I E E E   I nt e r nat i onal   C onf e r e nc e   on  A r t i f i c i a l   I nt e l l i ge nc e   and  C om put e r   A ppl i c at i o n s   ( I C A I C A ) ,   pp.   205 - 21,   2019,   do i :   10. 1109/ I C A I C A . 2019. 8873491   [ 7]     A .   S .   a nd  K .   K . ,   F e a t ur e   E xt r a c t i o o f   C us t o m e r   R e v i e w s   U s i ng   F r e que nt   P a t t e r M i ni ng   A l g o r i t hm ,   I nt e r nat i o n a l   J our nal   f or   M ode r T r e nds   i Sc i e nc e   and  T e c hnol ogy . ,   v o l .   03,   no .   09,   pp.   91 - 95,   2017.     [ 8]     A .   P .   R o d r i g u e s   a n d   N .   N .   C h i p l u n k a r ,   M i n i n g   o n l i n e   p r o d u c t   r e v i e w s   a n d   e x t r a c t i n g   p r o d u c t   f e a t u r e s   u s i n g   u n s u p e r v i s e d   m e t h o d ,   i n   2 0 1 6   I E E E   A n n u a l   I n d i a   C o n f e r e n c e   ( I N D I C O N ) ,   B a n g a l o r e ,   I n d i a ,   2 0 1 6 .     [ 9]     H .   S he ng ,   L .   X i nl a n,   P .   X ue pi ng ,   N .   Z he ndo ng ,   F i ne - g r a i ne P r o duc t   F e a t ur e s   E xt r a c t i o a nd  C a t e g o r i z a t i o i R e v i e w s   O pi ni o M i ni ng ,   2012  I E E E   12t I nt e r nat i on al   C onf e r e nc e   on  D at M i ni ng  W or k s hops ,   pp.   680 - 68 6 ,   2012,   do i :   10. 1109/ I C D M W . 2012. 53   [ 10]     W .   H a nqi a n,   L .   T a o   a nd  X .   J ue ,   F i ne - G r a i ne P r o duc t   F e a t ur e   E xt r a c t i o i C hi ne s e   R e v i e w s , "   2017  I nt e r nat i o n a l   C onf e r e nc e   on  C om put i ng  I nt e l l i ge nc e   and  I nf or m at i on  Sy s t e m   ( C I I S) ,   pp.   327 - 331,   2017.     [ 11]     N .   H a ni   ,   M .   W a r i a nd  S .   S i t i   ,   F e a t ur e   e xt r a c t i o a nd  o pi ni o c l a s s i f i c a t i o us i ng   c l a s s   s e que nt i a l   r ul e   o c us t o m e r   pr o duc t   r e v i e w ,   2016  4t I nt e r nat i onal   C onf e r e nc e   on  I nf or m at i o and  C om m uni c at i on  T e c hnol ogy   ( I C oI C T ) ,   pp .   1 - 5,   2016,   do i :   10. 1109/ I C o I C T . 2016. 7571891   [ 12]     R .   P .   V e nka t a   a nd  R .   V .   S m r i t hi ,   R e c o m m e ndi ng   pr o duc t s   t o   c us t o m e r s   us i ng   o pi ni o m i ni ng   o f   o nl i ne   pr o duc t   r e v i e w s   a nd  f e a t ur e s ,   2015  I nt e r nat i ona l   C onf e r e nc e   on  C i r c ui t s ,   P ow e r   and  C om put i ng  T e c hnol ogi e s   [ I C C P C T - 2015] ,   pp.   1 - 5,   2015,   do i :   10. 1109/ I C C P C T . 2015. 7159433   [ 13]     S .   D .   T e j a ,   V .   B .   V i s hnu  a nd  D .   R a m e s h,   E xt r a c t i ng   P r o duc t   F e a t ur e s   f r o m   R e v i e w s   U s i ng   F e a t ur e   O nt o l o g y   T r e e   A ppl i e o L D A   T o pi c   C l us t e r s ,   2016  I E E E   6t I nt e r nat i ona l   C onf e r e nc e   on  A dv anc e C om put i ng  ( I A C C ) ,   pp .   163 - 168,   2016,   do i :   10. 1109/ I C o I C T . 2016. 7571891   [ 14]     P .   K i t w a t t ha na t h a w o n,   T .   A ng s kun  a nd  J .   A ng s kun,   A   K no w l e dg e   E xt r a c t i o S y s t e m   f r o m   O nl i ne   R e v i e w s   us i n g   F uz z y   L o g i c ,   2012  N i nt I nt e r nat i onal   C onf e r e nc e   on  C om put e r   Sc i e nc e   and  Sof t w ar e   E ngi ne e r i ng  ( J C SSE ) ,   pp .   189 - 196,   2012 ,   do i :   10. 1109/ J C S S E . 2012. 6261950   [ 15]     J .   A ng s kun,   T he   D e s i g a nd  D e v e l o pm e nt   o f   a   K no w l e dg e   E xt r a c t i o a nd  R e t r i e v a l   S y s t e m   v i a   O nl i ne   G I S   f o r   T ha i l a nd  T o ur i s m   B us i ne s s ,   S ur a na r e e   U ni v e r s i t y   o f   T e c hno l o g y ,   N a kho R a t c ha s i m a ,   T ha i l a nd,   2012.   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A l gor i t hm   f or   e x t r a c t i ng  pr o duc t   f e a t ur e   f r om   e - c om m e r c e   c om m e nt   ( Chani da   Ka e w phe t )   1207   [ 16]   M .   F i kr i   a nd  R .   S a r no ,   M o ha m m a F i kr i ,   R i y a na r t o   A   c o m pa r a t i v e   s t udy   o f   s e nt i m e nt   a na l y s i s   us i ng   S V M   a n S e nt i W o r dN e t ,   I ndone s i an  J our nal   of   E l e c t r i c al   E ngi ne e r i ng  and  C om put e r   Sc i e nc e , v o l .   13,   no .   3,   pp.   902 - 90 9 ,   2019 ,   do i :   10. 11591/ i j e e c s . v 13. i 3. pp902 - 909   [ 17]     W .   K a o l i m ,   K e y w o r e xt r a c t i o us i ng   s e que nt i a l   pa t t e r m i ni ng ,   S i l pa ko r U ni v e r s i t y   R e po s i t o r y   :   S U R E ,   201 4 [ O nl i ne ] .   A v a i l a bl e :   ht t ps : / / bi t . l y / 31t J I X a .   [ 18]   L .   J o ng w o n,   L .   J a e s e ung   a nd  J .   H o e ky ung ,   M a i ke y w o r c o m pa r i s o ba s e o do c um e nt   a na l y s i s   s y s t e m ,   I ndone s i an  J our nal   of   E l e c t r i c al   E ngi ne e r i ng  and  C om put e r   Sc i e nc e ,   v o l .   19,   no .   3,   pp.   1533 - 1539,   2020 ,   do i :   10. 11591/ i j e e c s . v 19. i 3. pp1533 - 1539   [ 19]     V .   K o r de ,   " T e xt   C l a s s i f i c a t i o a nd  C l a s s i f i e r s : A   S ur v e y , "   I nt e r nat i onal   J our nal   of   A r t i f i c i a l   I nt e l l i ge nc e   &   A ppl i c at i ons   ( I J A I A ) ,   v o l .   3,   no .   2,   pp.   85 - 99,   2012,   do i :   10. 5121/ I J A I A . 2012. 3208   [ 20]     P .   S o m j i n,   O pi ni o m i ni ng   f o r   o nl i ne   t e a c hi ng   e v a l ua t i o n,   S c ho o l   o f   I nf o r m a t i o T e c hno l o g y   I ns t i t ut e   o f   S o c i a l   T e c hno l o g y   S ur a na r e e   U ni v e r s i t y   o f   T e c hno l o g y ,   N a kho R a t c ha s i m a ,   T ha i l a nd,   2015.   [ 21]   M .   A l i   F a uz i ,   R a ndo m   F o r e s t   A ppr o a c f o r   S e nt i m e nt   A na l y s i s   i I ndo ne s i a L a ng ua g e ,   I ndone s i an  J our nal   o f   E l e c t r i c al   E ngi ne e r i ng  and  C om put e r   Sc i e nc e ,   v o l .   12,   no .   1,   pp.   46 - 50,   2018 ,   do i :   10. 11591/ i j e e c s . v 12. i 1 . pp46 - 50   [ 22]     H .   W u,   R .   L uk ,   K .   W o ng   a nd  K .   K w o k,   I nt e r pr e t i ng   T F - I D F   t e r m   w e i g ht s   a s   m a ki ng   r e l e v a nc e   de c i s i o ns ,   A C M   T r ans ac t i ons   on  I nf or m at i on  Sy s t e m s ,   v o l .   26,   no .   3,   2008,   do i :   10. 1145/ 1361684. 1361686   [ 23]   K .   T .   U ç a r ,   H o w   t o   C a l c ul a t e   T F - I D F   ( T e r m   F r e que nc y I nv e r s e   D o c um e nt   F r e que nc y )   i P y t ho n,   i y z i c o .   e ng i ne e r i ng ,   2018  [ O nl i ne ] .   A v a i l a bl e :   ht t ps : / / bi t . l y / 3np4pM w   [ 24]     A .   R a m a c ha ndr a n,   N L P   G ui de :   I de nt i f y i ng   P a r t   o f   S pe e c T a g s   us i ng   C o ndi t i o na l   R a ndo m   F i e l ds ,   a na l y t i c s - v i dhy a ,   2018.   [ O nl i ne ] .   A v a i l a bl e :   ht t ps : / / bi t . l y / 2E C F o M 8.   [ 25]   D .   G o da y a l ,   A i nt r o duc t i o t o   pa r t - of - s pe e c t a g g i ng   a nd  t he   H i dde M a r ko v   M o de l ,   f r e e c o de c a m p. o r g ,   201 8 .   [ O nl i ne ] .   A v a i l a bl e :   ht t ps : / / bi t . l y / 2L y 9B z u.   [ 26]     t ut o r i a l s po i nt . c o m ,   B a s i c s   o f   P a r t - of - S pe e c ( P O S )   T a g g i ng ,   t ut o r i a l s p o i nt . c o m ,   2018.   [ O nl i ne ] .   A v a i l a bl e :   ht t ps : / / bi t . l y / 2Q pxU i j .   [ 27]   M .   R o us e ,   pa r t - of - s pe e c t a g g e r   ( P o S   t a g g e r ) ,   w ha t i s . t e c ht a r g e t . c o m ,   2018.   [ O nl i ne ] .   A v a i l a bl e :   ht t ps : / / bi t . l y / 2K s 3B Y A .   [ 28]   J .   A w w a l u,   S .   E .   A bdul l a hi ,   A .   E .   E v w i e kpa e f e ,   P a r t   O f   S pe e c T a g g i ng :   A   R e v i e w   O f   T e c hni que s ,   F U D M A   J our nal   of   Sc i e nc e s   ( F J S) , v o l .   4,   no .   2,   pp.   712 - 721,   2020,   do i :   1 0. 33003/ f j s - 2020 - 0402 - 325   [ 29]     J .   D a ni e l   a nd  M .   H .   J a m e s   ,   “N - g r a m   L a ng ua g e   M o de l s ,   2019.   [ O nl i ne ] .   A v a i l a bl e :   ht t ps : / / s t a nf o r d. i o / 3r 0C y 7n.   [ 30]     E .   P a c ha w o ng s a kda ,   C l a s s i f i e r   e v a l ua t i o m e t r i c s ,   D a t a   M i ni ng   T r e nd,   2015.   [ O nl i ne ] .   A v a i l a bl e :   ht t p: / / da t a m i ni ng t r e nd. c o m / 2014/ c l a s s i f i e r _e v a l ua t i o n_m e t r i c s / .       B I O G R A P H I ES   O F   A U T H O R S   (10   P T)       C h an i d K ae w p h e t   r e c e i v e he r   B . B . A . i bus i ne s s   i nf o r m a t i o t e c hno l o g y   f r o m   R a j a m a ng a l a   U ni v e r s i t y   o f   T e c hno l o g y   S uv a r na bhum i   a nd  M . S . T e c h. E d.   i C o m put e r   E duc a t i o f r o m   K i ng   M o ng kut ' s   U ni v e r s i t y   o f   T e c hno l o g y   N o r t B a ng ko i 2009,   a nd  2011,   r e s pe c t i v e l y .   C ur r e nt l y ,   s he   i s   a   l e c t ur e r   i t he   D e pa r t m e nt   o f   I nf o r m a t i o S y s t e m s   a nd  B us i ne s s   C o m put e r ,   F a c ul t y   o f   B us i ne s s   A dm i ni s t r a t i o a nd  I nf o r m a t i o T e c hno l o g y ,   R a j a m a ng a l a   U ni v e r s i t y   o f   T e c hno l o g y   S uv a r na bhum i ,   T ha i l a nd.       N aw ap o r n   W i s i t p o n gp u n   r e c e i v e he r   B . S . ,   M . S . ,   a nd   P h . D .   de g r e e s   i e l e c t r i c a l   a nd   c om put e r   e ng i n e e r i ng   f r o m   C a r n e g i e   M e l l o U n i v e r s i t y   i 200 0,   20 02,   a nd  2008 ,   r e s pe c t i v e l y .   F r o m   2003  t o   200 s he   w a s   a l s o   a   r e s e a r c a s s o c i a t e   i t he   E l e c t r i c a l   a n C o nt r o l   I nt e g r a t i o L a bo r a t o r y ,   G e n e r a l   M o t o r s   C o r po r a t i o n.   P r e s e n t l y ,   s he   i s   a n   a s s i s t a n t   t o   t h e   pr e s i de n t   f o r   r e s e a r c a nd   i nf o r m a t i o n   t e c hno l o gy   a nd  a   l e c t u r e r   i n   t h e   F a c ul t y   o f   I nf o r m a t i o n   T e c hno l o gy   a t   K i ng   M o ng kut ' s   U ni v e r s i t y   o f   T e c hno l o gy   N o r t B a ng ko k,   T ha i l a nd.   H e r   r e s e a r c i n t e r e s t s   i nc l ud e   t r a f f i c   m o de l i ng ,   c ha o s   i n   t he   I nt e r n e t ,   a nd   c r o s s - l a y e r   ne t w o r pr o t o c o l   de s i g f o r   w i r e l e s s   ne t w o r ks ,   s o c i a l   ne t w o r a na l y s i s ,   a nd  di g i t a l   g o v e r nm e nt .     Evaluation Warning : The document was created with Spire.PDF for Python.