I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   17 ,   N o .   1 J a n u a r y   20 20 ,   pp .   2 64~ 27 2   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 1 7 .i 1 . pp264 - 272             264       Jou r n al   h o m e pa ge ht t p: / / i j e e c s . i a e s c or e . c om   Hi e r a r c h y   b a sed  f i r e f l y   o p t i m i z e d   k - m e a n s c l u st e r i n g   f o r   c o m p l e x   q u e st i o n   a n sw e r i n g       A .   C h an d r a   O b u l R e d d y,   K .   M ad h av i   D e pa r t m e n t   o f   C o m put e r   S c i e nc e   &   E ng i ne e r i ng ,   J a w a ha r l a l   N e h r u   T e c hno l o g i c a l   U n i v e r s i t y ,   I ndi a       A r ti c l e   I n fo     A B S TR A C T     Ar t i c l e   h i s t or y :   R e c e i v e M a y   1 ,   2 019   R e v i s e J ul   2 ,   2019   A c c e pt e J ul   16 ,   201 9       C o m pl e Q u e s t i o A ns w e r i ng   ( C Q A )   i s   c o m m o nl y   us e d   f o r   a ns w e r i ng   c om m uni t y   que s t i o ns   w hi c r e qui r e s   h um a n   kno w l e dg e   f o r   a ns w e r i ng   t h e m .   I t   i s   e s s e n t i a l   t o   f i nd  c o m pl e qu e s t i o a ns w e r i ng   s y s t e m   f o r   a vo i di ng   t he   c om pl e xi t i e s   be hi n t he   que s t i o a n s w e r i ng   s y s t e m .   I t h e   p r e s e nt   w o r k ,     w e   pr o po s e H i e r a r c hy   ba s e F i r e f l y   O pt i m i z e k - m e a ns   C l us t e r i ng    ( H F O - K C )   m e t ho f o r   c om pl e qu e s t i o a n s w e r i ng .   I ni t i a l l y ,   t he   g i v e i np ut   que r y   i s   pr e p r o c e s s e d .   I t   e l i m i na t e s   t he   w a y   of   m i s c l a s s i f i c a t i o w he c om pa r i ng   t h e   s t r i ng s .   I o r de r   t o   e nh a nc e   t h e   a n s w e r   s e l e c t i o pr o c e s s ,     t he   o bt a i n e k e y w o r ds   a r e   m a pp e i nt o   t h e   c a nd i da t e   s o l ut i o ns .     A f t e r   m a p pi ng ,   t h e   o bt a i n e k e y w o r ds   a r e   s e g m e n t e d .   E a c s e g m e nt a t i o f o r m s   a   ne w   que r y   f o r   a ns w e r   s e l e c t i o a nd  v a r i o us   n um be r   o f   a ns w e r s   s e l e c t e f o r   e a c que r y .   O ka pi - 25  s i m i l a r i t y   c om put a t i o i s   u t i l i z e f o r   t he   pr o c e s s   o f   doc um e nt   r e t r i e v a l .   T he t h e   a ns w e r s   s e l e c t e a r e   c l a s s i f i e w i t h   K   m e a ns   c l us t e r i ng   w hi c f o r m s   t he   hi e r a r c hy   f o r   e a c a ns w e r .   F i na l l y   t he   f i r e f l y   o pt i m i z a t i o a l g o r i t hm   i s   u s e d   f o r   s e l e c t i ng   t he   be s t   qua l i t y   o f   a ns w e r   f r o m   t he   hi e r a r c hy .   Ke y w or ds :   Cl us t e r i n g   Co m pl e que s t i o n   a n s w e r i n g   F i r e f l y   o pt i m i z a t i o n   Q ue r y   s e gm e n t a t i o n   C opy r i gh t   ©   2020   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   A .   C ha n d ra   O b ul a   R e ddy ,   D e pa rt m e n t   o f   Co m put e S c i e n c e   &   E n gi n e e r i n g ,     J a w a h a rl a l   N e hr u   T e c hn o l o gi c a l   U ni v e r s i t y ,     A na n t ha pu r,   A n a nt h a pu r a m u   -   515002 ,   A . P . ,   I n d i a .   E m a i l :   c ha n d ra j nt ua na nt a p u r @ g m a i l . c o m       1.   I N TR O D U C TI O N     S e m a n t i c   i n f o r m a t i o pub l i s h e o n   t h e   w e b   i s   i n c r e a s e ra p i dl y   w i t l i nke da t a   i n i t i a t i v e .     H ow e ve r   i t   i s   t y pi c a l l y   c o m pl e fo r   t h e   us e r   t o   s e a r c h   a n que r y   t h e   v a s t   a m o unt   o f   s t r uc t u r e a n d   h e t e r o ge n e o us   s e m a n t i c   da t a   [1] .   It   i s   e s s e n t i a l   t o   b ui l a   s y s t e m   w h i c h   c a n   a b l e   t o   a n s w e r   f r o m   di f fe r e n t   do m a i n.   I t   i s   t e r m e d   a s   o pe do m a i n   q ue s t i o a n s w e r i n g   s y s t e m   w h i c s h o ul b e   a c c e s s   t h e   k n o w l e dge   i n   n o v e l   w a y   [2].   W h e c o n c e rn   a b o ut   t h e   s t o r e da t a ,   t h e   v o l um e   i s   h i g h   a n i t   i n c r e a s e s   t h e   b u r de n   o f   f i l t e ri n g   a n b r o w s i n g   t h e   r e s ul t   f o r   r e t r i e v i n p r e c i s e   i n f o r m a t i o n.   Q ue s t i o n   a n s w e r i n s y s t e m   i s   a   t e c hn o l o g y   us e t f i n d,   e xt ra c t ,   a nd  p r o v i de   a   pr o pe r   a n s w e r   t o   t h e   us e r ' s   que r y   i n   t h e   na t u ra l   l a n g ua ge   f o r m a t   [3] .     T h e   r e po s i t o r i e s   a r e   s pe c i a l l y   m a de   fo r   a c c o m pl i s h i n s e v e r a l   t a s ks   l i ke   que s t i o n   a n s w e r i n g,   k n o w l e dge   m i ni n a n d   s e a r c hi n g   [4] .   D a t a   m i ni n i s   a   s ub f i e l o f   c o m put e s c i e n c e   t ha t   e na b l e s   i n t e l l i ge n t   e xt r a c t i o of  us e f ul   i n f o r m a t i o [5] .       D ue   t o   i t s   l a r ge   a n d   g r o w i n s t ruc t u r e   o f   da t a ,   e f f i c i e n t   a n i nt ui t i v e   t e c hn i que s   a r e   e s s e n t i a l   t o   de a l   w i t h   t h e m .   T h e   c o m pl e xi t y   a n e a s e   of   i nt e r f e r e n c e   i s   t a k e n   i nt o   a c c o un t   w hi l e   p r o c e s s i n t h e   da t a   [6] .   In s t e a o f   kn o w i n t h e   q ue r y   l a n gu a ge ,   t h e   k n o w l e dge   gr a p h   e x t r a c t s   t h e   s t r uc t u r e   a nd  r e l a t i o n   b e t w e e n   t h e   que s t i o n   a n a n s w e r   [7].   I n   a d di t i o n   w i t h   c o l l a b o r a t i v e   i n f o r m a t i o n   s e e ki n a n s h a ri n g ,   c o l l a b o r a t i v e   a n s w e r s   a r e   a l s o   i n c l ude d .   T h e   c o m m u n i t y   a gr e e m e n t s   a m o n Q ue s t i o n   A n s w e r i n (Q A pa i r s   a r e   o b t a i n e w i t h   m i c r o   c o l l a b o r a t i o n   a nd  t h e   e nha n c e m e nt   o f   c o l l e c t i v e   i n t e l l i ge n c e   [8].   T h e   ke y w o r ds   f r o m   t h e   que r y   a r e   m a t c h e w i t t h e   m e t a da t a   i w h i c s e que n c e   o f   a n s w e r s   a r e   r e t ri e v e fo r   t h e   gi v e que r y .   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       H i e r ar c h y   bas e d   f i r e f l y   op t i m i z e k - m e ans   c l us t e r i n f or   c o m pl e x   qu e s t i on…   ( A .   Chandr a   O bul R e d dy )   265     T h e   s e m a n t i c   que s t i o n   a n s w e r i n s y s t e m   w a s   d e ve l o p e i n   w h i c h   u n c e rt a i n   w o r ds   a r e   t h e   que s t i o n.   T h e   f uz z y   b a s e o n t o l o g y   s y s t e m   i s   de ve l o pe by   t h e   r e s e a r c h e r s   i n   t h e   t e xt   e xt ra c t i o n   l e v e l .     T h e   c h a ra c t e ri s t i c s   o f   da t a   a r e   a n a l y z e t o   c h e c t h e   po s s i b i l i t y   of   s o l v i n f r e que n t l y   p o s e que s t i o n s   [9].   T h e   s e a r c h   f a c i l i t y   i s   t h e   m a i n   f e a t u r e   of   CQ A   s e r v i c e s   w h i c h   pe rm i t s   t h e   m e m b e r s   t o   s e a r c h   t h e i r   a r c h i v e s .   N o r m a l l y ,   t h e   i n f o r m a t i o n   r e t ri e v a l   a pp r o a c h e s   a r e   de v e l o p e i n   w hi c h   t h e   m e m b e r   c a n   c o n s t ruc t   a n s e n d   a r b i t r a r y   c o l l e c t i o n   o f   que s t i o n s   unt i l   t h e   o l d   que s t i o n   f o r   t he   c urr e n t   n e e i s   o b t a i n e [1 0].   T h e   r e us e   o f   pa s t   Q A   pa i r s   p r o v i de s   t h e   b e n e f i t   o f   e n ha n c i n g   us e r   e xpe r i e n c e   [ 11].     T h e   e ff i c i e n c y   of   pr o c e s s i n n a t u r a l   l a ngua ge   que s t i o n s   a r e   i m p r o v e w h i l e   h e t e r o ge n e o us   da t a   i s   ut i l i z e a s   a n   a n s w e r   s o ur c e .   T h e   us a ge   o f   un i que   s o ur c e   i s   n o t   s t r a i g ht f o r w a r b e c a us e   of   pa t t e rn     v a r i a t i o n   [1 2].   W h e n   m a ppi ng  t h e   que s t i o n   w i t h   t h e   s e m a nt i c   c o n t e n t   o f   kn o w l e dge b a s e ,   de pt i n f o r m a t i o n   i s   r e qui r e d   [13] .   G r o up  b a s e r e c o m m e n da t i o n s   a r e   de v e l o p e w i t h   t w o   t e c h n i que s   n a m e l y   a ggr e ga t i o o i n t e r e s t i n p r o f i l e   a n a gg r e ga t i o n   o f   r e c o m m e n da t i o n   l i s t   [ 14].   T h e   t e rm i n o l o gy   us e i n   N L   que s t i o n   v a r i e s   f r o m   t h e   t e r m i n o l o g y   us e i n   k n o w l e dg e   b a s e .   T h e   s o l ut i o n   f o r   c o n c e pt ua l   di s a m b i gua t i o n   i s   e s s e n t i a l   fo r   s e a r c h i n g   t h e   m a t c h e s   f r o m   h o m o ge n e o us   o r   h e t e r o ge n e o us   re s o ur c e s   [15].     T h e   m a c hi n e   l e a rn i ng  p a r a d i g m s   a r e   de v e l o p e r e c e n t l y   for   c l a s s i fy i n g,   o r ga ni z i n a n e xt ra c t i ng  r e l e v a nt   i n f o r m a t i o n.   E v e n   t h o ugh,   t h e   que s t i o n   c l a s s i f i c a t i o n   i s   m o r e   a c c u r a t e ,   i t   i s   r e qui r e t o   m a ke   t h Q A S   c o m pr e h e n s i o n   m o r e   u n de r s t a n d a b l e   f o r   e a s i l y   ob t a i ni n t h e   c o rr e c t   a n s w e r   [ 16,   17] .   I t   f a c e s   t h e   di f f i c ul t i e s   s uc h   a s   l i n gu i s t i c   g a p   b e t w e e n   t h e   do c um e nt s   a nd   s e a r c que r i e s   a nd  t h e   u na v a i l a b i l i t y   of   r e c e n t l y   po s e qu e s t i o n s .   H e n c e   i t   i s   n o t   po s s i b l e   f o r   s e a r c hi n CQ A   a c h i e v e s   fo r   o b t a i ni n w e b   que r i e s   [18].     T h e   s i m i l a ri t y   be t w e e n   que s t i o n   a n m a t c h i n w o r ds   pr o v i de   t h e   e xt ra c t i o n   f e a t u r e s   fo r   t o r a n ke   a n s w e r   [19] .     T h e   o ut l i n e   of   t h i s   pa pe r   i s   de s c r i b e a s   fo l l ow s .   S e c t i o n   b r i e f l y   e xpl a i n s   t h e   p r o po s e d   m e t h o of  c o m pl e que s t i o n   a n s w e r i n s y s t e m .   S e c t i o n   de s c r i b e s   t h e   R e s e a r c h   M e t h o d,   H i e ra r c h y   b a s e F i r e f l y   O pt i m i z e k - m e a n s   Cl us t e ri n (H F O - K C).   I n   S e c t i o n   4 t h e   e xpe r i m e n t a l   r e s ul t s   a r e   a na l y z e d.   S e c t i o n   di s c us s e s   t h e   s i g n i f i c a n t   a s pe c t s   o f   t h e   w o r a nd  c o n c l ude s .       2.   TH E   P R O P O S ED   M ET H O D     In   t h e   p r o po s e m e t h o of   c o m pl e que s t i o n   a n s w e r i n g   s y s t e m ,   i ni t i a l l y   t h e   i n pu t   que r y   i s   pr e p r o c e s s e d.   A f t e r   pr e p r o c e s s i n g,   t h e   ke y w o r ds   a r e   o b t a i ne a n t h e y   a r e   s e gm e n t e d.   F o r   e a c h   s e gm e nt ,   n u m b e r   o f   a n s w e r s   a r e   e xt ra c t e d.     In   o r de r   t o   s e l e c t   t h e   c o rr e c t   a n s w e r   f o r   t h e   gi v e n   i nput   qu e r y ,   t h e   c o l l e c t e a n s w e r s   a r e   c l a s s i f i e w i t h   k   m e a n s   c l us t e r i n g   a nd  t h e   b e s t   a n s w e r   i s   s e l e c t e us i ng  f i r e f l y   o pt i m i z a t i o a l go r i t hm .   K - M e a n s   i s   o n e   of   t h e   p r o m i s i n g   a nd  e f fe c t i ve   c l us t e r i ng  a l go ri t hm   [20] .   C l us t e r i n g   p l a y s   a   w i de   r o l e   i t h e   r e c e n t   de ve l o pm e n t   o f   c o m put e r   s c i e n c e   [21] .   I M a c hi n e   l e a rni n g ,   s upe r v i s e l e a rni n g   k n o w n   a s   c l a s s i f i c a t i o a nd  un s upe r v i s e l e a rni n k n o w n   a s   c l us t e ri n [22] .   T h e   f l o w   di a g r a m   o f   pr o po s e CQ A   s y s t e m   i s   s h o w n     i n   F i gu r e   1 .       U s e r   q u e r y                                                                                                                                                                                                                                                 S t o p   w o r d   r e m o v a l L e m m a t i z a t i o n T e m p l a t e   m a p p i n g S e g m e n t a t i o n I n p u t   d a t a                                                                                                                                                                                                                                                 P r e p r o c e s s i n g   a n d   q u e s t i o n   s e g m e n t a t i o n O k a p i - BM 25                                                                                                                                                                                                                                                 A n s w e r   s e l e c t i o n H i e r a r c h i c a l   K N N                                                                                                                                                                                                                                                 A n s w e r   c l a s s i f i c a t i o n F i r e f l y   o p t i m i z a t i o n                                                                                                                                                                                                                                                 O p t i m a l   a n s w e r   s e l e c t i o n     F i gu r e   1 .   O p t i m a l   hi e ra r c h y   b a s e m e a n s   c l us t e ri n g   f o r   c o m pl e que s t i o a n s w e r i ng   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   17 ,   N o .   1 J a n u a r y   20 20  :     264 - 272   266   2. 1 .      P r e p r o c e s s i n g   an d   Q u e s t i o n   S e gm e n tati o n     T h e   pr e p r o c e s s i n c a n   b e   a ppl i e t o   t h e   i n put   que r y   a n d   t h e   c o l l e c t i o n   of   d oc um e n t s .   I n i t i a l l y ,     t h e   i n di v i du a l   ke y w o r ds   a r e   e xt r a c t e a nd  t h e   s t o w o r ds   a r e   r e m o v e d.   A f t e r   s t o w o r r e m o v a l ,     w o r l e m m a t i z a t i o n   i s   a p pl i e d   f o r   t h e   r e m a i ni n g   ke y w o r ds .   E a c h   ke y w o r i s   m a ppe w i t i t s   c o rr e s po n di ng  t e m pl a t e s .   A f t e r   p r e p r o c e s s i n g,   t h e   i n pu t   ke y w o r ds   c o n t a i n   n   t upl e s   } . . . , { 2 1 n a a a Q .   E a c h   ke y w o r i s   m a ppe w i t h   s e t   of   t e m pl a t e s   de n o t e a s } . . . , { 2 1 m t t t a .   T h e n   t h e   t e m pl a t e s   a r e   g r o upe t o   fo r m   s e gm e n t s   a n t h e   num b e r   o f   a n s w e r s   a r e   s e l e c t e fo r   e a c s e gm e nt .   T h e   b l o c di a g r a m   f o r   p r e p r o c e s s i n a n d   que s t i o s e gm e n t a t i o n   i s   s h o w n   i F i gu r e   2.       Q u e r y   1 I n p u t   q u e r y K e y w o r d   e x t r a c t i o n T e m p l a t e   m a p p i n g S e g m e n t a t i o n K e y w o r d   1 K e y w o r d   n T e m p l a t e   s e t   1 T e m p l a t e   s e t   n S e g m e n t   1 S e g m e n t   m ... ... ... Q u e r y   2 K e y w o r d   1 K e y w o r d   n T e m p l a t e   s e t   1 T e m p l a t e   s e t   n S e g m e n t   1 S e g m e n t   m ... ... ... Q u e r y   n K e y w o r d   1 K e y w o r d   n T e m p l a t e   s e t   1 T e m p l a t e   s e t   n S e g m e n t   1 S e g m e n t   m ... ... ... . . .     F i gu r e   2 .   P r e p r o c e s s i n a n que s t i o s e gm e n t a t i o n       2. 2 .      A n s w e r   S e l e c t i o n   fo r   th e   G i v e n   I n p u Q u e r y     F o r   t h e   s e gm e nt e que s t i o n s ,   t h e   a n s w e r   i s   s e l e c t e b a s e o n   t h e   O ka pi - B M 25  s c o r e .   T h e   s c o r e   i s   c o m put e fo r   e a c a n s w e r .   It   s e l e c t s   i n i t i a l   s e t   o f   r e l e v a n t   a n s w e r s   b a s e o n   s i m i l a ri t y   a n i t   c a p r o c e s s   e ff i c i e n t l y   t h a n   c o s i n e   s i m i l a ri t y   m e a s ur e m e n t .   B y   us i n t h e   f o l l ow i n f o r m u l a ,   t h e   O k a pi - B M 25  s c o r e   i s   c o m put e d :     q t f b q t f b a t f B a t f b w A Q O k a p i i A Q t i 3 3 1 ) 1 ( ) 1 ( ) , (   (1)     W h e r e ,   Q   r e p r e s e n t s   t h e   que r y ,   A r e p r e s e n t s   t h e   a n s w e r   f o r   t h e   gi v e n   que r y ,   q t f i s   t h e   que s t i o n   t e rm   f r e que n c y ,   a t f   i s   t h e   a n s w e r   t e r m   f r e que n c y ,   a n 3 1 , b b r e p r e s e nt s   t h e   c o n s t a n t   p a ra m e t e r s .   T h e   v a l ue   of   B   i s   c o m pu t e a s :     av al al c c b B . ) 1 ( 1   (2)     W h e r e ,   c   r e p r e s e n t s   t h e   c o n s t a nt   p a r a m e t e r ,   al r e p r e s e n t s   t he   a n s w e r   l e n gt h   a n a v a l r e p r e s e nt s   t h e   a v e r a ge   a n s w e r   l e n gt h.   T h e   w e i gh t   v a l ue   us e i e qua t i o (1 i s   de f i n e a s     ) 5 . 0 ( ) 5 . 0 ( l o g p p P w   (3)     W h e r e ,   P i s   t h e   num b e r   o f   a n s w e r s ,   p r e p r e s e n t s   t h e   n u m b e r   o a n s w e r s   h a v i n t e r m   t .   T h e   t o r e l e v a n t   a n s w e r s   a r e   s e l e c t e f r o m   t h e   do c um e n t   b a s e o n   O ka pi - B M 25  m e t h o [23].   T h e s e   t o r e l e v a n t   do c um e n t s   a r e   ut i l i z e f o r   f u r t h e p r o c e s s i n i t e rm s   o f   do c um e n t   c l a s s i f i c a t i o n.   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       H i e r ar c h y   bas e d   f i r e f l y   op t i m i z e k - m e ans   c l us t e r i n f or   c o m pl e x   qu e s t i on…   ( A .   Chandr a   O bul R e d dy )   267   3.   R ES EA R C H   M ET H O D     T h i s   s e c t i o n   de s c r i b e s   H i e r a r c h y   b a s e F i r e f l y   O pt i m i z e k - m e a n s   Cl us t e ri n (H F O - K C)  m e t h o fo r   c o m pl e que s t i o n   a n s w e r i n g .     3. 1 .      A n s w e r   C l as s i fi c at i o n   w i th   h i e r ar c h i c a l   K - N e ar e s N e i gh b o r     By   us i n t h e   s c o r e   ob t a i n e d,   h i e r a r c hi c a l   K - N e a r e s t   N e i ghbo r   (K N N i s   ut i l i z e i n   w h i c h   t h e   t o r e l e v a nt   a n s w e r s   a r e   s e pa ra t e d .   T h e   a n s w e r   w i t h   hi g h e s t   a nd  l o w e s t   s c o r e   i s   s e pa ra t e a s   di f f e r e n t   g r o ups .   T h e   K N N   c l a s s i f i c a t i o n   c a n   b e   a c c o m pl i s h e b a s e o n   t h e   c e n t r o i s c o r e   a n e a c h   t i m e   t h e   n e w   gr o up  i s   fo r m e h i e r a r c h i c a l l y .   K N N   i s   o n e   of  t h e   s i m pl e s t   a n po pul a r   s upe r v i s e l e a rni n a l go ri t hm   f o r   c l a s s i f i c a t i o n   [2 4].   T h e   i n pu t   da t a   t a ke n   by   t h e   K N N   a r e   t h e   i n put   v a l ue   k a n t h e   c o l l e c t i o n   o f   a n s w e r s   us e d   fo r   c l a s s i f i c a t i o n.   T h e   c l a s s i f i c a t i o n   p r o b l e m   i s   s o l ve by   t h e   n um b e r   o f   n e a r e s t   n e i g h b o r s   w h i c h   a r e   t a ke n   fo r   t h e   i n pu t   pa ra m e t e r k .   It   i s   t h e   s t ra i g ht f o r w a r a p p r o a c h   f or   c l a s s i f i c a t i o n.   F o r   e a c h   g r o up  t h e   k   n e a r e s t   n e i g h b o r s   a r e   c o m put e b a s e o n   t h e   c e n t r o i v a l ue .   I n i t i a l l y   t h e   a n s w e r s   a r e   r a ndo m l y   di v i de i n t o   t w gr o ups .   F r o m   e a c h   gr o up ,   t h e   c e n t r o i v a l ue   i s   c h o s e n   b a s e o n   t h e   s c o r e .   T h e n   t h e   di s t a n c e   be t w e e n   t h e   c e n t r o i v a l ue   a nd  t h e   r e m a i n i ng  t u pl e s   a r e   c o m put e d.   T h e   t upl e s   a r e   a dde i n t o   t h e   g r o up  w hi c p r o duc e s   l e s s   di s t a n c e   w h e n   c o m pa r e w i t h   t h e   o t h e r   g r o up.   T h e   K N N   a l go ri t hm   f o r   a n s w e r   c l a s s i f i c a t i o n   i s   de s c r i b e d   a s   f o l l ow s .     A l go r i t h m   1 :   K N N   a l go r i t hm   f o r   a n s w e r   c l a s s i f i c a t i o n   In p ut :   A n s w e r   c o l l e c t i o n   w i t s c o r e ,   k   v a l ue   O ut put :   c l a s s i f i e s e t   o f   a n s w e r s   S t e p1:   T h e   s c o r e   f r o m   e a c a n s w e r   i s   t a ke n   i n t o   c o n s i de r a t i o f o r   a n s w e r   s e l e c t i o n.   S t e 2:   T h e   a n s w e r s   a r e   di v i de i n t o   k   g r o ups   ra n do m l y   S t e 3:   S e l e c t   c e n t r o i d   f r o m   e a c h   g r o up.     S t e 4:   F o r   e a c a n s w e r ,   c o m put e   t h e   di s t a n c e   b e t w e e n   t h e   a n s w e r   a n d   c e n t r o i d .   S t e 5:   T h e   a n s w e r   i s   a dde w i t h   t h e   g r o up  w h i c h   p r o duc e   m i ni m u m   di s t a n c e   w h e n   c o m pa r e w i t h   t h e   o t h e g r o ups .   S t e 6:   S i m i l a t o   t ha t   a l l   t h e   a n s w e r s   a r e   a d de t o   t h e   r e l e v a nt   g r o up .   S t e 7:   A f t e r   di v i di ng  i n t o   k   g r o ups   a g a i t h e   c e n t r o i d   v a l ue   i s   s e l e c t e a n d   n e w   gr o up  i s   f o r m e d.   S t e 8:   T h e   p r o c e s s   i s   r e pe a t e u n t i l   t h e   c e n t r o i i s   s a m e   f o r   t h e   p r o c e e di n i t e r a t i o n s .       T h e   c o l l e c t i o n   o a n s w e r s   c a n   b e   c o n s i de r e a s   a   da t a   po i nt   i n   n   d i m e n s i o na l   s pa c e .   T h e   n u m b e r   of  a t t ri b ut e s   a r e   de n o t e a s   n.   I o r de r   t o   c o m put e   t h e   di s t a n c e   b e t w e e n   t w o   da t a   po i n t s   t h e   E uc l i de a di s t a n c e   i s   us e d.   T h e   E uc l i de a n   di s t a n c e   b e t w e e n   da t a   po i n t s   x a n d   y i s   c a l c ul a t e d   a s     n i i i y x d 1 2 ) (   (4)     W h e r e ,   n   r e pr e s e nt s   t h e   n u m b e r   o f   a t t r i b ut e s   i d a t a   s e t   i x a n i y a r e   v a l ue s   o f   a t t ri b ut e   i   i d a t a   t upl e s   x   a n y r e s pe c t i v e l y .   In s t e a o us i n E uc l i de a n   d i s t a n c e ,   M i nko w s ki   di s t a n c e   a n M a nh a t t a n   di s t a n c e   a l s o   be   us e d.   T h e   s i m pl e s t   c a s e   of   t h i s   a l go ri t hm   i s   a t t a i n e w i t h   s e t t i n t h e   v a l ue   o f   t o   o n e .   T h e   s pe c i f i c   pr o pe r t y   of   t hi s   a l go r i t h m   i s   p r e di c t i ng  t h e   c o n t i n uo us   v a l ue a t t r i b ut e s   i n s t e a d   o f   us i ng  c a t e go r i c a l   a t t ri b ut e s .     3. 2 .      O p ti m i z e d   A n s w e r   S e l e c t i o n   w i th   F i r e f l y   A l go r i th m     A f t e r   gr o upi n t h e   a n s w e r s ,   t h e   a c c ur a t e   a n s w e r   r e l e v a nt   t o   e a c h   que r y   i s   s e l e c t e b a s e o n   f i r e f l y   o pt i m i z a t i o n.   It   i s   a   m e t a - h e u ri s t i c   a l go r i t hm   f o r   f i n di ng  o pt i m a l   s o l ut i o n   f o r   t h e   o pt i m i z a t i o n   p r o b l e m .   T h e   c o n c e pt   be h i n t h i s   f i r e f l y   o pt i m i z a t i o n   i s   t h e   f l a s hi n b e ha v i o r   o f   e a c h   f i r e f l y .   S e t   o f   a s s u m pt i o n s   w e r e   m a de   f o r   t h i s   f i r e f l y   o pt i m i z a t i o n .   T h e y   a r e   a)   It   i s   a s s u m e t ha t   a l l   f i r e f l i e s   c a b e   a t t r a c t e b y   t h e   o t h e f i re f l i e s .   b)   T h e   a t t r a c t i v e n e s s   i s   r e p r e s e nt e by   i t s   b r i g h t n e s s .   T h e   f i r e f l y   w h i c h   h a s   l o w e r   b r i g ht n e s s   i s   a t t ra c t e by   t h e   f i r e f l y   w h i c ha s   hi g h e r   b ri g ht n e s s .   c)   T h e   f i r e f l i e s   ha v i n g   s a m e   b ri g ht n e s s   a r e   m o v e r a n do m l y .   T h e   a t t ra c t i v e n e s s   o f   a   f i r e f l y   i s   c a l c ul a t e d   us i n g   f o l l ow i n g   f un c t i o n :     2 , 0 . ) ( r e r   (5)     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   17 ,   N o .   1 J a n u a r y   20 20  :     264 - 272   268   W h e r e ,   0   i s   t h e   a t t r a c t i v e n e s s   of   t h e   f i r e f l y   w h e 0 r a n d     i s   l i g ht   a b s o r pt i o c o e ff i c i e n t .   T h e   f i r e f l y s   m o ve m e n t   t o t a l l y   de pe n ds   o i t s   a t t ra c t i v e n e s s .   F i r e f l y   i   w o ul m o v e   t ow a r ds   f i r e f l y j   i f   a n d   o n l y   t h e   a t t ra c t i v e n e s s   o f   t h e   f i r e f l y   j   i s   g r e a t e r   t h a t h a t   o f   f i r e f l y   i .   I t h a t   c a s e ,   t h e   m o v e m e n t   i s   s h o w n   by   fo l l ow i n g   f o r m ul a :     ) 5 . 0 ( . ) .( , 2 , 0 ik k jk ik r ik ik r a n d S y x e x x ij   (6)       ik x a n d jk y a r e   v a l ue s   o f   a t t r i b ut e   k k t a ke s   v a l ue s   f r o m   n ,... 2 , 1 ,   w h e r e   n   i s   t he   di m e n s i o o f   t h e   da t a   s e t .   ik r a n d i s   a   ra n do m   num b e r   b e t w e e n   0   a nd  1 .     i s   c a l l e d   r a n do m i z a t i o n   p a ra m e t e r   w hi c w i l l   de c i de   h o w   m uc h   t o   m o v e   a n d   t a ke s   v a l ue   b e t w e e n   1 & 0 k S   i s   s c a l i n g   pa ra m e t e w h i c h   i s   c a l c ul a t e d   f o e a c h   a t t r i b ut e .   k S i s   c a l c ul a t e a s     k k k l u S   (7)       k u a n d k l a r e   t h e   u ppe b o un a n d   l o w e r   b o un o f   t h e   a t t ri b ut e   k   r e s pe c t i v e l y . ij r i s   t h e   di s t a n c e   b e t w e e n   t h e   f i r e f l i e s   i a n d j w h i c h   c a l c ul a t e f r o m :       2 1 ) ( n i i i ij y x r   (8)       T h e   v a l ue   o f   a t t ra c t i v e n e s s   i n   o pt i m i z a t i o p r o b l e m s   i s   c a l c ul a t e us i ng  a o bj e c t i v e   f un c t i o n.     T h e   a l go ri t hm   f o r   s t a n d a r d   f i r e f l y   a l go r i t h m   i s   gi v e b e l ow :     A l go r i t h m   2 :   F i r e f l y   o pt i m i z a t i o n   In p ut :   O b j e c t i ve   f un c t i o n   ) ( x f a n d   a l go ri t hm   pa ra m e t e r s   0 0 , ,   a n d   γ   O ut put :   M i n i m i z e f u n c t i o v a l ue   po s i t i o n   S t e 1:   I n i t i a l i z e   f i r e f l y   po pul a t i o n   p   r a ndo m l y .   S t e 2 :   I n i t i a l i z e   a l go r i t hm   p a r a m e t e r s 0 0 , ,   a n d   γ .   S t e 3:   Ca l c ul a t e   f i t n e s s   v a l ue   us i n t h e   o b j e c t i ve   f un c t i o n ) ( x f   f o r   e a c h   f i r e f l y .   S t e 4:   w h i l e   g e n e r a t i o n t m a x   fo r   p i : 1   fo r   i j : 1   i f   ) ( ) ( i j x f x f   m o ve   f i r e f l y   i   t o w a r ds j us i n g   (3)   c a l c ul a t e   f i t n e s s   v a l ue   a g a i o f   a l l   f i r e f l i e s   e n i f   e n f o r   e n f o r   e n w h i l e   S t e 5:   R a n t h e   f i r e f l i e s   t o   f i n d   t h e   c u rr e n t   b e s t   f i r e f l y .       In   p r e s e n t   p a pe r ,   t h e   p r e p r o c e s s i n c a n   b e   a c c o m pl i s h e i ni t i a l l y   a n i t   m a ke s   e a s i e r   f o r   f ur t h e pr o c e s s i n g.   A f t e r   p r e p r o c e s s i n t h e   r e l e v a n t   a n s w e r s   a r e   c o l l e c t e a n t h e y   a r e   c l a s s i f i e w i t h   K N N   c l a s s i f i e r .   F i n a l l y ,   i o r de r   t o   i m p r o v e   t h e   c l a s s i f i c a t i o a c c ur a c y   a n f o r   f i n d i n t h e   c o r r e c t   a n s w e r ,     t h e   o pt i m i z a t i o n   a l go r i t h m   f i r e f l y   i s   us e d.   I n   t hi s   CQ A   s y s t e m ,   t h e   c o m pl e xi t y   of   t h e   p r o c e s s i n i s   r e duc e d   w i t h   t h e   h e l o f   s i m pl e s t   a l go ri t hm .   W h e n   c o m pa r e w i t h   t h e   e xi s t i n l i t e r a t u r e s ,   t h e   t ra de - o ff   be t w e e n   c o m pl e xi t y   a n d   a c c ura c y   c a n   b e   a t t a i n e d.   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       H i e r ar c h y   bas e d   f i r e f l y   op t i m i z e k - m e ans   c l us t e r i n f or   c o m pl e x   qu e s t i on…   ( A .   Chandr a   O bul R e d dy )   269   4.   R ES U LTS   A N D   D I S C U S S I O N     T h e   F a c t o i Q & A   Co r pus   i s   us e a s   a   da t a s e t   i n   o ur   w o r fo r   c o m pl e que s t i o n   a n s w e r i n [25] .     It   c o n s i s t s   of  1, 714  f a c t o i que s t i o n s   w h i c h   a r e   c r e a t e m a n u a l l y .   T h e   a n s w e r   f o r   t h e   que s t i o n   i s   c o l l e c t e d   f r o m   Ca rn e gi e   M e l l o n   U ni v e r s i t y   a n d   U n i v e r s i t y   of   P i t t s b ur g h   i b e t w e e n   2008  a n 2 010.   F o r   K N N   a l go ri t hm   t h e   K   v a l ue   i s   de f i n e a s   a n d   t h e   c o n s t a n t   p a r a m e t e r s   a r e   2 . 1 1 b 75 . 0 c   a n d   0 . 7 3 b . T h e   p r o po s e H F O - K i s   c o m pa r e w i t h   t h e   e xi s t i ng  a pp r o a c h e s   s uc h   a s   J A IS T ,   ICR a n R CN N   [26].   T h e   pe r f o r m a n c e   m e t r i c s   s uc h   a s   p r e c i s i o n ,   r e c a l l ,   f - m e a s ure ,   a c c ur a c y   a n c o m pl e xi t y   a r e   e v a l ua t e fo r   t h e   pr o po s e a ppr o a c h   a n c o m pa r e w i t h   t h e   e xi s t i ng  a pp r o a c h e s .   T h e   i m p r o v e p e r f o r m a n c e   of   t h e   pr o po s e d   a pp r o a c s h o w s   t h e   e f f i c i e n c y   of   t h e   t e c hni que .     4. 1 .      P r e c i s i o n     P r e c i s i o n   c o m put e s   t h e   c o rr e c t   p r e di c t i o n   o f   po s i t i v e   ob s e r v a t i o n s   f r o m   t h e   t o t a l   num b e r   o pr e di c t i o n s   w i t po s i t i v e   o b s e r v a t i o n s .   T h e   pe r f o r m a n c e   c o m pa r i s o o f   t h e   p r o po s e CQ A   i s   s h o w n   i F i gu r e   a n F i gu r e   4 .   I n   F i g u r e   3,   t h e   p r e c i s i o n   v a l ue   i s   c o m pa r e by   v a r y i n t h e   n u m b e r   o f   d o c um e n t s   t 300,   50 0,   7 00  a nd  1000 .   T h e   p r e c i s i o n   v a l ue   i s   r e a c h e n e a 1.   T ha t   i s   n e a r   o pt i m a l   pe r f o r m a n c e   i s   o b t a i n e d   w i t h   o ur   p r o po s e m e t h o d.   W h e n   t h e   n u m b e r s   of   doc um e nt s   a r e   300,   t h e   p r e c i s i o n   v a l ue s   o b t a i n e f o r   t h e   e xi s t i n m e t h o ds   a r e   0. 5 8,   0. 57 ,   0 . 57 ,   a nd  0 . 59 .   F o r   50 do c um e nt s ,   t h e   p r e c i s i o n   v a l ue s   a r e   0 . 55 ,   0 . 56 ,   0 . 55  a n 0 . 58 .   T h e   num b e r   o f   do c um e n t s   a r e   i n c r e a s e t o   700  a n 10 00  t h e n   t h e   e xi s t i ng  p r e c i s i o n   v a l ue s   a r e   0. 54 ,   0. 53 ,   0. 54 ,   0. 5 a n 0. 5 3,   0. 52,   0 . 53 ,   0. 55 .   B ut   i n   c a s e   of   pr o p o s e d   a l go r i t h m   t h e   p r e c i s i o n   v a l ue   i s   i m p r o v e a s   0. 9 9,   0. 9 8,   0. 96  a n 0. 94   f o r   t h e   n u m b e r   o f   do c um e n t s   300 ,   5 00, 7 00  a n 1000 .   T h e   a v e ra ge   pr e c i s i o n   v a l ue s   c o m put e by   R CN N ,   ICR C,   J A IS T ,   A - A RC  a n H F O - K a r e   0. 545 ,   0. 5 45,   0 . 547 5,   0 . 57   a n 0 . 96 75  a s   s h o w n   i F i gu r e   4.   T h e   i m p r o v e pr e c i s i on  v a l ue s   s h o w s   t h e   e ff i c i e n c y   of   t h e   p r o po s e d   a pp r o a c h.           F i gu r e   3 .   P r e c i s i o c o m pa r i s o f o r   v a r y i n t h e   n u m b e r   o f   do c um e n t s       F i gu r e   4 .   A v e r a ge   p r e c i s i o v a l ue s   f o r   v a ri o us   CQ A   a pp r o a c h e s         4. 2 .      R e c a l l     R e c a l l   c o m put e s   t h e   c o rr e c t l y   pr e di c t e po s i t i v e   ob s e r v a t i o ns   f r o m   t h e   t o t a l   n u m b e r   o f   o bs e r v a t i o n s .   T h e   r e c a l l   v a l ue s   o b t a i n e by   R CN N   a r e   0 . 56,   0 . 55,   0 . 54  a n d   0. 53   f o r   t h e   n u m b e r   o f   doc um e n t s   300,   500 , 700   a n 10 00.   F o r   ICR t h e s e   v a l ue s   a r e   0 . 56 ,   0 . 5,   0. 53  a n 0 . 5 2,   J A IS T   p r o duc e s   t h e   p r e c i s i o n   v a l ue s   a s   0. 57,   0. 565 ,   0 . 56   a n d   0 . 555 .   T h e   e xi s t i ng  A - A R ha v e   t h e   p r e c i s i o n   v a l ue s   0. 58,   0 . 57,   0 . 56  a n 0. 55 .   F o r   o ur  pr o po s e CQ A   s y s t e m ,   t h e   r e c a l l   v a l ue s   p r o duc e a r e   0. 93,   0 . 9,   0. 89  a n 0 . 87  a s   s h o w n   i n   F i gu r e   5.     T h e   a v e r a ge   r e c a l l   v a l ue s   c o m put e by   R CN N ,   ICR C,   J A IS T ,   A - A R a n H F O - K a r e   0. 54 5,   0 . 53,   0 . 55 ,   0. 57   a n d   0 . a s   s h o w n   i n   F i gu r e   6 .   W h e n   t h e   n u m b e r s   o a n s w e r s   a r e   i n c r e a s e d ,   t h e t h e   r e c a l l   v a l ue   i s   r e duc e d.   F o l e s s   n u m b e r   o f   a n s w e r s ,   t h e   r e c a l l   v a l ue   o b t a i n e i s   h i g h.   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   17 ,   N o .   1 J a n u a r y   20 20  :     264 - 272   270       F i gu r e   5 .   R e c a l l   c o m pa ri s o f o r   v a r y i n g   t h e   n u m b e r   of   do c um e n t s       F i gu r e   6 .   A v e r a ge   r e c a l l   v a l ue s   f o r   v a r i o us   CQ A   a pp r o a c h e s         4. 3 .      F - m e as u r e     T h e   w e i ght e a v e r a ge   b e t w e e n   pr e c i s i o n   a nd  r e c a l l   i s   t e rm e a s   f - m e a s ur e .   F o r   30 do c um e n t s ,     t h e   R CN N ,   ICR C,   J A IS T ,   A - A R a nd  H F O - K h a v e   t h e   f - m e a s u r e   v a l ue s   0. 55, 0 . 56 ,   0 . 57 ,   0. 58  a n 0 . 957 .   F o r   500  do c um e n t s ,   t h e   R CN N ,   ICR C,   J A IS T ,   A - A R a n H F O - K C   h a v e   t h e   f - m e a s ur e   v a l ue s   0. 55,   0. 555,   0. 56 ,   0. 5 a n 0 . 941 .   F o r   700  do c um e nt s ,   t h e   R CN N ,   ICR C,   J A IS T ,   A - A R a nd  H F O - K h a v e   t h e     f - m e a s ur e   v a l ue s   0. 545 ,   0 . 5 ,   0. 55,   0. 5 a n 0. 9 57.   F o r   1000  do c um e n t s ,   t h e   R CN N ,   ICR C,   J A IS T ,   A - A R a n H F O - K ha v e   t h e   f - m e a s u r e   v a l ue s   0. 54 ,   0 . 45 ,   0. 54,   0 . 55  a n 0 . a s   s h o w n   i F i gu r e   7 .   T h e   a v e r a ge     f - m e a s ur e   v a l ue s   o b t a i n e by   R CN N ,   ICR C,   J A IS T ,   A - A R a n H F O - K a r e   0. 54 8,   0. 516,   0 . 555 ,   0 . 565   a n 0 . 928   a s   s h o w n   i F i g u r e   8.   T h e   f - m e a s u r e   v a l ue s   o b t a i n e by   t h e   p r o po s e m e t h o i s   hi g w h e c o m pa r e w i t t h e   o t h e e xi s t i ng  a pp r o a c h e s .           F i gu r e   7 .   F - m e a s u r e   c o m pa r i s o n   f o r   v a r y i n t h e   n u m b e r   o f   do c um e n t s       F i gu r e   8 .   A v e r a ge   F - m e a s u r e   f o r   v a ri o us   CQ A   a pp r o a c h e s         4. 4 .      A c c u r ac y     A c c ur a c y   c o m put e s   t h e   c o rr e c t   ob s e r v a t i o n s   f r o m   t h e   t o t a l   num b e r   of   ob s e r v a t i o n s .   T h e   a c c ura c y   of  t h e   p r o po s e a ppr o a c i s   e v a l u a t e a n c o m pa r e w i t t h e   e xi s t i n g   a p p r o a c h e s .   W h e n   c o m pa r e w i t t h e   e xi s t i n a pp r o a c h e s ,   t h e   a c c u r a c y   of   t h e   pr o po s e t e c h ni q ue   i s   hi g h.   T h e   a c c ura c y   v a l ue   ob t a i n e fo r   R CN N ,   ICR C,   J A IS T ,   A - A R a n H F O - K i s   0. 72,   0. 68,   0 . 72 ,   0. 76,   a n 0. 9 91  f o r   300  do c um e n t s .   W h e n   t h e   do c um e n t s   a r e   500 ,   t h e   a c c ura c y   v a l ue   o b t a i n e f o r   R CN N ,   ICR C,   J A IS T ,   A - A R a n H F O - K i s   0. 7 1,   0. 67 ,   0. 715 ,   0. 7 a n 0. 9 82.   F o r   700  do c um e n t s ,   R CN N ,   ICR C,   J A IS T ,   A - A R a n H F O - K C   pr o duc e s   0. 705 ,   0 . 66 5,   0. 71,   0. 74  a n d   0. 9 72.   By   i n c r e a s i n g   t h e   num b e o f   doc um e n t s   t o   1000,   t h e   a c c ura c y   i s   0. 7,   0. 6 5,   0. 7 ,   0. 73  a nd  0. 962 .   T h e   i m p r o v e pe r fo r m a n c e   i s   o b t a i n e w i t h   o ur   p r o po s e a ppr o a c h   a s   s h o w n   i n     F i gu r e   9 .   T h e   A v e r a ge   a c c ura c y   fo r   v a r i o us   CQ A   a pp r o a c h e s   a s   s h o w n   i F i gu r e   10 .   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       H i e r ar c h y   bas e d   f i r e f l y   op t i m i z e k - m e ans   c l us t e r i n f or   c o m pl e x   qu e s t i on…   ( A .   Chandr a   O bul R e d dy )   271       F i gu r e   9 .   A c c ura c y   c o m pa ri s o n   f o r   v a r y i n g   t h e   n u m b e r   o f   do c um e n t s       F i gu r e   10 .   A v e ra ge   a c c u r a c y   fo r   v a ri o us   CQ A   a pp r o a c h e s         T h e   c o m pl e xi t y   of   t h e   pr o po s e H F O - K c o m pl e que s t i o n   a n s w e r i n s y s t e m   ha s   t h e   c o m pl e xi t y   of ) ( ) ( 2 t m O n d k O .   W h e r e ,   d r e p r e s e n t s   t h e   di m e n s i o n   o f   e a c h   a n s w e r ,   n r e p r e s e n t s   t h e   c a rdi na l i t y   of  t h e   do c um e n t ,   m   r e pr e s e nt s   t h e   po pul a t i o n   s i z e   a nd  t i s   t h e   n u m b e r   o f   i t e r a t i o n s   a n k r e p r e s e n t s   t h e   n u m b e r   o f   gr o ups   us e o n   K N N   a l go ri t hm .   T h e   c o m put a t i o n   t i m e   f o r   t h e   p r o po s e w o r i s   1 5m s . T h e   pr o po s e H F O - K a pp r o a c f o r   c o m pl e que s t i o a n s w e r i ng  c a n   b e   e v a l ua t e w i t h   t h e   pe r f o r m a n c e   m e t ri c s   l i ke   p r e c i s i o n,   r e c a l l ,   a c c u r a c y ,   f - m e a s ur e   a nd  c o m pl e xi t y .   W h e n   c o m pa r e w i t t h e   e xi s t i n g   a p p r o a c h e s ,   t h e   pe r f o r m a n c e   o f   t h e   p r o po s e a pp r o a c i s   hi g h.   T h e   p r o po s e a pp r o a c p r o v i de s   t h e   t r a de - o f f   b e t w e e n   c o m pl e xi t y   a n d   a c c ura c y .       5.   C O N C LU S I O N     In  t hi s   p a pe r,   i n i t i a l l y   t h e   i n pu t   q ue r y   i s   p r e pr o c e s s e d.   It   i n c l ude s   s t o w o r r e m o v a l   a n w o r l e m m a t i z a t i o n .   T h e n   i ndi v i du a l   ke y w o r ds   a r e   e xt r a c t e f ro m   t h e   que r y   a n t h e   e xt r a c t e ke y w o r ds   a r e   s e gm e n t e d.   T h e   p r o c e s s   of   s e gm e n t a t i o n   i s   a c c o m pl i s h e w i t h   t h e   c o l l e c t i o n   o f   ke y w o r ds .   T h e   c a n di d a t e   s o l ut i o n s   a r e   m a ppe f r o m   t h e   o b t a i n e ke y w o r ds .   T h e   c o r r e c t   a n s w e r   i s   r e t r i e v e f r o m   t h e   d a t a b a s e   us i n g   t h e   s e gm e n t e que r y .   It   c a n   b e   ob t a i n e w i t h   O k a pi - 2 s i m i l a r i t y   c o m put a t i o n.   B a s e o n   t h e   s i m i l a r i t y   s c o r e ,   t h e   l a r ge   num b e r   o f   a n s w e r s   a r e   s e l e c t e fo r   t h e   gi v e n   que s t i o n .   T h e n   t h e   s e l e c t e a n s w e r s   a r e   c l us t e r e w i t h   K   m e a n s   c l us t e r i n i n   w hi c h   i t   e l i m i n a t e s   t h e   i n c o rr e c t   a n s w e r   s e l e c t i o n .   T h e   hi e ra r c h y   i s   fo r m e w i t h   t h e   a l go ri t hm   w h i c h   s i m pl i f i e s   t h e   p r o c e s s   of   a n s w e r   s e l e c t i on.   F r o m   t h e   hi e ra r c h y ,   t h e   o pt i m i z e r e s ul t   i s   ob t a i n e w i t f i r e f l y   o pt i m i z a t i o n .       R EF ER EN C ES   [ 1]       B o r de s   A ,   W e s t o J ,   U s uni e r   N O p e q ue s t i o a ns w e r i ng   w i t h   w e a kl y   s upe r v i s e e m be dd i ng   m o de l s .   I n   J o i n t   E ur ope an   C on f e r e nc e   on   M ac h i ne   L e ar ni n and   K now l e dge   D i s c ov e r y   i D a t ab as e s .   2 014;   872 4:   165 - 180.   [ 2]     L o pe z   V ,   U ng e r   C ,   C i m i a no   P ,   M o t t a   E .   E v a l ua t i ng   que s t i o a ns w e r i ng   o v e r   l i nke d a t a .   J ou r na l   of   W e Se m ant i c s .   2 013;   21:   3 - 13.   [ 3]     U t o m o   F S ,   S ur y a na   N ,   A z m i   M S .   N e w   i n s t a nc e s   c l a s s i f i c a t i o f r a m e w o r o Q ur a o nt o l o gy   a ppl i e t o   que s t i o a ns w e r i ng   s y s t e m .   T e l e c om m uni c at i o C om pu t i ng  E l e c t r o ni c s   an C ont r o l   ( T E L K O M N I K A ) .   201 9;   17  ( 1 ) :   139 - 146.   [ 4]     Z ha ng   K ,   W e i   W ,   H a o c he ng   W ,   Z ho uj un  L ,   Z ho M .   Q ue s t i o r e t r i e v a l   w i t hi g qua l i t y   a ns w e r s   i c o m m uni t y   que s t i o a n s w e r i ng .   I n   P r oc e e di ngs   o f   t he   23r A C M   I nt e r na t i ona l   C onf e r e nc e   on  C onf e r e nc e   on  I nf o r m a t i o and   K now l e dge   M ana ge m e nt .   2014;   371 - 38 0.   [ 5]     A de ki t a A I ,   A de w a l e   A ,   O l a i t a A .   D e t e r m i ni ng   t he   o pe r a t i o na l   s t a t u s   o f   a   t hr e e   ph a s e   i nduc t i o m o t o r   us i ng   a   pr e d i c t i v e   d a t a   m i n i ng   m o de l .   I n t e r na t i ona l   J o ur na l   o f   P ow e r   E l e c t r oni c s   a nd  D r i v e   Sy s t e m   ( I J P E D S) .   2019:   10   ( 1) :   93 - 103 .   [ 6]     U ng e r   C ,   F r e i t a s   A ,   C i m i a no   P A i nt r o duc t i o t o   que s t i o a n s w e r i ng   ov e r   l i nk e da t a .   R e a s o ni ng   W e b ,   2014;   8714: 100 - 140.   [ 7]     L ukov ni ko v   D ,   F i s c he r   A N e ur a l   ne t w o r k - ba s e q ue s t i o a n s w e r i n g   ov e r   kno w l e dg e   g r a phs   o w o r a nd  c ha r a c t e r   l e v e l .   I n   P r oc e e di ngs   o f   t he   26t i n t e r na t i o nal   c on f e r e nc e   on  W or l d   W i de   W e b .   20 17;   1 211 - 122 0.   [ 8]     J o hn  B M ,   K u r i a J C ,   C h ua   A Y ,   G o D H L ,   L i e N H .   S o c i a l   que s t i o a ns w e r i ng :   A na l y z i ng   kn o w l e dg e ,   c og ni t i v e   pr o c e s s e s   a nd  s o c i a l   di m e ns i o ns   o f   m i c r o - c o l l a bo r a t i o ns .   C om pu t e r s   &   E duc at i on .   201 3;   69:   109 - 12 0.     [ 9]     M a n s   R S ,   A a l s t   W M P ,   V a nw e r s c R J B ,   M o l e m a A J .   P r o c e s s   m i ni ng   i h e a l t hc a r e :   D a t a   c ha l l e ng e s   w he n   a ns w e r i ng   f r e qu e n t l y   po s e q ue s t i o ns .   Sp r i nge r - V e r l ag   B e r l i n   H e i d e l be r 2 013;   140 - 153 .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   17 ,   N o .   1 J a n u a r y   20 20  :     264 - 272   272   [ 10]     N i e m e l ä   J .   E c o l o gy   of   ur ba n   g r e e n   s p a c e s :   T he   w a y   f o r w a r i a ns w e r i ng   m a j o r   r e s e a r c qu e s t i o ns .   L and s c ape   and   U r ban   P l ann i ng .   201 4;   125:   298 - 30 3.     [ 11]       F i g ue r o a   A ,   N e um a nn  G .   C o nt e xt - a w a r e   s e m a n t i c   c l a s s i f i c a t i o o f   s e a r c que r i e s   f o r   br o w s i ng   c om m uni t y   que s t i o n a ns w e r i ng   a r c hi v e s .   K n ow l e dge - B as e Sy s t e m s .   2016;   96:   1 - 13 .     [ 12]     L i K ,   Z ha o   J ,   S h i z hu  H ,   Z ha ng   Y Q ue s t i o a n s w e r i ng   o v e r   know l e dg e   ba s e s .   I E E E   I n t e l l i ge nt   S y s t e m s .   20 15;   5:   26 - 35.   [ 13]     S ha r e f   N M ,   N o a S A M ,   M ur a M A A I s s ue s   a nd  C h a l l e ng e s   i n   S e m a n t i c   Q ue s t i o A ns w e r i ng   t hr o ug N a t u r a l   L a ng ua g e   I nt e r f a c e .   J o ur n al   o f   N e x t   G e ne r at i on   I nf or m a t i on   T e c hn ol og y .   20 13;   4 ( 7 ) :   50 - 60.   [ 14]     L i D R ,   C he n   Y H ,   H u a ng   C K .   Q A   do c um e nt   r e c o m m e nda t i o ns   f o r   c om m uni t i e s   o f   que s t i o n a ns w e r i ng   w e b s i t e s .   K n ow l e dge - B as e S y s t e m s .   2014;   57:   146 - 160 .   [ 15]     H a z r i na   S S ha r e f   N M ,   H .   I br a hi m ,   M ur a M A A ,   N o a S A M .   R e v i e w   o t he   a dv a nc e m e nt s   o f   di s a m b i g ua t i o i n   s e m a n t i c   que s t i o a ns w e r i ng   s y s t e m .   I n f o r m at i on   P r oc e s s i ng   a nd  M an age m e nt 201 7;   53:   52 - 69 .   [ 16]     I s l a m   M S ,   L i C ,   L i   J E f f i c i e n t   a n s w e r i ng   o f   w h y - no t   que s t i o ns   i n   s i m i l a r   g r a p m a t c h i ng .   I E E E   T r ans a c t i on s   on   K now l e dge   and  D a t a   E n gi ne e r i n g .   20 15;   2 7:   2672 - 2686 .     [ 17]     G ha r e hc ho pog F S ,   L o t f i   Y M a c hi n e   l e a r n i ng   ba s e q ue s t i o c l a s s i f i c a t i o m e t ho ds   i n   t h e   q ue s t i o a ns w e r i ng   s y s t e m s .   I n t e r na t i ona l   J ou r na l   of   I n nov at i on   an A ppl i e St u di e s .   2 013;   4   ( 2) :   264 - 273 .   [ 18]     F i g ue r o a   A .   A ut o m a t i c a l l y   g e ne r a t i ng   e f f e c t i v e   s e a r c que r i e s   di r e c t l y   f r o m   c o m m uni t y   que s t i o n - a ns w e r i ng   que s t i o ns   f o r   f i nd i ng   r e l a t e d   qu e s t i o ns .   E x pe r t   S y s t e m s   W i t h   A pp l i c at i ons .   201 7;   77:   11 - 19 .   [ 19]     S a r r o ut i   M ,   O ua t i S E A .   A   pa s s a g e   r e t r i e v a l   m e t ho ba s e o n   p r o ba bi l i s t i c   i nf o r m a t i o r e t r i e v a l   m o de l   a nd  U M L S   c o n c e pt s   i n   b i o m e di c a l   qu e s t i o n   a n s w e r i ng .   J o ur na l   o f   B i om e di c al   I nf or m at i c s 20 17;   6 8:   96 - 103.   [ 20]     M a h bo ub  A ,   A r i o ua   M ,   E n - N a i m i   E M .   E ne r g y - e f f i c i e nt   hy br i k - m e a ns   a l g o r i t hm   f o r   c l us t e r e w i r e l e s s   s e ns o r   ne t w o r k s .   I nt e r na t i ona l   J ou r na l   of   E l e c t r i c al   an C om put e r   E ng i ne e r i ng  ( I J E C E ) .   20 17;   7   ( 4) :   2054 - 20 60 .   [ 21]     G i r s a ng   A S ,   C e ngg o r o   T W ,   H ua ng  K W .   F a s t   A nt   C o l o n y   O pt i m i z a t i o f o r   C l us t e r i ng I nd one s i a J ou r na l   of   E l e c t r i c al   E ng i ne e r i ng   a nd  C om pu t e r   S c i e nc e   ( I J E E C S) .   20 18;   1 2( 1) :   78 - 86.   [ 22]     A z i m   M A ,   B hui y a M H .   T e xt   t o   e m o t i o e xt r a c t i o us i n g   s upe r v i s e m a c hi ne   l e a r n i ng   t e c hni que s .   T e l e c om m uni c at i on   C om p ut i ng   E l e c t r oni c s   an C o nt r ol   ( T E L K O M N I K A ) .   2018;   16   ( 3 ) :   1394 - 140 1.   [ 23]     A m o l i   P V ,   S O S .   S c i e n t i f i c   D o c um e nt s   c l us t e r i ng   b a s e o T e xt   S um m a r i z a t i o n.   I n t e r na t i ona l   J our n al   of   E l e c t r i c al   an C om put e r   E ng i ne e r i ng   ( I J E C E ) .   2015;   5   ( 4 ) ,   7 82 - 78 7.   [ 24]     M us t a ki m ,   N K   S a r i ,   J a s r i l ,   K us um a n t o   I ,   R e z a   N G I .   E i g e nv a l ue   o f   A na l y t i c   H i e r a r c hy   pr oc e s s   a s   t he   D e t e r m i n a n t   f o r   C l a s s   T a r g e t   o C l a s s i f i c a t i o A l go r i t hm .   I n done s i an  J our nal   o f   E l e c t r i c a l   E ng i ne e r i ng  and  C om p ut e r   S c i e nc e   ( I J E E C S) .   201 8;   12   ( 3) :   1257 - 12 64 .   [ 25]     Y a ng   Z ,   J o ne s   I ,   H u   X ,   L i H .   F i nd i ng   t h e   r i g ht   s o c i a l   m e d i a   s i t e   f o r   q ue s t i o ns .   I n   P r oc e e di ngs   o f   t he   201 I E E E / A C M   I nt e r na t i ona l   C on f e r e nc e .   2 015;   639 - 644 .   [ 26]     X i a ng   Y ,   C he Q ,   W a ng   X ,   Q i Y .   A ns w e r   S e l e c t i o i C o m m uni t y   Q ue s t i o A ns w e r i ng   v i a   A t t e n t i v e   N e u r a l   N e t w o r ks ,   I E E E ,   201 7;   24   ( 4) :   505 - 509 .       Evaluation Warning : The document was created with Spire.PDF for Python.