I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   18 ,   N o .   2 M a y   20 20 ,   pp .   970 ~ 978   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 1 8 .i 2 . pp 970 - 978             970       Jou r n al   h o m e pa ge ht t p: / / i j e e c s . i a e s c or e . c om   E x t r a c t i o n   o f   c a u se - e f f e c t - c o n c e p t   p a i r   se r i e f r o m   w e b   d o c u m e n t s       C h av e e v an   P e c h s i r i 1 ,   T i ti r u M e k b u n d i tk u l 2   1 Co l l e ge   of   Inn o v a t i v e   of   T e c hn o l o g y   a n d   E ngi n e e ri n g ,   D hu ra ki j   P u n d i t   U n i v e r s i t y ,   T h a i l a n d   2 R e s e a r c h   S e r v i c e   C e n t e r ,   D h ur a ki j   P und i t   U n i v e r s i t y ,   T ha i l a nd       A r ti c l e   I n fo     A B S TR A C T     Ar t i c l e   h i s t or y :   R e c e i v e S e p   9 ,   20 19   R e v i s e N o v   1 0 ,   2019   A c c e pt e N o v   24 ,   201 9       T hi s   r e s e a r c a i m s   t o   e xt r a c t   a   c a us e - e f f e c t - c o n c e pt   pa i r   s e r i e s   o f   c o ns e que n t   e v e nt   o c c ur r e nc e s   i he a l t i nf o r m a t i o o f   ho s pi t a l   w e b - bo a r ds .     T he   e xt r a c t e c a us e - e f f e c t - c o n c e pt   pa i r   s e r i e s   r e pr e s e n t i ng   a   di s e a s e   c a us a t i o pa t hw a y   be ne f i t s   f o r   t he   a ut o m a t i c   di a g no s i s   a nd  s o l v i n g   s y s t e m .   W he r e   e a c c a us a t i v e / e f f e c t   e v e nt   c o nc e pt   i s   e xp r e s s e d   by   a e l e m e n t a r y   di s c o ur s e   un i t   ( E D U   w hi c i s   a   s i m p l e   s e n t e nc e ) .   T he   r e s e a r c h   ha s   t h r e e   pr o bl e m s ;   ho w   t o   de t e r m i n e   c a us a t i v e / e f f e c t   c o n c e pt   E D U s   f r o m   t he   do c um e nt s   c o n t a i n i ng   s o m e   E D U   o c c ur r e nc e s   w i t bo t c a u s a t i v e   c o nc e pt s   a nd  e f f e c t   c o nc e pt s ,   ho w   t o   de t e r m i n e   t he   c a us e - e f f e c t   r e l a t i o be t w e e t w a dj a c e nt   E D U s   h a v i ng   t h e   d i s c o ur s e   c ue   a m bi g ui t y ,   a nd  ho w   t o   e xt r a c t   c a us e - e f f e c t - c o nc e pt   pa i r   s e r i e s   m i ng l e w i t e i t he r   a   s t i m u l a t i o r e l a t i o E D U   o r   o t he r   no n - c a us e - e f f e c t   r e l a t i o E D U s   f r o m   t he   do c um e nt s .   T he r e f o r e ,   w e   a pp l y   a nno t a t e N W o r dC o   pa i r s   w i t c a us a t i v e - e f f e c t   c o n c e pt s   t o   r e p r e s e n t   E D U   p a i r s   w i t c a us a t i v e - e f f e c t   c o n c e pt   w he r e   t h e   N W o r dC o   s i z e   s o l v e by   N a ï v e   B a y e s .   W e   a l s o   a p pl y   N a ï v e   B a y e s   t o   s o l v e   N W o r dC o - c o nc e pt   pa i r s   ha v i ng   t h e   c a us e - e f f e c t   r e l a t i o f r o m   t he   a dj a c e nt   E D U   pa i r s .   W e   t he pr o po s e   us i ng   c ue   w o r ds   a nd  t he   c o l l e c t e N W o r dC o - c o n c e pt   pa i r s   w i t t he   c a u s e - e f f e c t   r e l a t i o t o   e x t r a c t   t h e   c a us e - e f f e c t - c o n c e pt   pa i r   s e r i e s .   T h e   r e s e a r c r e s ul t s   pr o v i de   t h e   h i g pr e c i s i o of   t he   c a us e - e f f e c t - c o nc e pt   pa i r   s e r i e s   d e t e r m i na t i o f r o m   t he   do c um e nt s .     Ke y w or ds :   Ca us e - e ff e c t - c o n c e pt   pa i s e r i e s   E l e m e n t a r y   di s c o ur s e   uni t   N W o r dCo   O r de r e p a i r   C opy r i gh t   ©   2020   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   Cha v e e v a P e c h s i r i ,   Co l l e ge   of   Inn o v a t i v e   o f   T e c h n o l o g y   a nd  E n g i n e e r i ng,   D h u ra ki j   P u ndi t   U ni v e r s i t y ,   T ha i l a n d .   E m a i l :   c ha v e e v a n . pe c @ dp u. a c . t h       1.   I N TR O D U C TI O N     T h e   o bj e c t i v e   of   t hi s   pa pe i s   t o   e xt ra c t   a   Ca us e - E f fe c t - c o n c e pt   p a i r   (c a l l e CE p a i r’)  s e ri e s   w h i c h   i s   a   s e ri e s   o f   c a us e - e ffe c t - e ve n t   c o n c e pt   pa i r s   o f   a   di s e a s e   c a us a t i o pa t h w a y ,   f r o m   h o s pi t a l   w e b - bo a r d   do c um e n t s   (i . e .   h t t p: / / ha a m o r. c o m ;   ht t p : / / w w w . s i . m a hi do l . a c . t h   / s i do c t o r / e - pl / ) .   W hi l s t   ‘s e ri e s ’  m e a n s   ‘a   gr o up  o r   a   num b e r   o f   r e l a t e o r   s i m i l a r   t hi n gs ,   e v e n t s ,   e t c . ,   a rra nge o r   o c c ur r i ng  i n   t e m po ra l ,   s pa t i a l ,     o r   o t h e r   o rde r   o r   s uc c e s s i o n ;   s e que n c e . ’  (ht t p : / / w w w . di c t i o na r y . c o m / ).   T h e   CE p a i r   s e r i e s   of   t h e   r e s e a r c h   i s   a   gr o up  o f   c a us e - e f fe c t - e ve n t   o r de r e pa i r s   o c c ur ri n i n   t h e   C E pa i r   s e que n c e   a s   i n   a   do c um e n t .   R e ga rd  t o   t h e   di s e a s e   c a us a t i o n   p a t h w a y   fo r   c hr o n i c   d i s e a s e   pa rt i c ul a r y   di a b e t i c ,   c a r di o v a s c ul a r ,   ki d n e y   di e a s e s   [1 - 3] ,   e a c h   CE pa i r   i s   a n   o r de r e p a i r   ( c e w i t h   t h e   c a us e - e ff e c t   r e l a t i o w h e r e   c   i s   a   c a us a t i v e - e v e n t   c o n c e pt   a n e   i s   a e ffe c t - e v e n t   c o n c e pt .   W h e r e   e a c c a us e / e ff e c t   e ve n t   c o n c e pt   o n   e a c h   C E pa i r   e l e m e n t ,   C E p a i r i ,   i s   e xp r e s s e d   by   a n   e l e m e n t a r y   di s c o ur s e   uni t   (E D U   w h i c i s   a   s i m p l e   s e nt e n c e ,   [4] )   a s   f o l l ow s :       C E pa i r 1 ,C E p a i r 2 ,.., C E p a i r l a s t        w h e r e   CE p a i r i   ( i = 1, 2, . . , l as t   w h i c h   i s   a n   i nt e ge r i s   a n   e x pr e s s i o n   o f   t h e   c a us e - e ffe c t   r e l a t i o n   b e t w e e n   a   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       E x t r a c t i on   of   c aus e - e f f e c t - c onc e p t   p ai r   s e r i e s   f r om   w e doc u m e nt s   ( Cha v e e v an   P e c hs i r i )   971   c a us a t i v e - e ve n t   c o n c e pt   E D U   a n a n   e f fe c t - e v e n t   c o n c e pt   E D U ,   f r o m   t w o   a dj a c e n t   E D U s   a s   a E D U   p a i a s   s h o w n   i E xa m pl e   1.         E xa m pl e   1:       …  ED U 1 :   วย เป เบ วา   ( A   p a t i e n t   g e t s   a   d i a b e t e s   d i s e a s e .)   วย / p a t i e n t      เป / is     เบ วา / d i a b e t e s   d i s e a s e .   ED U 2 :“ เน ื่ าก   ่า าย   ่ส าม าร      ้ าต าล     ( s i n c e   t h e   b o d y   c a n n o t   f u l l y   u s e   s u g a r   i n   t h e   b o d y .)   เน ื่ าก / s i n c e     ่าง / body    ่สาม าร   / c a n n o t   t a k e      ้ าล / s u g a r    ใน / i n s i d e     ่าง b o d y     / t o   u s e     ่าง ็ม ี่ / f u l l y   ED U 3 :“ เพ าะ   [ ่าง าย ]   าด ์โ ”  ( B e c a u s e   [ t h e   b o d y l a c k s   o f   h o r m o n e   i n s u l i n . )   เพ าะ / b e c a u s e   [ ่าง าย / body ]   / l a c k   o f    / h o r m o n e   i n s u l i n   ED U 4 :“ าง ่า าย ่ข าด   ( T h e   b o d y   s o m e t i m e s   d o e s   n o t   l a c k   o f   t h e   h o r m o n e . )   าง / s o m e t i m e s   ่าง าย / body   / n o t   าด / l a c k _ o f   / h o r m o n e     ED U 5 :“   [ ่าง าย ]   ่ต สน   ( B u t   [ t h e   b o d y d o e s   n o t   r e s p o n d   t o   t h e   h o r m o n e . )   / but [ ่าง าย // body / n o t   สน / r e s p o n d _ t o   / h o r m o n e     ED U 6 : [ ่ต สน / E D U 5 ]   าใ  ้ เล ว่าป                           ( [ N o   r e s p o n d i n g   t o   h o r m o n e / E D U 5 ]   c a u s e s   B l o o d - s u g a r   l e v e l   t o   b e   h i g h e r   t h a n   n o r m a l . )   “[ ่ต สน // n o   r e s p o n d i n g   t o   t h e   h p r m o n e / E D U 5 ]     าใ / c a u s e      ้ าล / s u g a r - l e v e l   ใน / in    / b l o o d   ว่า / h i g h e r   t h a n     / n o r m a l       ED U 7 : [  ้ เล ]                             ( [ T h e   h i g h   b l o o d - s u g a r / E D U 6 ]   i s   a   c a t a l y s t   f o r   a r t e r y   d e t e r i o r a t i o n   o c c u r r e n c e   t h r o u g h   t h e   b o d y . )   “[  ้ าล เล / h i g h   b l o o d - s u g a r   l e v e l / E D U 6 ]   เป / i s   วเร ่ง / c a t a l y s t   เก / to _ o c c u r   / d e t e r i o r a t i o n   / o f   / a r t e r y   ั่ว / t h r o u g h   ่าง าย / body     ED U 8 : [ ]     าใ เล   ( [ T h e   a r t e r y   d e t e r i o r a t i o n   o c c u r r e n c e / E D U 7 ]   c a u s e s   t h e   a r t e r i e s   t o   c o n s t r i c t . )   “[ / a r t e r i e s   d e t e r i o r a t i o n / E D U 7 ]     าใ / c a u s e     / a r t e r y      / c o n s t r i c t   ED U 9 “[ / E D U 8 ]   าใ เก ัวใ าด เล   ( [ T h e   c o n s t r i c t e d   a r t e r i e s   / E D U 8 ]   c a u s e s   o f   t h e   i s c h e m i c   h e a r t   d i s e a s e . )   “[ / c o n s t r i c t e d   a r t e r i e s / E D U 8 ]     าใ เก / c a u s e   o f   ัวใ / h e a r t   d i s e a s e        าด / l a c k   o f   เล / b l o o d     ED U 1 0   เบ าห วา         ัวใ     เป ”…   ( T h u s ,   t h e   d i a b e t e s   d i s e a s e   w i l l   b e   a   s i g n i f i c a n t   r i s k   f a c t o r   t o   a   b r a i n   d i s e a s e ,   a   h e a r t   d i s e a s e ,   a n d   a   k i d n e y   d i s e a s e . )…   w h e r e   t h e   [. . ]   s y m bo l   m e a n s   e l l i ps i s .   E xa m pl e   i s   t h e n   r e p r e s e n t e by   t h e   CE p a i r   s e r i e s   c o n t a i ni n E D U a s   a n   i nt e r v e n i n E D U   of   t h e   s t i m u l a t i o n   r e l a t i o n   a s   s h o w n   i n   t h e   f o l l ow i n g .   E D U 1 - E D U 2   P a i r   a s   C E p a i r 1 :     E D U 2   ( C a u s e )     E D U 1   ( E f f e c t )     E D U 2 - E D U 3   P a i r   a s   C E p a i r 2 :     E D U 3   ( C a u s e )     E D U 2   ( E f f e c t )   E D U 5 - E D U 6   P a i r   a s   C E p a i r 3 :     E D U 5   ( C a u s e )     E D U 6   ( E f f e c t )   E D U 7   a s   a n   i n t e r v e n i n g   E D U   h a v i n g   t h e   s t i m u l a t i o n   r e l a t i o n :                                                               < h i g h B l o o d S u g a r >   b e S t i m u l a t i o n R e l a t i o n . . . < a r t e r y   D e t e r i o r a t i o n >     E D U 7 - E D U 8   P a i r   a s   C E p a i r 4 :     E D U 7   ( C a u s e )     E D U 8   ( E f f e c t )   E D U 8 - E D U 9   P a i r   a s   C E p a i r 5 :     E D U 8   ( C a u s e )     E D U 9   ( E f f e c t )   w h e r e   E D U i s   a   n o n - c a us e / n o n - e ff e c t   c o n c e pt   E D U   a n t h e   s t i m ul a t i o n   r e l a t i o n   o n   E D U c o - oc c ur s   w i t t h e   c a us e - e ffe c t   r e l a t i o n   o C E pa i r 4   a s   t h e   p a r t   o f   t h e   C E pa i r   s e r i e s   w h i c h   c o n s i s t s   o f   t w o   s ub - s e r i e s ,   C E pa i r 1 - CE pa i r 2   a n CE p a i r 3 - C E p a i r 5 .   T h us ,   t h e   di s e a s e   c a us a t i o n   pa t h w a y   r e pr e s e n t e by   t h e   e xt r a c t e CE pa i r   s e ri e s   be n e f i t s   f o r   i m p r o v e m e n t   o f   t h e   pub l i c ’s   u n de r s t a ndi n o f   a   c o m pl e prob l e m   of   a   c e r t a i c hr o n i c   di s e a s e   t o   f o l l ow   up   ph y s i c i a n ’s   s ugge s t i o n   o f   s o l v i n s t e ps .   T h e r e f o r e ,   t h e   r e s e a rc h   c o n c e rn s   t o   e xt r a c t   t h e   C E pa i r   s e r i e s   w i t h   t h e   e ve n t   c o n c e pt s   f r o m   t e xt s   f o r   p r o v i di n t h e   k n o w l e dge   t o   pe o pl e   a n d   e nha n c i n g   t h e   s o l v i n s y s t e m .     In   a dd i t i o n ,   t hi s   r e s e a r c h   e m p ha s i z e s   o n   t h e   E D U ’s   v e r b   phra s e   e xpr e s s i o n s   b e c a us e   t h e   C E pa i r   s e r i e s   i s   b a s e o n   s e ve r a l   e v e n t s   t ha t   e a c e v e n t   c o n c e pt   i s   m o s t l y   e xpr e s s e by   a n   E D U ’s   v e r b   phra s e .   T h e   E D U   e xpr e s s i o n   ha s   t h e   f o l l ow i n g   T ha i   l i n gu i s t i c   pa t t e rn s   a f t e r   s t e m m i n g   w o r ds   a n d   t h e   s t o w o r r e m o v a l .   E D U     N P V P   |   V P                                                                                                                         N P 1     pr o no u |   N o un  |   N o un   A dj   |   N o un  A dj P h r a s e   V P       V e r b   N P 2   |   V e r b   a dv   |   V e r b                                                                               N P 2   N o un  |   N o un   A dj   |   N o un   A dj P hr a s e   V e r b     V e r b we a k   N o un  |   V e r b s tr o n g   V e r b we a k { เป / be ’, ่เป / n o t _ b e ’, มี / h a v e ’, ่ม / n o t _ h a v e ’, / u s e } ;           V e r b s tr o n g {   าใ / c a u s e ’, เก / o c c u r ’, / b l o c k - up ’, / c o n s t r i c t ’,   / d e t e r i o r a t e ’, ่ต สน / n o t _ r e s p o n d ’, / e x c r e t e ’, เป ี่ / c h a n g e ’, วม / s w e l l ’, าเจ / v o m i t ’, / c o n v u l s e ’, สต / b e _   u n c o n s c i o u s ’, เพ ิ่ ึ้ / i n c r e a s e ’, / h i g h ’, าย / d i e , / s t i m u l u s ’,   เร ่ง c a t a l y z e ’,   . . } ;         A dv { าก d i f f i c u l t l y ’,   เหล l i q u i d l y ’,   };   N o un { ‘    ’  , วย / p a t i e n t ’, าก าร / s y m p t o m ’, / c o n t r a c t i o n ’, วัย วะ / h u m a n   o r g a n ’, / s c a r ’,   เล / b l o o d ’,    ้ าต / s u g a r ’,   ัน / f a t ’, / p r o t e i n ’  ,   สส าวะ / u r i n e ’, วาม ัน / p r e s s u r e ’,   วเร ่ง / c a t a l y s t ’, };   A dj     { / h i g h ’,   }   W h e r e   N P a n N P 2, a r e   n o un   p hra s e s .   V P   i s   a   v e r b   ph ra s e .   N o un   i s   a   n o u n   c o n c e pt   s e t .   V e r b s t ro n g   i s   a   s t r o n g   v e r b   c o n c e pt   s e t   c o n s i s t i n g   o f   t h e   c a us a t i v e / e ff e c t   ve r b   c o n c e pt   s e t   a n d   t h e   s t i m u l a t i n g   v e r b   c o n c e pt   s e t , { เร ่ง / c a t a l y z e , /   s t i m u l u s ’,   . . } .   V e r b w eak   i s   a   w e a v e r b   c o n c e pt   s e t   r e qui ri n m o r e   i n f o rm a t i o n   a s   V e r b w eak + N o un   t o   b e c o m e   e i t h e t h e   c a us e - e v e n t /   e ff e c t - e ve n t   c o n c e pt ,   i . e .   เป / be + ิ่ เล / c l o t o t h e   s t i m u l a t i ng - e v e n t   c o n c e pt ,   i . e .   เป / be + วเร / c a t a l y s t .   A dj   i s   a a dj e c t i v e   c o n c e pt   s e t .   A dj P hr a s e   i s   a a dj e c t i v e   phra s e   c o m po n e nt .   A dv   i s   a a dv e r b   c o n c e pt   s e t .     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   18 ,   N o .   2 M a y   20 2 :     970   -   97 8   972   T h e r e   a r e   s e ve r a l   t e c hn i q ue s   [5 - 12]  ha v i n b e e n   a ppl i e f o r   de t e r m i ni n t h e   c a us e - e ffe c t / c a us a l i t y / c a us a l   r e l a t i o n   b ut   n o t   i n c l udi ng  t h e   s t i m ul a t i o n   r e l a t i o n   f r o m   t e xt s   (s e e   S e c t i o n   2 ).   H ow e ve r ,   t h e   T h a i   do c um e n t s   ha v e   s e v e r a l   s pe c i f i c   c h a ra c t e r i s t i c s ,   s uc h   a s   z e r o   a n a p h o ra   o r   t h e   i m p l i c i t   n o u n   p hra s e ,   w i t h o ut   w o r a n s e nt e n c e   de l i m i t e r s ,   a n e t c .   A l l   o f   t he s e   c h a ra c t e ri s t i c s   a r e   i n v o l v e i n   t hr e e   m a i n   pr o b l e m s   (s e e   S e c t i o n   3) .   T h e   f i r s t   p r o b l e m   i s   h o w   t o   de t e r m i n e   c a us a t i v e - c o n c e pt / e ff e c t - c o n c e pt   E D U s   f r o m   t h e   do c um e n t s   c o n t a i ni n s o m e   E D U   oc c ur r e n c e s   w i t bo t h   c a us a t i v e - c o n c e pt s   a n e f fe c t - c o n c e pt s .     T h e   s e c o n pr o b l e m   i s   h ow   t o   d e t e r m i n e   t h e   c a us e - e ffe c t   r e l a t i o n   b e t w e e n   t w o   a dj a c e n t   E D U s   a s   a n   E D U   pa i r   w i t h   a   d i s c o ur s e   c ue   a m b i gui t y .   A n t h e   t hi r p r o b l e m   i s   h o w   t o   e xt r a c t   C E pa i r   s e r i e s   m i ngl e w i t h   e i t h e r   a   s t i m u l a t i o r e l a t i o n   E D U   o r   o t h e r   n o n - c a us e - e ffe c t   r e l a t i o n   E D U s   f r o m   t h e   do c um e n t s .   R e ga r d i n g   t h e s e   pr o b l e m s ,   w e   n e e t o   d e ve l o a   f r a m e w o r w h i c c o m b i n e s   m a c h i n e   l e a rni n a n t h e   l i n gu i s t i c   ph e n o m e na   t o   r e p r e s e n t   e a c h   E D U   e v e n t   c o n c e pt   by   n - w o r c o - o c c urr e n c e   (c a l l e N W o r dCo o n   t h e   E D U   v e r b   ph ra s e   a s   s h o w n   i n   (1)  w h e r e   N W o r dCo   i s   e xpr e s s e a s   c o m po un t e r m s   w i t h / w i t h o ut   a n y   pa t t e rn   o r e s t r i c t i o n   de pe n d i n o n   e a c h   r e s e a r c h   pe r s pe c t i v e   a s   [13 - 1 6 ].   T h e   r e a s o n   o f   us i ng  N W o r dCo   t o   r e pr e s e nt   a n   E D U   e v e n t   i s   t h e   V e r b w eak   e l e m e n t   w h i c h   n e e ds   m o r e   i n f o rm a t i o f r o m   s o m e   l i n gui s t i c   s e t s ,   i . e .   N o u n ,   A dj ,   V e r b   a n A dv ,   t o   fo r m   t h e   c a us a t i v e / e ff e c t   c o n c e pt   o r   t h e   s t i m u l a t i n c o n c e pt .   T h e   N W o r dCo   e xpr e s s i o n   of  t h e   r e s e a r c h   s t a rt s   w i t h   v 1   (w h e r v 1 V e r b s t ro n g V e r b w eak )   fo l l ow e d   by   t h e   N - c o - o c c urr e w o r ds   (N   i s   a i n t e ge r )   f r o m   t h e   E D U   v e r b   ph r a s e   a s   s h o w n   i n   t h e   f o l l ow i n g   (1)   a f t e r   s t e m m i ng  w o r ds   a n e l i m i na t i n g     s t o w o r ds .     N W o r dC o   e xp r e s s i o =   v 1 w 2 + …+ w N   (1)     w he r e   v 1 V e r b s tr o n g V e r b we a k   w 2 , …, w N N o un A dj A dv   V e r b   T h us ,   w e   a ppl y   a n   a nn o t a t e N W o r dCo - e xpr e s s i o n   p a i r s   w i t h   c a us a t i v e - e ffe c t - e v e n t   c o n c e pt s   t r e p r e s e n t   a   c a us e -   e ff e c t   r e l a t i o n   i n c l ud i n g   a a nn o t a t e N W o r dCo   w i t h   s t i m ul a t i ng - e v e n t   c o n c e pt .   W e   t h e a ppl y   N a ï v e   B a y e s   (N B [17]   t o   l e a rn   t h e   N W o r dCo   s i z e   ( w h i c h   i s   a N   v a l ue t o   e xt ra c t   a n c o l l e c t   N W o r dCo   w i t h   c o n c e pt s   i nt o   a N W o r dCo - Co n c e pt   (N W C s e t   f r o m   t h e   t e s t i ng  c o r pus .   W e   a l s o   us e   N B   t l e a rn   p r o b a b i l i t i e s   o f   N W o r dCo - c o n c e pt   pa i r s   w i t a   C a us e E f f e c t Re l a t i o n   c l a s s   a n a   n o n   Ca us e E f f e c t Re l a t i o c l a s s   f r o m   t h e   l e a rni n g   c o r pus   ha v i ng  t h e   di s c o ur s e   c ue   a m b i gui t y .   W e   t h e n   i de nt i f i e a n e xt ra c t   a l l   N W o rdCo - c o n c e pt   pa i r s   ha v i ng  t h e   c a us e - e ff e c t   r e l a t i o n   by   us i n t h e   N B - l e a rn i n g   pr o b a b i l i t i e s   o f   N W o r dCo - c o n c e pt   pa i r s   w i t h   t h e   C a u s e E f fe c t R e l a t i o n   c l a s s   f r o m   t h e   l e a rni n g   c o r pus   t o   t h e   Ca r t e s i a n   p r o duc t   o f   t h e   N W s e t s   f r o m   t h e   t e s t i n c o r p us .   L a t e r,   w e   c o l l e c t   t h e   e xt ra c t e N W o r dCo - c o n c e pt   pa i r s   i n t o   a N W CP ce   s e t   (w h i c h   i s   a o r de r e pa i r   s e t   o f   N W o r dCo - c o n c e pt   pa i r s   w i t t h e   Ca us e E f f e c t Re l a t i o c l a s s a s   s h o w n   i n   t h e   f o l l ow i n g .   N W C P ce   =   { N W o r dC o c N W o r dC o e - pa i r 1 N W o r dC o c N W o r dC o e   - pa i r 2 ,     ,   N W o r dC o c N W o r dC o e - pa i r l a s t   }   w he r e   N W o r dC o c N W o r dC o e - pai r i   i s   a n   N W o r dC o - c o n c e pt   pa i r   ha v i ng   t he   c a us e - e f f e c t   r e l a t i o b e t w e e N W o r dC o c   a nd   N W o r dC o e   ( i w hi c N W o r dC o c   i s   a n   N W o r dC o   w i t a   c a u s a t i v e   c o nc e pt   a nd  N W o r dC o e   i s   a N W o r dC o    w i t a e f f e c t   c o n c e pt ) ;   i = 1, 2, l as t   w h i c i s   a i n t e g e r .   W e   t h e p r o po s e   us i n g   N W CP ce   a n d   t h e   s t i m ul a t i n g - c ue - w or d   s e t ,   { เป ัว เร่ง / be - V e r b w eak   c at a l y s -   N o un ,   เร่ง / c a t al y z e - V s t r o n g , กระ / s t i m ul u - V s t ro n g …}   t o   e xt r a c t   t h e   CE p a i s e r i e s   i n c l udi ng  a   s t i m ul a t i o n   r e l a t i o n   E D U   f r o m   a n o t h e t e s t i n g   c o r pus   (s e e   s e c t i o n   3) .   O ur  r e s e a r c h   i s   o r g a ni z e d   i n t o   s e c t i o n s .   I S e c t i o 2,   r e l a t e w o r i s   s um m a ri z e d .   P r o b l e m s   i n   e xt ra c t i n g   t h e   C E pa i r   s e r i e s   f r o m   t e xt s   a r e   de s c r i b e i n   S e c t i o n   a n S e c t i o s h o w s   o ur   f r a m e w o r o e xt ra c t i n g   t h e   CE pa i r   s e r i e s .   I n   S e c t i o n   5 ,   w e   e v a l ua t e   a n d   c on c l ude   o ur  p r o po s e m o de l .         2.   R ELA TED   WO R K S   S e ve r a l   s t r a t e gi e s   [5 - 12 ha v e   b e e n   p r o po s e t o   de t e r m i n e   t h e   c a us e - e ffe c t   r e l a t i o n   f r o m   t e xt s   w i t h o ut   t h e   c a us e - e ff e c t   s e r i e s   c o n s i de r a t i o n   e xc e pt   [12] .   R e fe r e n c e   [5]  a pp l i e T e xt   M i n i ng  t o   c l us t e r   t h e   e ffe c t s / s y m pt o m s   of   t h e   c a us e s / di s e a s e s   f r o m   pa t h o l o g y   r e po r t s   h a v i n e ff e c t   e xpr e s s i o n s   a s   c o m pl i c a t e t e c hn i c a l   t e rm s   b a s e o n   N P .   A l l   c l us t e r s   b e n i f i t e o f   t he   a b i l i t y   i g r o upi n g   pa t i e n t s   w i t h   t h e   s i m i l a r   c o n di t i o n .   R e ga r d i n [ 6],   G i r j p r o po s e de c i s i o n   t r e e   l e a rni n t h e   c a us a l   r e l a t i o n   f r o m   a   s e nt e n c e   b a s e o n   t h e   l e xi c o   s y n t a c t i c   pa t t e rn   (N P c a us a l - v e r b   N P 2).   R e fe r e n c e   [7]  de t e r m i n e e ve n t   k n o w l e dge   a s   a   c a us a l   r e l a t i o n   (b a s e o n   t h e   l e xi c o - s y n t a c t i c   pa t t e rn,   N P ve r b   N P 2)  i n c l u di n t h e   c a us a l   a s s o c i a t i o n / s t r e ng t m e a s u r e m e nt   f r o m   w e b - t e xt s .   R e fe r e n c e   [8]  e xt ra c t e t h e   c a us a l   k n o w l e dge   f r o m   t w o   a dj a c e n t   s e nt e n c e s   by   us i n S V M   t o   l e a rn   s e v e r a l   f e a t u r e s   a s   a   s h a r e a ge n t   (N P 1)  f r o m   c a us a t i v e   a n d   e ff e c t i v e   c l a us e s ,   c a us a l   vo l i t i o n,   t h e   v e r b   c l a s s   f r o m   t h e   di c t i o na r y ,   ve r b a l   s e m a nt i c   a t t r i b ut e s ,   t h e   c o n n e c t i v e   m a r ke r,   a n t h e   m o da l i t y   f o r   c l a s s i fy i n t h e   c a us a l   k n o w l e dge   i nt o   f o ur   c l a s s e s   of   c a us a l   r e l a t i o n s :   c a us e ,   p r e c o n di t i o n,   m e a n,   a n e f fe c t   r e l a t i o n s .   R e fe r e n c e   [9]  a p pl i e v e r b - pa i r ul e s   a n m a c h i n e   l e a rn i ng  t e c hni que s   t o   e xt r a c t   t h e   c a us a l i t y   oc c ur r e n c e   w i t hi n   s e ve r a l   e f fe c t   E D U s .   T h e r e   a r e   m o r e   r e s e a r c h   w o r ks   b a s e o n   t h e   l e xi c s y n t a c t i c   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       E x t r a c t i on   of   c aus e - e f f e c t - c onc e p t   p ai r   s e r i e s   f r om   w e doc u m e nt s   ( Cha v e e v an   P e c hs i r i )   973   pa t t e rn   w i t h   t h e   c a us a l   c o n c e pt   a s   i n   [10]  p r o po s e t h e   Re s t r i c t e H i dde n   N a ï v e   B a y e s   m o de l   t l e a rn   a nd  e xt ra c t   t h e   c a us a l i t y   f r o m   t h e   E n g l i s h   do c um e n t s .   T h e   l e a rni n f e a t u r e s   a s   i [ 10]  i n c l ude   c o n t e xt ua l ,   s y n t a c t i c ,   po s i t i o n,   a n c o nn e c t i v e   fe a t u r e s .   R e f e r e n c e   [11]   a ppl i e t h e   r u l e - b a s e d,   S uppo r t   V e c t o r   M a c h i n e   a n t h e   t e m po ra l   r e a s o ni n t o   e xt ra c t   t h e   c a us a l   r e l a t i o n   o n   a   c o m pl e s e n t e n c e   o r   t w o   s i m pl e   s e n t e n c e s   f r o m   E n gl i s h   do c um e n t s .   R e f e r e n c e   [12]  m a de   c a us a l   c ha i n s   by   a ddi n t h e   c a us a l   c h a i n s   o b t a i n e f r o m   l a t e n t   t o pi c s   t o   t h e   c a us a l   c ha i n s   o b t a i n e d   f r o m   w o r m a t c h i ng .   T h e   m o de l ’s   [12]   i s   b a s e o n o un  f e a t u r e s   i n c l udi ng  h i d de n   c a us a l   c ha i n s   s o l v e by   l a t e n t   t o pi c s .   H ow e ve r ,   m o s t   of   t h e   p r e v i o us   w o r ks   o n   t h e   c a us e - e ffe c t   r e l a t i o a r e   b a s e o n o un/ N P   f e a t u r e s   e xi s t i ng  o o ne / t w o   s e n t e n c e s   w i t h o ut   t h e   s e r i e s   c o n s i de r a t i o e xc e pt   [12]  w h e r e a s   o ur   w o r ha s   N P   e l l i ps i s   o c c ur r e n c e s   on   do c um e nt s .   T h e r e   a r e   f e w   w o r ks   o n   e xt r a c t i n g   t h e   CE pa i r   s e r i e s   a s   a   d i s e a s e   c a us a t i o pa t h w a y .         3.   P R O B L EM S   O F   EX TR A C TI N G   C EP A I R   S ER I ES   F R O M   T EX TS   3. 1 .      H o w   to   D e te r m i n e   C au s ati v e - C o n c e p t/ Effe c t -   C o n c e p ED U s   f r o m   D o c u m e n ts   T h e r e   a r e   s o m e   E D U   o c c urr e n c e s   w i t h   b o t h   c a us a t i v e -   c o n c e pt s   a nd  e ff e c t - c o n c e pt s ,   i . e .   E D U a n d   E D U of  E xa m p l e   o n   CE p a i r 1   t o   CE pa i r 2   a n C E pa i r t o   CE pa i r 5   r e s pe c t i v e l y .   It   i s   di f f i c ul t   t o   i de n t i fy   t h e   c e r t a i n   E D U   o c c urr e n c e   a s   t h e   c a us a t i v e   c o n c e pt   o r   t h e   e f fe c t   c o n c e pt .   T h e r e f o r e ,   a f t e r   s t e m m i n w o r ds   a n d   e l i m i na t i n g   s t o w o r ds ,   w e   a ppl y   t h e   a nn o t a t e N W o r dCo   pa i r s   w i t h   c a us e - e ff e c t   r e l a t i o n   o n   t h e   l e a rni n g   c o r pus   t o   r e pr e s e nt   t h e   c a us a t i v e / e ff e c t   c o n c e pt   E D U s   a n t he   a nn o t a t e N W o r dCo   w i t h   s t i m u l a t i ng  c o n c e pt If   t h e   f i r s t   w o r o f   e a c h   E D U   v e r b   phr a s e   i s   t h e   e l e m e nt   o f   V e r b s tr o n g V e r b we a k   ,   t h e   N W o r dCo   s i z e   i s   t h e s o l ve by   N B   l e a r ni n o n   t h e   c o n s e c ut i v e   w o r ds   of   e a c h   a nn o t a t e v e r b   phr a s e   w i t h   a   s l i de   w i n do w   s i z e   o t w a dj a c e n t   w o r ds   w i t h   a   o n e   w o r s l i di ng  di s t a n c e   o n   e a c h   E D U   v e r b   ph r a s e .   T h e   N W o r dCo   e xt r a c t i o n   i s   t h e o c c ur r e d   a f t e t h e   N W o r dCo   s i z e s   ha v e   b e e n   s o l v e d.     3. 2 .      H o w   to   D e te r m i n e   C Ep ai r i   as   C au s e - Eff e c t   R e l ati o n   w i th   D i s c o u r s e - C u e   A m b i g u i ty   T h e   CE pa i r i   e xp r e s s i o n   a s   t h e   c a us e - e ff e c t   r e l a t i o n   b e t w e e n   t w o   a dj a c e n c y   E D U s   a s   a E D U   pa i r   c a b e   de t e r m i n e b y   us i n t h e   d i s c o ur s e - c ue   s e t ,   { รา / be c a us e , นื่อง / s i nc e ’,   / c aus e , . . } ,   s e e   E xa m pl e   1.   H ow e ve r ,   s o m e   di s c o ur s e - c ue   s e t   e l e m e n t s   a r e   a m b i gui t y .   F o r   e xa m pl e :   C E pa i r 1   o f   E xa m p l e   1   ha s   a   d i s c o ur s e   c ue ,   นื่อ / s i nc e ,   o n   E D U w h e r e a s   a E D U 1 - E D U pa i o f   t h e   f o l l o w i n E xa m pl e   ha v i ng  นื่อง / s i nc e   o E D U i s   n o t   t h e   C E pa i r 1   e xp r e s s i o n .   E xa m pl e   2   …  ED U 1 :   วย เบ าห วา าจ เป วใ   ( A   d i a b e t i c   p a t i e n t   m i g h t   g e t   t h e   h e a r t   d i s e a s e . )   วย / p a t i e n t    เบ าห าน / d i a b e t e s     าจ เป / m i g h t   g e t     วใ / h e a r t   d i s e a s e     ED U 2 :“ เน ื่ าก   าวะ  ้ าล เล   ( S i n c e   a   b l o o d   s u g a r   l e v e l   i s   h i g h . )   เน ื่ าก / s i n c e     าวะ  ้ าต าล / s u g a r   l e v e l     ใน / i n     เล / b l o o d     / h i g h     ED U 3 :   [ าวะ  ้ าต าล ]   าใ สาร เค าง เพ ิ่ ึ้     ( [ T h e   h i g h   b l o o d   s u g a r   l e v e l   / E D U 2 ] c a u s e s   o f   h a v i n g   s o m e   i n c r e a s e d   c h e m i c a l   s u b s t a n c e   t y p e s   i n   b l o o d . )     “[ าวะ  ้ าต เล / h i g h   b l o o d   s u g a r   l e v e l / E D U 2 ]     าใ / c a u s e     มี / h a v e     สาร าง /   s o m e   c h e m i c a l   s u b s t a n c e   t y p e   เพ ิ่ ึ้ / i n c r e a s e     ใน / i n     เล / b l o o d       E xa m pl e   c o nt a i ns   t he   f o l l o w i ng   C E pa i r i   o c c ur r e nc e .   E D U 2 - E D U P a i r   a s   C E p a i r 1 : E D U ( c a us e )   E D U 3( e f f e c t )   W i t h   r e ga rd  t o   t hi s   p r o b l e m ,   w e   c a s o l v e t h i s   t h i s   p r o b l e m   by   a ppl y   t h e   N B   m a c h i n e   l e a rni ng  t e c hni que   t l e a rn   t h e   a nn o t a t e N W o r dCo - c o n c e pt   pa i r   (t h e   a nn o t a t e N W o r dCo c N W o r dCo e - pai r i   i = 1 , 2 , . . , l a s t L e a r n t P a i r f e a t ur e   w i t h   t h e   Ca us e E f fe c t R e l a t i o n   c l a s s   f r o m   e a c h   E D U   pa i r   o n   t h e   l e a rni n g   c o r pus   a f t e r   s t e m m i ng  w o r ds   a n e l i m i n a t i n g   s t o w o r ds .     T h e   e xt ra c t e N W o r dCo   e xp re s s i o n s   a r e   c o l l e c t e i n t o   a N W o r dCo - c o n c e pt   s e t   (N W C)  us e a s   t h e   Ca us e Co n c e pt   s e t   (Ca us e Co n c e pt   s e t   = N W C)  a n a l s o   t h e   E f f e c t Co n c e pt   s e t   (E f fe c t Co n c e pt   s e t   = N W C)  f o r   t h e   C a r t e s i a n   p r o duc t   o f   Ca us e Co n c e pt E f fe c t Co n c e pt   a s   a NW or dCo - c onc e pt   or de r e pai r   s e t .     W e   t h e n   c o l l e c t   t h e   N W C P ce   s e t   (s e e   s e c t i o n   1)  by   us i n N B   [17]  w i t h   t h e   f e a t ur e   pr o b a b i l i t i e s   o f   t h e   a nn o t a t e N W o r dCo - c o n c e pt   pa i r s   ha v i n t h e   c a us e - e ffe c t   r e l a t i o n   t o   t h e   NW or dCo - c onc e pt   or d e r   pa i r   s e t .     3. 3 .      H o w   to   Ex tr ac t   C Ep ai r   S e r i e s   M i n gl e d   w i th   N o n - R e l ati o n   ED U s   R e ga r di n g   E x a m pl e   1 ,   t h e   CE p a i s e ri e s   e xt ra c t i o n   i n c l udi ng  t h e   c a us e - e ff e c t   r e l a t i o n   o c c urr e n c e s   a n t h e   s t i m u l a t i o n   r e l a t i o n   o c c ur r e n c e s   o n   t h e   s e r i e s   m i n g l e w i t h   n o n - r e l a t i o n   E D U s   i s   c h a l l e n ge .   T h e r e f o r e   w e   pr o po s e   us i n g   t h e   s t i m ul a t i ng - c ue - w o r s e t   a n N W CP ce   c o l l e c t i o n   a s   t h e   k n o w l e dge   b a s e   t e xt ra c t   C E p a i s e ri e s   i n c l ud i n g   t h e   s t i m ul a t i o r e l a t i o n   o c c ur r e n c e   f r o m   t h e   do c um e n t s .       4.   A   F R A M EW O R K   O F   C EP A I R   S ER I ES   EX TR A C TI O N   T h e r e   a r e   s i s t e ps   i o ur  f r a m e w o r k,   Co r pus   P r e pa ra t i o n,   N W o r dCo   S i z e   L e a rn i ng,   Co l l e c t i o o f   N W o r dCo   w i t E v e n t   Co n c e pt s ,   N W o r dCo - Co n c e pt   P a i L e a rn i ng,   E x t ra c t i o o f   N W CP ce ,   a n d   E xt ra c t i o   of   C E pa i r   S e r i e s   a s   s h o w n   i F i gu r e   1 .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   18 ,   N o .   2 M a y   20 2 :     970   -   97 8   974       F i gu r e   1 .   S y s t e m   ov e r v i e w       4. 1 .      C o r p u s   P r e p ar at i o n   T h i s   s t e i s   t o   pr e pa r e   a n   E D U   c o r pus   f r o m   t h e   c hr o n i c   di s e a s e   do c um e n t s ,   i . e .   d i a b e t e s ,   h e a rt   di s e a s e ,   a r t e r y   di s e a s e   e t c . ,   dow n l o a de f r o m   h o s pi t a l s   w e b - bo a r ds   ( h t t p: / / w w w . b a n gko k h e a l t h . c o m ;   ht t p : / / ha a m o r . c o m / ) .   T h e   s t e i n v o l v e s   us i n T h a i - w o r d - s e gm e n t a t i o t o o l s   [18]  a nd  N a m e d - E n t i t y   r e c o gn i t i o n   [1 9 - 20] .   A f t e r   t h e   w o r s e gm e n t a t i o n   i s   a c hi e ve d,   E D U   S e gm e n t a t i o n   [21]  b a s e o n   [22 - 24]  i s   t h e o pe r a t e t o   p r o v i de   a   250 E D U s ’  c o r pus .   T h e   c o r pu s   i n c l ude s t e m m i n w o r ds   a nd  t h e   s t o w o r r e m o v a l   i s   s e pa ra t e i nt o   pa r t s ;   t h e   f i r s t   pa rt   o f   1000  E D U s   fo r   l e a rni n t h e   N W o r dCo   s i z e s / b o un da ri e s   ha v i ng  c a us a t i v e / e ff e c t / s t i m u l a t i ng  c o n c e pt s   a n d   a l s o   l e a rn i ng  t h e   N W o r dCo - c o n c e pt   pa i r s   ha v i n g   t h e   c a us e - e ffe c t   r e l a t i o n.   T h e   s e c o n pa r t   o f   1000  E D U s   i s   t h e   t e s t i n c o r pus   us e fo r   t h e   N W o r dCo   s i z e   de t e r m i n a t i o n   t o   e xt r a c t   a n c o l l e c t   N W o r dCo   oc c ur r e n c e s   w i t h   c a us a t i v e / e ffe c t / s t i m ul a t i n c o n c e pt s   i n t o   t h e   N W s e t .   T h e   N W s e t   i s   us e fo r   c o l l e c t i n N W o r d Co - c o n c e pt   pa i rs   w i t h   t h e   c a us e - e ff e c t   r e l a t i o n   i nt o   t h e   N W CP ce   s e t .   T h e   t hi r p a rt   o f   500  E D U s   i s   us e f o r   t h e   CE pa i r   s e r i e s   e xt r a c t i o n.   T h i s   s t e a l s o   i n c l ude s   s e m i - a ut o m a t i c   a nn o t a t i o n   o f   e a c h   N W o r dCo   s i z e   a l o n w i t h   t h e   c a us a t i v e / e ff e c t / s t i m u l a t i ng  c o n c e pt   a s   s h o w n   i n   F i gu r e   [25].   T hi s   s t e a l s o   a nn o t a t e s   t h e   E D U   pa i r s   a s   t he   N W o r dCo - c o n c e pt   pa i r s   w i t h   t h e   c a us e - e f fe c t   r e l a t i o n .   A l l   w o r c o n c e pt s   of   e a c h   N W o r dCo   e xpre s s i o n   i s   r e f e rr e t o   W o r d n e t   ( h t t p: / / w o r d - n e t . p r i n c e t o n. e du/   o b t a i n [ 26]  a n M e S H   a f t e r   t r a ns l a t i n f r o m   T h a i   t o   E n g l i s h   b y   L e xi t r o ( ht t p : / / l e xi t r o n. n e c t e c . o r . t h/ ).             F i gu r e   2 .   A nn o t a t i o n   o f   N W o r dCo   a n d   CE pa i r   s e r i e s       ..                                             E DU 1                                                                                                                                   E DU 2               [                                                   E DU 3                                                                         E DU 4   “.. A  pat i en t  g et a di abe t es  dis e ase . E DU 1   s i nc e t he bo dy   canno t  fu l l y  use  sug ar   i ns i d e t he  bod y .   E DU 2   B ecau se  [ t he bo dy ]   l ac k s of   hor m one i n sul i n. E D U3 [ l ac k  of  h or m one i n sul i n]  ca us es  B l o od - sug ar  l ev el  t o be hi g E DU 4   <T o pi c _nam e Ent i t y - conc ept = D i abe t es / di se a se >                   </ T op i c_ nam e>……… …     <CE pa i r Ser i e s   I D = 1 >   <ED U 1     C Epai r I D  = 1 t y pe= e f f ec t > <N P1  conc ept =   pa t i e nt / hum an >               / nc </ N P 1>          < V P   m ar k er   =no> < N - Wor d - C oExpre s si on N = 2   w or ds    c oncep t = ge t   di abe t es                                                 < w1 :  se t T y pe=‘ V e r b - w ea k  ;  c once p t =   g et  bo unda r y  = y es ’>           </ w 1 >                                                  <w 2 se t T y pe=‘ N ou n   ;  con ce pt=   di abe t es  bou n dary  = y es ’>                     </ w 2 >                                           </ N - Wor d - C oExpre s si on  > < / V P > </ ED U 1>     <ED U 2   C Epai r I D  = 1 t y pe = cause   |  C Epai r I D =2 t y pe= e f f ec t > <N P1 co nce p t =   b od y / or g an >               </ N P1>          < V P     m ar k er =y es > < N - Wor d - C oExpre s si on   N = 4 w or ds   c oncep t =   no t   t ak e   bod y sugar   t o u se                                                  <w 1 :  se t T y pe=‘ V e r b - st r ong  ;  con ce p t =’ not   t ak e  b ound ar y  = y es ’>            </ w 1 >                                                 <w 2 :  se t T y pe=‘ N oun   ;  con c ept sug ar  boun dar y  = y es ’>              </ w 2 >                                                <w 3 :  se t T y pe=‘ N oun   ;  con c ept body / o r g an  bou ndar y  = y es ’>               </ w 3 >                                                 <w 4 :  se t T y pe=‘ V e r b - w eak  ;  conce pt=  us e  b oun da r y  = y es ’>       </ w 4 >                                                <w 5 :  se t T y pe=‘ A dv  ;   conc e pt f u l l y  bou nda r y  = no ’>                         </ w 5 >                                          </ N - Wor d - C oExpre s si on > < / V P > </ ED U 2 >   <ED U 3   C Epai r I D =2 t y pe= cause   |  C Epai r I D =3 t y pe= c ause   > <N P1   conc ep t =   bod y / or g an > </ N P1>          < V P   m ar k er =y es > < N - Wor d - C oExpre s si on   N =2 w or ds  c once pt l ack o f  i n su l in                                                w 1 :  se t T y pe=‘ V e r b - st r ong  ;  con ce p t =’ l a ck  of  bou nda r y = y es ’>       </ w 1 >                                                w 2 :  se t T y pe=‘ N oun   ;  con c ept = i n sul i n  boun dar y  = y es ’>                               </ w 2 >                                           </ N - Word - C oE xpres si on > < /VP > </ E D U 3 >   ………… ………   T he   C Epai r Se r i es   t ag  i s t he  C Epai r   se r i e s t ag T he  N - Wor d - C oExpre s si on  t ag  i t he word b ounda r y  t ag  of  ea ch N - Wor d - C o expr e ss i on.   T he   w t ag  i t he   w or d - t ag   w her i =1,2, .., num .  .   T he  [ .. ]  sy m bol  or     m ea ns e l l i ps i ( Z er o A naph or a )   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       E x t r a c t i on   of   c aus e - e f f e c t - c onc e p t   p ai r   s e r i e s   f r om   w e doc u m e nt s   ( Cha v e e v an   P e c hs i r i )   975   4. 2 .      N Wo r d C o   S i z e   Le a r n i n g   T h i s   s t e i s   a n   N W o rdCo   s i z e / b o un da r y   l e a rn i ng  (N   v a l u e by   t h e   N B   c l a s s i f i e r   [17 f r o m   t h e   a nn o t a t e v e r b   phra s e s   w i t h   t h e   c o n c e pt s   f r o m   t h e   c o r pus   pr e pa ra t i o n   s t e p.   T h e   a nn o t a t e N W o r dCo  o c c urr e n c e s   w i t h   c a us a t i v e / e ffe c t / s t i m ul a t i n c o n c e pt s   a r e   s e pa ra t e i nt o   w o r d - c o n c e pt   v e c t o r s   (W j i n   a   m a t r i x   v e c t o r   (W ).     W j ={ w j 1 , w j 2 , . . , w jk   w i t h   Co rE o r S / n o n - Co rE o r S }   w h e r e   Co rE o r S   i s   a n   N W o r dCo / a   w o r v e c t o r   w i t h   a   c a us a t i v e / e ff e c t / s t i m u l a t i ng  c o n c e pt   a n d   n o n - Co r E o r S   i s   a N W o r dCo / a   w o r v e c t o r   w i t a   n o n - c a us a t i v e /   e ffe c t /   s t i m ul a t i ng  c o n c e pt ,   e xi s t i n g   i E D U 1, E D U 2, . . , E D U m   W = { W j }   w h e r e   j = 1. . m ;   a f t e r   w e   ha v e   o b t a i n e t h e   a nn o t a t e d   w o r f e a t u r e s   i n c l u di n g   t h e   s t o w o r r e m o v a l   a n s t e m m i n w o r ds ,   w e   t h e n   de t e r m i n e   t h e   pr o b a b i l i t i e s   of   C o r E o r S   c o n c e pt   a nd  n o n - Co rE o r S   c o n c e pt   f r o m   a   s l i de   w i n do w   s i z e   o t w c o n s e c ut i v e   w o r ds   o n   t h e   ve r b   phr a s e   w i t h   t h e   o n e - s l i di n g - w o r di s t a n c e   b y   us i n W e ka   ( h t t p : / / w w w . c s . w a ka t o . a c . nz / m l / w e ka / ).     4. 3 .      C o l l e c t i o n   o N Wo r d C o   w i th   Ev e n C o n c e p ts   A f t e r   s t e m m i n w o r a nd  e l i m i na t i n g   s t o w o r ds   o f   t h e   t e s t i n g   c o r pus ,   i f   w j 1   V e r b w eak     V e r b s t ro n g   (w h e r e   w j i s   t h e   f i r s t   w o r o f   E D U j   v e r b   phr a s e ),   t h e   N W o r d Co   s i z e   i s   t h e n   de t e r m i n e by   us i n g   N B   i n   (2 a n t h e   l e a rn t   p r o b a b i l i t y   of   C o r E o r S   c o n c e pt   a n n o n - Co rE o r S   c o n c e pt   f r o m   t h e   pr e v i o us   s t e o IV . B   t de t e r m i n e   t h e   c o n s e c ut i v e   w o r ds   o n   t h e   ve r b   phr a s e   w i t h   a   s l i de   w i n do w   s i z e   of   t w o   a dj a c e n t   w o r ds   w i t h   t h e   o ne - s l i di ng - w o r di s t a n c e .   A s   s o o n   a s   c l as s =   n o n - Co rE o r S - c o n c e pt ’  i s   de t e rm i n e d ,   t h e   N W o r d Co  bo un da r y / s i z e   i s   s o l v e a s   s h o w n   i t h e   N W o r dCo   e xt ra c t i o a l go r i t h m   o f   F i gur e   3 .   I r e ga r t o   F i gu r e   3 ,   t h e   e xt ra c t e N W o r dCo   e xpr e s s i o n s   i n   N W CS e t   (w h i c h   i s   t h e   N W o r dCo - c o n c e pt   s e t ,   N W C)  f r o m   t h e   t e s t i ng  c o r pus   i s   c o l l e c t e w i t h   t h e   c o n c e pt s   a c c o r di n t o   t h e   s e que n c e   of   w o r c o n c e pt s   a s   s h ow n   i n   T a b l e   c o n s i s t i n g   o f   t h e   c a us a t i v e - N W o r dCo ,   e f fe c t -   N W o r dCo ,   a n d   s t i m ul a t i n g - N W o r d Co   c o n c e pt s .           F i gu r e   3 .   N W o r dCo   e xt ra c t i o n   a l go r i t hm       T a b l e   1 .   N W S e t   Co l l e c t i o n           F i g u re. 3   N Wo rd C o   E xt ra c t i o n   A l g o ri t h m       A ssu me   t h a t   e a c h   ED U   i s re p r e se n t e d   b y   ( N P 1     V P ) .   L   i s a   l i st   o f   ED U s   a f t e r   st e mm i n g   w o r d s a n d   t h e   st o p   w o r d   r e mo v a l .          V e r b = V e r b s t r o n g     V e r b w e a k ;   W =   N o u n   V e r b s t r o n g   A d v A d j       N W C S e t   i s a n   N W o r d C o - c o n c e p t   se t e v p   i s a n   ED U s v e r b   p h r a se   N W OR D C O_ E X T R A C T ION                   1   N W C S e t N W co      ;     i= 1   ;   j = 1 ;     k   = 0   ;    fl = no ;   2   w h i l e   j   L e n g t h [ L do   3     { 1    If    i =1      t h e n                / *   i d e n t i f y   t h e   1 st w o r d   o f   N W o r d C o     4         { 2     If    ( e v p j . w i   V e r b s t r o n g   )   t h e n     {      NW co       e v p j . w i     fl = y e s   }   5               E l se  If     (     e v p j . w i     V e r b w e a k ) (     e v p j . w i +1     W         t h e n       6                          NW co     (   evp j . w i   +     e v p j . w i +1 )     ;     i ++   ;       fl = y e s   }   7                 i ++    } 2                   / *   d e t e r mi n e   N - W o r d - C o   si z e   8           w h i l e   ( fl= yes   (   e v p j . w i   W )     ( i e n d O f V e r b P h r a se )   do   9            { 3     i = i - 1 ;       10                  Eq u a t i o n ( 2 )   ;     11                 If   c l a ss=   n o n C o rE o rS _ c o n c e p t   t h e n     fl   no     12                 E l se     fl y e s ’;   13                    If     c l a ss = ‘ yes ’)  t h e n    NW co   NW co        w i    ;   14                   i ++  } 3   15          If       NW co <>        fl= no   t h e n      /* a p p e n d   n e w   N W o r d C o   16            N W C S e t   N W C S e t   NW co ;    i = 1   ;     j + +   ;   NW co } 1        17   }   r e t u r n       N W C S e t                                       N Wor dC o Exp r e ss i on   C once pt           / occ ur -              / sugar -           / b l ood -       / hi gh   occ ur -- sug ar - bl ood - hi g h         / l ac kOff -               / ho rmone   l ac k O f - hor m one      / have -                         / comp l i c a t i on -    / ki dn ey   hav e - com pl i ca t i on - k i dney               / caus eTo -             / Pro t e i n -           / bl ood -         / l ow   ca use - pr ot ei n - bl ood - l ow           / co l l e ct -           / f a t -                         / ar t er y   col l ec t - f at - ar t er y               / det e ri ora t e -                         / art e ry   occ ur - det e r i o r a t ed - ar t e r y                 / l os sOf -             / pr ot e i n -               / ur i ne   l oss - pr ot e i n - ur i ne         Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   18 ,   N o .   2 M a y   20 2 :     970   -   97 8   976   } ' _ _ ' , ' _ {' ; / / }; ,.. 2 , 1 { ; } ,.. 2 , 1 { ) _ _ ( ; . ) ( ) | ( ) | ( m a x a r g . ) , | ( m a x a r g 1 1 1 c o n c e p t C o r E o r S non c o n c e p t C o r E o r S C l a s s c o n c e p t w o r d g s t i m u l a t i n e f f e c t c a u s a t i v e a C o r E o r S k j n i v e c t o r c o n c e p t w o r d C o r E o r S a is W W w and W w w h e r e c l a s s P c l a s s w P c l a s s w P w w c l a s s P n d a r y C l a s s N W o r d C o B o u i i ij i ij ij ij C l a s s c l a s s ij ij C l a s s c l a s s   (2)     4. 4 .      N Wo r d C o - C o n c e p P ai r   L e ar n i n g   T h i s   s t e i s   t h e   N B   l e a rn i n [17 t h e   fe a t u r e   s e t   of   N W o r dCo - c o n c e pt   pa i r s   w i t h   t h e   Ca us e E f f e c t Re l a t i o n   c l a s s   o n   s e ve r a l   t w o   a dj a c e n t   E D U s   w i t h   C E pa i r ID   a nn o t a t i o n   o f   t h e   l e a rni n c o r pus   f r o m   t h e   c o r pus   p r e pa ra t i o n   s t e (s e c t i o n   4 . 1)   a f t e r   s t e m m i ng   w o r ds   a n e l i m i na t i ng  s t o w o r ds .   T h e   l e a rn i ng  r e s ul t s   o f   t h i s   s t e by   us i n W e ka   (h t t p: / / w w w .   c s . w a ka t o . a c . n z / m l / w e a k/ a r e   t h e   pr o b a b i l i t i e s   of  t h e   a nn o t a t e d   N W o r dCo - c o n c e pt   pa i r s   a s   s h o w n   i T a b l e   2 .       T a b l e   2 .   S h o w   P r o b a b i l i t i e s   o f   N W o r dCo - Co n c e pt   P a i r         4. 5 .      Ex tr a c t i o n   o N WC P ce   T h e   c o l l e c t e N W s e t   f r o m   t h e   p r e v i o us   s t e o f   IV . C   i s   us e a s   t h e   Ca us e Co n c e pt   s e t   a n d   a l s o   t h e   E f fe c t Co n c e pt   s e t   fo r   de t e r m i n i ng  t h e   Ca rt e s i a n   p r o duc t   of   Ca us e Co n c e pt E f f e c t Co n c e pt   a s   NW or dCo - c onc e pt   or d e r   pa i r   s e t ,   N W Co r dP W e   t h e n   e xt ra c t   a n d   c o l l e c t   e a c N W o r dCo - c o n c e pt   pa i c l a s s   w i t t h e   c a us e - e ff e c t   r e l a t i o n   i nt o   N W CP ce   f r o m   N W C o r dP   e l e m e nt s   by   us i n t h e   N B   c l a s s i f i e r   i n   (3)  w i t h   t h e   N W o r dCo - c o n c e pt   pa i r   p r o b a b i l i t i e s   f r o m   T a b l e   2   a s   t h e   N B   f e a t ur e   p r o b a b i l i t i e s .     el em en t s ;   of n u m b er       t h e is ; ,.. 2 , 1 } ' Re ' , ' Re {' ;   cl as s ; p ai r   co n cep t   - N W o r d C o an     is . ) ( ) | ( m ax ar g . ) | ( m ax ar g NW Co r d P num num k l a t i o n t non lation t Ca u s eE f f ec Cl a s s NW Co r d P n wc O r d p a i r n wc p Cl a s s wh er e cl a s s P cl a s s n wc O r d p a i r P n wc O r d p a i r cl a s s P n wc p Cl a s s k k C l a s s c l a s s k C l a s s c l a s s   (3)     4. 6 .      Ex tr a c t i o n   o C Ep ai r   S e r i e s   T h e   ob j e c t i ve   of   t h i s   s t e i s   t o   e xt ra c t   t h e   CE p a i r   s e r i e s   by   m a t c hi n c nw c p   t o   n w c p ce - k   a s   s h o w n   i F i gu r e . w h e r e   nw c p ce - k N W CP ce   ;   k= 1, 2 , . . n u m b e r O f _N W CP ce _e l e m e n t ;   a n d   t nw c p   i s   a   t e s t i n N W o r d Co - c o n c e pt   pa i w h i c h   i s   t h e   C E p a i e xp r e s s i o n   c o n s i s t i n o f   t w o   c o n s e c ut i v e   N W o r dCo - c o n c e pt   e xpr e s s i o n s   a s   t h e   t e s t i ng  N W o r dCo   c o n c e pt s   ( t n w c 1 , t nw c 2 e xt ra c t e f r o m   t h e   t e s t i ng  c o r pus .   If   m a t c h ( t nw c p , nw c p ce - k t h e   S e r i e s S e r i e s     t nw c p   w h e r e   S e ri e s   i s   t h e   r e s e a r c h   o ut pu t .   M o r e ov e r ,   t h e   s t i m u l a t i o n   r e l a t i o n   o c c urr e n c e   o n   o n e   E D U   a s   t h e   p a r t   o f   CE pa i r   s e r i e s   c a b e   i de nt i f i e by   us i n g   t h e   s t i m ul a t i n g - c ue - w o r s e t .       NW o r d C o - C o n ce p Pai r :                                                     ( C aus a t i v eNWo r dC oC on ce pt ) ( Ef f ec t N Wo r dC oC onc ep t )   C aus eEf f e ct   R el .   Proba b i l t y   N on - C aus e   Eff e ct R e l .   Proba b i l t y   ( l a ck O f - hor m one) ( occ ur - sug ar - B l ood - hi g h)   0.0 171   0.0 1 16   ( occ u r - det er i or at e d - ar t er y ) ( cons t r i ct - ar t e r y )      0.0 05 3   0.0 029   ( col l e ct - f at - ar t e r y ) ( ca u se - ar t er i os cl e r os i s )   0.0 053   0.0 029   ( l os sOf - pr ot e i n - ur i ne) ( c aus e - pr ot ei n - bl ood - l ow )   0.0 13 2   0.0 116   ( ca u se - pr ot e i n - bl ood - l ow ) ( hav e - sym pt o m - swel l )   0.0 0 20   0.0 0 25   ( ca u se - pr ot e i n - bl ood - l ow ) ( occ ur - st a t e - k i dney Fai l ur e )   0.0 0 38   0.0 0 48   ( occ u r - sug ar - bl ood - hi g h) (   det e r i o r a t e - ar t e r y )   0.0 0 3 8   0.0 048           Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       E x t r a c t i on   of   c aus e - e f f e c t - c onc e p t   p ai r   s e r i e s   f r om   w e doc u m e nt s   ( Cha v e e v an   P e c hs i r i )   977       F i gu r e   4 .   C E p a i s e ri e s   e xt r a c t i o n       5.   EV A LU A TI O N   A N D   C O N C LU S I O N   T h e r e   a r e   t hr e e   e v a l ua t i o n s   o f   t h e   pr o po s e r e s e a r c h   b e i n e v a l ua t e by   t hr e e   e xpe r t   j udgm e n t s   w i t h   m a x   w i v o t i n g :   t h e   f i r s t   e v a l ua t i o n   i s   t h e   e x t r a c t i o n   o f   t h e   N W s e t   w i t h   t h e   N W o r dCo   s i z e / b o un d a r y   c o n s i de r a t i o n   f r o m   1000  E D U s   of   t h e   t e s t i n c o r pus   w hi c h   i s   a l s o   us e fo r   t h e   s e c o n e v a l ua t i o n.     T h e   e xt r a c t i o n   o f   N W CP ce   i s   e v a l ua t e a s   t h e   s e c o n e v a l ua t i o n   a n t h e   t h i rd  e v a l ua t i o n   i s   t h e   CE pa i s e ri e s   e xt ra c t i o f r o m   t h e   o t h e t e s t i ng  c o r pus   o f   500  E D U s .   T h e   f i r s t   a n d   t h e   s e c o n e v a l ua t i o a r e   b a s e o t h e   pr e c i s i o n s   a n d   t h e   r e c a l l s   w i t h i t e n   f o l c r o s s   v a l i da t i o w h i l s t   t h e   t hi r d   e v a l ua t i o n   i s   t h e   pe r c e nt a ge   of  c o r r e c t n e s s .   T h e   pr e c i s i o n s   o f   e xt ra c t i n t h e   N W s e t   a n t he   N W CP ce   s e t   a r e   0. 866  a n 0 . 852  w i t h   r e c a l l   o 0. 798  a n 0 . 71 r e s pe c t i v e l y   w h i l s t   t h e   c o rr e c t n e s s   o f   t h e   CE pa i r   s e r i e s   e xt r a c t i o n   i s   8 7. 5 %.   T h e   r e a s o n   o l o w   r e c a l l s   i n   e xt ra c t i ng  t h e   N W s e t   a nd  t h e   N W CP ce   s e t   i s   t h a t   s o m e   i n f o r m a t i o n   o f   t h e   c e rt a i n   e v e n t   e xpr e s s i o n s   by   v e r b   phr a s e s   e xi s t s   o n   b o t h   N P a nd  V P   w hi c h   r e s ul t s   i n   l a c o f   i n f o r m a t i o n/ c o n c e pt   o n   t h e   N W o r dCo   e xpr e s s i o n, i . e .   a ) E D U : ( / d e t e r i o r a t i o n   / of   / a r t e r y ) / N P 1   ( / o c c u r ) / V P   ( T he   de t e r i or a t i on   o f   ar t e r y   oc c ur s )   a nd   b)   E D U : (  ้ าต าล / s u g a r ใน / i n   เล / b l o o d ) / N P 1   (   / b e   l o w ) / V P ( T he   S uga r   i n   b l ood   i s   l ow . ) .   M o r e o ve r ,   t h e s e   a a n b e xa m pl e s   a l s o   e ff e c t   t t h e   of   c o rr e c t n e s s   of   t h e   CE pa i r   s e ri e s   e xt r a c t i o n.   H e n c e ,   t h e   r e s e a r c h   c o n t ri b ut e s   t h e   m e t h o do l o g y   t o   de t e r m i n e   t h e   CE p a i r   s e r i e s   fo r   c l e a rl y   c o m m uni c a t i ng  h e a l t h   i n f o r m a t i o n   a n d   i m p r o v i n h e a l t h   l i t e ra c y ,   pa r t i c ul a rl y   t h e   di s e a s e   c a us a t i o n   p a t h w a y ,   t o   pe o pl e   o n   t h e   s oc i a l   n e t w o r k.   A n d,   t h i s   n e t w o r s h o ul a l s o   pr o v i de   h ow   t o   s o l ve   pr o b l e m s / e ff e c t s   [27].   F i n a l l y ,   o ur   r e s e a r c h   c a a l s o   e nha n c e   t h e   di a g n o s i s   a nd  s o l v i n s y s t e m   o f   t h e   o t h e r   a r e a s   i . e .   t h e   f i n a n c i a l     s e r v i c e s   i n dus t r y .       R EF ER EN C ES   [ 1]   J .   A . Q ui n l i v a a nd  D .   L a m ,   C ho l e s t e r o l   A bno r m a l i t i e s   a r e   C o m m o i W o m e w i t P r i o r   G e s t a t i o na l   D i a be t e s ,   J .   of   D i abe t e s   &   M e t abo l i s m ,   V o l . 4,   D O I : 10. 4172 / 215 5 - 6156 . 10 00 255, N o . 4   : 255,   201 3.   [ 2]   J .   R .   P e t r i e ,   T .   J .   G uz i k ,   a nd  R . M .   T o uy z .   R e v i e w   D i a be t e s ,   H y pe r t e ns i o n,   a nd  C a r di o v a s c ul a r   D i s e a s e :   C l i ni c a l   I ns i g ht s   a n V a s c ul a r   M e c ha n i s m s ,   C an adi an   J .   o f   C ar di o l og y ,   V o l . 34 ,   N o . 5 ,   pp . 575 - 58 4,   20 18 .   [ 3]   H . S ha hba z i a a nd  I . R e z a i i ,   D i a be t i c   k i dn e y   di s e a s e ; r e v i e w   o f   t he   c ur r e n t   kno w l e dg e , J R I P ,   V o l . 2 ,   N o . 2 ,   p p. 73 - 80, 2 013 .       A ss um e t hat   ea ch ED U   i r epr e se n t ed by  ( N P1   V P)       L is  a  l i st   of  ED U   a f t e r  s t e m m i n g  w or ds a nd  t he s t op  w or d r em ov al .        N WCP ce  i t he NWo r dC o - conc ep t  p ai r  se t  w i t h t he c a use - ef f ec t  r el a t i on.     t nw cp   i s a   t e st i ng   N Wor dC o - conc ept  pa i r   f r om  t he  se r i es   t es t i ng  cor p us .      t nw c     i s a   t e st i ng   N Wor dC o   conc e pt   f r om  t he  s er i es   t e s t i ng  cor pus   n wc j   i   a N Wo r dC o   co nce pt  of  ED U j   s  v er b ph r as e.   S c ue i s t he s t i m ul a t i ng - cue - w or d se t   C EP A I R _SE R I ES _EX T R A C T I O N S                  1   j =1;  k =1;  g =1;  Series =   ;   fl g =0   ; i =1; fl= no ’;          2   n wc j   =   NWordCo_Determination          /* By   using NWORDCO_EXTRACTION   alg .   Of  Fig ure .3  from                    line no.3      through line no.14           3   while  j   Length[L]   do                                                                                                    4     { 1   w hile   g   j   Le ng th [L ]   do   5     { 2   while    n wc j =     j   Length[L]   do   6         { j ++   ;   i =1; fl=’ no ’;   n wc j =   NWordCo_Determination }     7       If    n wc <>       j   Length[L]   then                /*determine the stimulation relation EDU             /* t nwc g   is a  testing   NWordCo  element  concept   Of  t nwcp              /*  w1   and  w2   is word1 and word2 of   t nwc g   8        {   t nwc g   n wc j   ;   9            If ( t nwc g .w1 Scue) ( t nwc g .(w1+w2) S cu e) then   10             { Series   Series     t nwc g   }   11           Else     g ++ ;   12           If     g 2   then   13            { j ++; i =1; fl=’ no ’; nwc j =   NWordCo_Determination }   14         } 3 } 2      15      If      t nwc 1           t nwc 2       then   16       { 4   while  k NumberOf_NWCPceElements     fl g =0   do                     /*  t nwcp t nwc 1 cause   +   t nwc 2 effect ;            17          { 5   If    t nwc 1   +   t nwc 2   match  nwcp ce - k   then   18          { Series Series ’CEpair’+ t nwc 1 + t nw c 2   fl g =1                 /*    t nwcp t nwc 2 cause + t nwc 1 effect   19          ElseIf     t nwc 2 + t nwc 1   match  nwcp ce - k   then   20           { Series Series ’CEpair’+ t nwc 2 + t n wc 1 ; fl g =1 };    21           k++   } } 4     ;      22     t nwc 1   t nwc 2   g = 2   ;   fl g =0;   nwc j ;   } 1   23   } Return Series       Fi g ure.   4   C E pai Seri e E x t rac t i o A l g o r i t hm     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   18 ,   N o .   2 M a y   20 2 :     970   -   97 8   978   [ 4]   L . C a r l s o n,   D .   M a r c u,   M . E .   O ku r o w s ki ,   B u i l di ng   a   D i s c o ur s e - T a g g e d   C o r pus   i t h e   F r a m e w o r o f   R he t o r i c a l   S t r uc t ur e   T he o r y ,   C ur r e nt   and   N e w   D i r e c t i ons   i n   D i s c ou r s e   a nd   D i al ogue ,   v o l . 22 ,   2003 ,   pp .   85 - 112 .   [ 5]   U .   R a j a ,   T .   M i t c he l l ,   T .   D a y ,   a nd  J .   M .   H a r d i n ,   T e x t   m i ni ng   i h e a l t hc a r e .   A ppl i c a t i o ns   a nd  o ppo r t un i t i e s ,   J .   o f   he al t h c ar e   i n f or m at i on   m an age m e nt ,   V o l .   22 ,   N o . 3 ,   pp . 52 - 56 ,   200 8 .   [ 6]   R . G i r j u ,   A u t om a t i c   de t e c t i on  of   c au s a l   r e l at i on s   f or   que s t i o an s w e r i ng ,   I P r o c .   o f   M ul t i S um Q A   ' 03   P r o c e e di ng s   o f   t he   A C L   2003  w o r ks ho o M u l t i l i ng ua l   s u m m a r i z a t i o a n qu e s t i o a ns w e r i ng ,   J a pa n,   2003 , pp . 76 - 83 .   [ 7]   Y . C a o ,   P . Z h a ng ,   J . G uo ,   a nd   L . G uo ,   M i ni ng   L a r g e - s c a l e   E v e nt   K no w l e dg e   f r o m   W e bT e xt ,   P r oc e di a   C om pu t .   Sc i . ,   V o l . 29 ,   p p. 478 487 ,   2014 .   [ 8]   T .   I nui ,   K .   I nui ,   a nd  Y .   M a t s um o t o ,   A c qui r i ng   c a us a l   kno w l e dg e   f r o m   t e xt   us i ng   t he   c o nne c t i v e   m a r ke r s ,   J .   of   t he   i nf or m a t i on   pr o c e s s i ng   s o c i e t y   of   J a pan ,   V o l . 45 ,   N o . 3,   pp . 91 9 - 933 ,   200 4.   [ 9]   C .   P e c hs i r i   a nd  R .   P i r i y a kul ,   E xp l a n a t i o kno w l e dg e   g r a ph  c o ns t r uc t i o t hr o ug c a us a l i t y   e xt r a c t i o f r o m   t e xt s ,   J .   of   C om p ut e r   Sc i e nc e   an T e c h nol ogy ,   V o l . 25 ,   N o . 5,   p p. 1 055 - 107 0,   201 0.   [ 10]   S . Z ha o ,   T . L i u ,   S . Z h a o ,   Y.   C h e n,   a nd   J - Y . N i e ,   E v e n t   c a us a l i t y   e xt r a c t i o ba s e o c o nne c t i v e s   a na l y s i s ,   N e ur oc om pu t i ng ,   V o l .   1 73 ,   pp. 1943 195 0,   20 16 .   [ 11]   P . M i r z a   a n S . T o ne l l i ,   C A T E N A : C A us a l   a nd   T E m po r a l   r e l a t i o e x t r a c t i o f r o m   N A t ur a l   l a ng ua g e   t e xt s ,   I n   P r oc .   of   C O L I N G ,   J a pa n , 20 16, pp . 64 - 75 .   [ 12]   H . S a w a m a r u   a nd   I .   K o ba y a s hi ,   A a pp r o a c t o   e x t r a c t i o o f   c a us a l   c ha i a m o ng   e v e nt s   i m u l t i p l e   do c um e nt s ,   SC I S - IS IS ,   J a p a n ,   2 012 ,   pp . 110 4 - 1108 .   [ 13]   F . F i g ue i r e do a ,   L . R o c ha ,   T . C o ut o ,   T . S a l l e s ,   M A . G o a l v e s ,   a n d   W . M e i r a J r ,   W o r c o - oc c ur r e nc e   f e a t u r e s   f o r   t e xt   c l a s s i f i c a t i o n,   I nf o r m a t i o Sy s t e m s ,   V o l . 3 6,   N o . 5 ,   pp. 843 - 858 , 2 01 1.   [ 14]   G - B . C he a nd  H - Y . K a o ,   W o r c o - o c c ur r e nc e   a ug m e n t e t o pi c   m o de l   i s ho r t   t e x t , I J C L C L P ,   V o l . 2 0,   N o . 2 ,   pp. 4 5 - 64,   20 15 .   [ 15]   M .   S e d i g hi ,   A ppl i c a t i o o f   w o r c o - o c c ur r e nc e   a na l y s i s   m e t ho i n   m a pp i ng   o f   t he   s c i e n t i f i c   f i e l d s   ( c a s e   s t u dy :   t he   f i e l d   o f   I nf o r m e t r i c s ) , L i b r a r y   R e v i e w ,   V o l . 65 ,   N o . ½ ,   pp . 52 - 64 ,   20 16.   [ 16]   X .   C he n ,   J .   C he n,   D .   W u,   Y .   X i e ,   a n J .   L i , M ap pi n t he   r e s e ar c h   t r e nds   b y   c o - w or ana l y s i s   bas e on  k e y w or ds   f r om   f unde pr oj e c t ,   P r o c e di a C o m put . S c i . , V o l . 9 1, D O I :   10. 10 16 / j . pr o c s . 2016 . 0 7. 1 40 ,   p p. 547     555 , 20 16 .   [ 17]   T . M .   M i t c he l l ,   M ac hi ne   L e ar ni ng .   T he   M c G r a w - H i l l   C o .   I nc . ,   a nd   M I T   P r e s s ,   S i ng a po r e ,   1 997 .   [ 18]   S . S ud pr a s e r t   a nd  A . K a w t r a ku l , T h ai   W or Se gm e nt at i on  ba s e on  G l oba l   and  L o c a l   U ns upe r v i s e L e ar ni ng ,”   N C S E C 2003   P r o c e e d i ng s ,   T ha i l a n d ,   20 03,   p p. 1 - 8.   [ 19]   H . C ha n l e kha   a nd   A .   K a w t r a kul ,   T h a i   N a m e d   E nt i t y   E xt r a c t i o b y   i nc o r po r a t i ng   M a x i m um   E n t r o p y   M o de l   w i t h   S i m pl e   H e ur i s t i c   I nf o r m a t i o n,   I P r o c .   I J C N L P ,   H a i n a n   I s l a nd ,   C h i na ,   2004 ,   pp . 1 - 7.   [ 20]   N .   T o ng t e p   a nd   T .   T h e e r a m un ko ng ,   P a t t e r n - ba s e E xt r a c t i o o f   N a m e E nt i t i e s   i T ha i   N e w s   D o c um e nt s ,   T ham m as a t   I n t e r na t i ona l   J ou r n a l   of   Sc i e nc e   an T e c hno l ogy ,   V o l . 15,   N o . 1,   p p. 7 0 - 81,   20 10 .   [ 21]   J . C h a r e o ns uk ,   T . S ukv a k r e e ,   a nd  A . K a w t r a ku l ,   E l e m e nt ar y   D i s -   c our s e   un i t   Se gm e nt at i on   f o r   T hai   us i ng   D i s c our s e   C ue   an S y n t ac t i c   I n f or m at i on ,   N C SE C 2 005   p r o c e e di n g s ,   T h a i l a n d,   20 05 ,   p p.   85 - 90 .   [ 22]   S .   S udp r a s e r t ,   A .   K a w t r a k ul ,   C hr i s t i a B o i t e t ,   a nd  V .   B e r m e n t ,   D e pe nd e nc y   P a r s i ng   w i t L a t t i c e   S t r uc t ur e s   f o r   R e s o ur c e - P o o r   L a ng ua g e s ,   I E I C E   T r ans ac t i o ns   on  I nf o r m a t i o and  Sy s t e m s , V o l . E 9 2 - D , N o . 10 , pp . 212 2 - 2136 , 200 9.   [ 23]   S . S i nt hupo un  a nd   O . S o r ni l ,   T ha i R he t o r i c a l   S t r uc t u r e   A na l y s i s ,   I J C SI S ,   V o l . 7 ,   N o . 1 ,   pp . 95 - 105 ,   201 0.   [ 24]   N .   K e t u i ,   T .   T h e e r a m un ko ng ,   a nd   C .   O ns uw a n ,   T ha i   e l e m e n t a r y   di s c o ur s e   u ni t   a na l y s i s   a nd  s y nt a c t i c - ba s e d   s e g m e nt a t i o n,   I N F O R M A T I O N ,   V o l .   1 6,   N o . 10 ,   pp. 7423 - 7 436 ,   20 13.     [ 25]   D. A l br i g ht ,   A . L a nf r a nc hi ,   A . F r e dr i ks e n ,   WF . S t y l e r ,   C . W a r ne r ,   J D . H w a ng ,   J D . C ho i ,   D . D l i g a c h,   R D . N i e l s e n ,   J . M a r t i n ,   W . W a r d,   M . P a l   - m e r ,   G K .   S a v o v a ,   T o w a r ds   c o m pr e he ns i v e   s y nt a c t i c   a nd  s e m a nt i c   a nno t a t i o ns   o f   t he   c l i ni c a l   na r r a t i v e ,   J o ur na l   of   t he   A m e r i c an   M e d.   I n f or m at i c s   A s s o c i at i o n ,   V o l . 2 0,   N o . 5 ,   p p. 922 - 30 ,   2013 .   [ 26]   G .   A .   M i l l e r ,   R .   B e c kw i t h ,   C .   F e l l ba um ,   D .   G r o s s ,   a nd  K .   M i l l e r , I nt r o duc t i o t o   W o r dN e t :   A O n - l i ne   L e xi c a l   D a t a b a s e ,   I n t e r nat i o nal   J our n al   o f   L e x i c o gr a phy ,   V o l .   3,   N o . 4 ,   pp. 1 - 86,   199 1.   [2 7 ]   C .   P e c hs i r i   a nd  R .   P i r i y a kul ,   E x t r a c t i o o f   a   g r o up - pa i r   r e l a t i o n :   pr o bl e m - s o l v i ng  r e l a t i o f r o m   w e b - bo a r do c um e nt s ,   S pr i nge r P l us ,   V o l .   5:   1265 .   D O I : ht t ps : / / do i . o r g / 10. 11 86/ s 400 64 - 016 - 286 4 - 3,   201 6.     Evaluation Warning : The document was created with Spire.PDF for Python.