I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   1 8 ,   N o .   2 M a y   20 20 ,   pp .   946 ~ 952   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 1 8 .i 2 . pp 946 - 952             946       Jou r n al   h o m e pa ge ht t p: / / i j e e c s . i a e s c or e . c om   A   f r a m e w o r k   f o r   n a m e d   e n t i t y   r e c o g n i t i o n   o f   c l i n i c a l   d a t a       R av i k u m ar   J 1 ,   R am ak an th   K u m ar   P 2   1 D e pa r t m e n t   o f   C S E ,   D r .   A m be dka r   I ns t i t u t e   o f   T e c hno l o gy ,   I ndi a   2 D e pa r t m e n t   o f   C S E ,   R . V .   C o l l e g e   o f   E ng i ne e r i ng ,   I ndi a       A r ti c l e   I n fo     A B S TR A C T   Ar t i c l e   h i s t or y :   R e c e i v e d   A ug   3 0,   201 9   R e v i s e O c t   20 ,   2 019   A c c e pt e N o v   6 ,   201 9       W i t e m e r g e nc e   o f   t e c hno l o g i e s   l i k e   b i g   da t a ,   t he   h e a l t hc a r e   s e r v i c e s   a r e   a l s o   be i ng   e xp l o r e d   t o   a pp l y   t hi s   t e c hno l o gy   a nd  r e a be n e f i t s .   B i g   D a t a   a n a l y t i c s   c a b e   i m p l e m e nt e d   a s   a   pa r t   o f   e - h e a l t h   w hi c h   i nv o l v e s   t he   e xt r a p o l a t i o n   o f   a c t i o na b l e   i n s i g ht s   f r o m   s o ur c e s   l i k e   h e a l t h   kno w l e dg e   ba s e   a nd  h e a l t h   i nf o r m a t i o s y s t e m s .   P r e s e nt   da y   m e di c a l   da t a   c r e a t e s   a   l o t   o f   i n f o r m a t i o c o ns i s t e n t l y .   A t   pr e s e n t ,   H o s p i t a l   I nf o r m a t i o S y s t e m   i s   a   qu i c kl y   de v e l o pi ng   i nno v a t i o n.   T h i s   da t a   i s   a   m a j o r   a s s e t   f o r   g e t t i ng   da t a   f r o m   g a t he r i ng   o f   g i g a nt i c   m e a s u r e s   o f   s ur g i c a l   i nf o r m a t i o by   f o r c i ng   a   f e w   que s t i o ns   a n w a t c hw o r ds .   B e   t ha t   a s   i t   m a y ,   t he r e   i s   i s s u e   o f   g e t t i ng   da t a   p r e c i s e l y   w ha t   t h e   c l i e n t   ne e d,   b e c a us e   H o s p i t a l   I nf o r m a t i o S y s t e m   c o nt a i n s   m o r e   t ha n   o ne   a r c hi v e   i de nt i f i e d   w i t h   a   s pe c i f i c   t h i ng ,   i nd i v i du a l   o r   e pi s o de   a nd  s o   o n.   I n f o r m a t i o e x t r a c t i o n   i s   o ne   o f   i nf o r m a t i o n   m i n i ng   s y s t e m s   u s e d   t c o n c e nt r a t e   m o de l s   po r t r a y i ng   e s s e n t i a l   i nf o r m a t i o c l a s s e s .   T he   p r o po s e w o r w i l l   w o r f o r   t he   m o s t   pa r t   c o nc e nt r a t i ng   o a c c o m pl i s h i ng   g r e a t   e xe c ut i o i n   M e d i c a l   D o m a i n .   F und a m e n t a l l y   t hi s   ha t w o   pr i m a r y   pur po s e s   o ne   w a s   s e pa r a t i ng   s i g ni f i c a nt   i nf o r m a t i o n   f r o m   pa t i e nt   c o nt e n t   r e c o r a nd   s e c o nd  o ne   l a b e l l i ng   na m e   s ubs t a nc e ,   f o r   e x a m pl e ,   i nd i v i dua l ,   a s s o c i a t i o n,   a r e a ,   m a l a dy   na m e   a n d   s y m pt o m s .   I m pr o v e   s ur v i v a l   r a t e s   a nd   t w e a k   c a r e   c o n v e nt i o ns   a nd   r e v i e w   i nqu i r i e s   t o   be t t e r   d e a l   w i t a ny   i nt e r m i na b l e   c o ns i de r a t i o po pu l a c e .   L o w e r   c o s t s   by   de c r e a s i ng   po i nt l e s s   ho s p i t a l i z a t i o ns .   A bbr e v i a t e   l e ng t h   o f   s t a y   w he c o nf i r m a t i o i s   f unda m e nt a l .   Ke y w or d s :   In f o r m a t i o e xt r a c t i o n   N a m e e n t i t y   r e c o gn i t i o n   S ur g i c a l   da t a   C opy r i gh t   ©   2020   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   R a v i kum a r   J ,   D e pa rt m e n t   o f   Co m put e S c i e n c e   a nd  E n g i n e e r i ng,   D r.   A m b e dka I n s t i t u t e   o f   T e c hn o l o g y ,   B e n ga l u ru ,   I n d i a .   E m a i l :   r a v i j 041@ d r - a i t . o r g       1.   I N TR O D U C TI O N     To   u n de r s t a nd  r e l e v a n t   pa rt s   p r e s e nt   i t h e   t e xt   a n d   t o   g a t h e i n f o r m a t i o f r o m   s e v e r a l   p i e c e s   of   t e xt ,   In f o r m a t i o n   E xt ra c t i o n   (I E s y s t e m s   a r e   us e d.   U s i n I E   s y s t e m s ,   t h e   r e l e v a n t   i n f o r m a t i o n   c a b e   pr o duc e a n pr e s e nt e i a   s t r uc t u r e d   f o r m a t   l i ke   r e l a t i o n s   (i t h e   da t a b a s e   s e n s e ).   T hi s   i s   a l s o   kn o w n   a s   k n o w l e dge   b a s e .   T h e   p ri m a r y   go a l   o f   t h e   IE   s y s t e m s   i s   o r g a n i z i n g   t h e   i n f o r m a t i o i a   w a y   t ha t   i s   us e f ul   t o   pe o pl e .   T h e s e   s y s t e m s   a l s o   put   i n f o r m a t i o n   i n   a   s e m a n t i c a l l y   a c c e pt a b l e   fo r m   s o   t ha t   f ur t h e i n f e r e n c e s   c a n   b e   m a de   b y   c o m put e a l go r i t hm s .   N o w   a   d a y s ,   e n o rm o us   a m o unt   o f   c l i ni c a l   da t a   i s   b e i n g   ge n e ra t e d   by   h e a l t o r g a ni z a t i o n s .   H e n c e ,   e xt ra c t i o o f   i n f o r m a t i o n   f r o m   t h e s e   c l i n i c a l   n o t e s   w i l l   e na b l e   t h e   i m p r o v e m e n t   o f   c l i n i c a l   w a r ds   w o r ks .   It   a l s o   h e l ps   t o   ge t   go o un de r s t a ndi n g   o f   pa t i e nt   c a r e   a nd   a l s o   t h e   di s e a s e   p r o gr e s s i o n.   T h e   ke y   po i n t   i n   unl o c ki n g   t h e   i n f o r m a t i o p r e s e nt   i t h e   c l i ni c a l   t e x t   i s   r e c o gn i z i n g   na m e e nt i t i e s .   I t h e   i n f o r m a t i o n   e xt ra c t i o p r o c e s s ,   a n   i m po r t a n t   s ub   t a s k   i s   na m e d   e nt i t y   r e c o gn i t i o n.   T h e   p r o c e s s   i n v o l v e s   n a m e e n t i t y   phra s e s   r e c o gn i t i o a n d   c l a s s i f y i n t h e m   i nt o   p a r t i c ul a c a t e go r i e s .   I t h e   m e di c a l   do m a i n ,   t h e   i m po r t a n t   c a t e go r i e s   a r e   p r o c e dur e s ,   c l i n i c a l   f i n d i n gs   a nd  d r ugs .   I t h e   l i t e r a t u r e ,   na m e d   e nt i t y   r e c o gn i t i o i s   o n e   o f   t h e   w i de l y   s t udi e a r e a   [1 - 4] .   T h e   c l i ni c i a n s   w ri t t e n o t e s   a r e   l e s s   s t r uc t u r e d   a n d   a r e   us u a l l y   i n   m i ni m a l   g r a m m a t i c a l   f o r m   w i t c r y pt i c   s h o r t   h a nd.   T hi s   po s e s   c h a l l e nge s   i n   na m e e nt i t y   re c o gn i t i o n.   P r i n c i pa l l y ,   N E R   s y s t e m s   a r e   e i t h e Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A   f r am e w or k   f or   n am e d   e n t i t y   r e c ogni t i on  o f   c l i ni c a l   da t a   ( R av i k um ar   J )   947   pa t t e rn  b a s e o r u l e   b a s e d.   B e c a us e   of   t h e   di v e r s e   w r i t i ng  s t y l e   of   i n di v i du a l   c l i ni c i a n s ,   t h e   pa t t e rn s   a n d   r u l e s   a r e   n o t   ge n e ra l i z a b l e .   T e c hn o l o gi e s   l i ke   m a c h i n e   l e a rni n a re   a l s o   n o t   f ul l y   a dv a n c e i N E R   b e c a us e   o f   l a c k   of   a v a i l a b l e   t ra i n i n g   d a t a .   N E R s   a r e   c a t e go r i z e i nt o   t hr e e   a pp r o a c h e s .   R ul e - b a s e a pp r o a c h e s ,   m a c hi n e   l e a rn i ng  b a s e a pp r o a c h e s   a n d   d i c t i o na r y   b a s e a pp r o a c h e s .   T h e   m a c h i n e   l e a rn i ng  b a s e s y s t e m s   fo c us   o n   c h o o s i n e f fe c t i ve   fe a t u r e s   f o r   b ui l di n g   c l a s s i f i e r s .   F o e xpe ri m e n t a t i o n,   s e v e r a l   m a c hi n e   l e a rn e r s   ha v e   b e e n   us e d.   S uppo rt   V e c t o r   M a c h i n e s   (S V M s )   [5]   a nd  H i dde n   M a r ko v   M o de l   (H M M )   [6]  a r e   e xa m p l e s   o f   s uc h   l e a rn e r s .   N a t u r a l   l a ngu a ge   p r o c e s s i n g   f o c u s e s   o n   de v e l o pm e nt   o f   m o de l s   t o   u n de r s t a nd   n a t u ra l   l a n gu a ge   [ 7].   T h e   N L P   f r a m e w o r i n c l ude s   m o dul e s   f o r   s y n t a c t i c   p r o c e s s i n l i ke   t o ke n i z a t i o n,   de t e c t i o n   o f   s e n t e n c e s   a n d   pa r t s - of - s pe e c h   t a ggi n g .   T h e   N L P   s y s t e m   a l s o   i n c l ude   m o dul e s   f o r   s e m a n t i c   p r o c e s s i n l i ke   na m e e n t i t y   r e c o gn i t i o t a ggi ng,   i de n t i f i c a t i o o f   c o n c e pt ,   e xt r a c t i o n   o f   re l a t i o n   a nd  a n a p h o r i c   r e s o l ut i o n.   A I n f o r m a t i o n   E xt ra c t i o s y s t e m   i s   a N L P   s y s t e m   t h a t   h a s   s e m a nt i c   p r o c e s s i n g   m o de l s   t o   e xt r a c t   i n f o r m a t i o t ha t   a r e   p r e - de f i n e d.   I t h e   m e di c a l   do m a i n,   N L P   s y s t e m s   a r e   us e by   r e s e a r c h e r s   t o   i de nt i f y   c l i ni c a l   s y n dr o m e s   a n d   b i o m e di c a l   c o n c e pt s   f r o m   t h e   r e po rt s   o f   ra di o l o g y   [8 a nd  di s c ha r ge   s um m a r i e s   [9] .   N E R   p r o c e s s   i n c l ude s   t a s ks   s uc h   a s   f i n d i n g ,   s t o r i n g   a nd  s o rt i ng  c o n t e n t   i nt o   c a t e go r i e s   s uc h   a s   t h e   pe r s o n ’s   na m e s ,   l o c a t i o n s ,   o r ga ni z a t i o n s ,   e xp r e s s i o o f   t i m e s ,   m o n e t a r y   v a l ue s ,   qu a n t i t i e s   a n d   pe r c e n t a ge s .   N E R   s y s t e m   e xt r a c t s   d a t a   di r e c t l y   f r o m   s e nt e n c e s   o f   pl a i E n gl i s h .   N E R   i s   a l s o   k n o w a s   i de n t i f i c a t i o o f   e nt i t y ,   e n t i t y   c h u n k i n g   a n d   e xt ra c t i o o f   e n t i t y .   It   i s   a i nt e l l i ge n c e   s y s t e m   t h a t   i s   s t a t e - of - t h e - a rt   t ha t   w o r ks   e qui v a l e nt   t o   h u m a b ra i n   i t e rm s   o f   e ff i c i e n c y .   F r o m   ra w   da t a ,   N E R   s y s t e m   f i nds   e n t i t y   e l e m e n t s   a n d   de t e r m i n e s   t h e   c a t e go r y   t o   w h i c t h e   e l e m e n t   b e l o n gs .   I t   r e a ds   a n d   hi g hl i g ht s   t h e   i m po rt a nt   e nt i t y   e l e m e n t s   i t h e   t e xt .   D e pe n d i n g   o t h e   p r o j e c t ,   N E R   m i g ht   b e   gi v e n   s e pa ra t e   s e n s i t i v e   e n t i t i e s .   T h e   s y s t e m   us e i o n e   p r o j e c t   m a y   n o t   b e   s ui t a b l e   f o r   a n o t h e r   pr o j e c t .   T h e   s y s t e m   a l s o   f a c e s   n u m e r o us   c ha l l e n ge s   s uc a s   c o rr e c t   i n f o r m a t i o e x t r a c t i o f o r   s pe c i f i c   b ut   c l o s e l y   r e l a t e c a t e go ri e s .   T h e   p r o c e s s   of   N E R   h a ppe n s   i s e v e r a l   s t e ps .   F i r s t ,   t h e   K n o w l e dge   b a s e   i s   t o   b e   b ui l t   w h i c h   c o n s i s t s   o f   kn o w n   N a m e E nt i t i e s .   T h e n,   l i n k i ng  o f   e n t i t y   t o   a   kn o w l e dge   b a s e   s h o ul ha ppe n .   T h i s   p r o c e s s   c o n s i s t s   o f   c o m po n e n t s   s uc h   a s   e xt r a c t o r s ,   s e a r c h e r s   a n di s a m b i gua t o r s .   E xt ra c t i o p r o c e s s   i n v o l ve s   i de nt i fy i n g   a n d   p r e pa ri n g   na m e d   e n t i t y   m e n t i o ns .   T h e   t a s ks   s uc a s   p a r t s   o f   s pe e c h   t a gg i n g ,   t o ke n i z a t i o n,   de t e c t i o n   o f   s e n t e n c e   b o un da r y ,   c a pi t a l i z a t i o n   rul e s   a n i n - do c um e nt   c o - r e f e r e n c e .   I n - do c um e nt   co - r e fe r e n c e   i s   us e t o   f i n d   m o r e   s pe c i f i c   s e a r c h   i t e m s .   I t h e   S e a r c h   p ha s e ,   t i t l e s ,   di s a m b i guo us   pa ge s   c a n   b e   l e v e r a ge t o   c a pt u r e   s y n o n y m s .   In  o r de r   t o   r e duc e   t h e   c o m put a t i o n,   a   s e a r c h e s h o ul b a l a n c e   p r e c i s i o a n d   r e c a l l   f o r   c a pt u ri n o f   c o rr e c t   e n t i t y .   I n   t hi s   pa pe r   w e   pr e s e nt   a   na m e e nt i t y   r e c o gn i z e r   us i n a   c l a s s i f i e r s   t o   f i n e nt i t i e s .       2.   R ELA TED   WO R K   N a m e e n t i t y   e xt ra c t i o i s   a   t y pe   of   i n f o r m a t i o r e t r i e v a l   w hi c f o c u s e s   o n   i de n t i f y i n i n s t a n c e s   i . e . ,   na m e s   o f   v a r i o us   t y pe s   of   e n t i t i e s .   F o e xa m pl e ,   c a n c e w o ul b e   a i n s t a n c e   o f   di s e a s e ;   s w e l l i n g   w o ul b e   a n   i n s t a n c e   o f   s y m pt o m s   a n d   s o   o n .   O n e   o f   t h e   e a rl i e s t   N E R   m o de l s   w a s   b a s e o n   de c i s i o n   t r e e   [10].   S e ki n e   de ve l o pe a   s y s t e m   w a s   de v e l o pe fo r   J a p a n e s e .   T h e   a u t ho r   us e f e a t u r e s   v i z .   P O S   (pa rt - of - s pe e c h t a gs   e xt ra c t e by   a   m o r p h o l o gi c a l   a na l y z e r ,   i n f o r m a t i o n   b a s e o n   c h a ra c t e a nd  s pe c i a l i z e d i c t i o na r y .   T h e   r e s e a r c h e r   p r e s e n t e t h e   a l go r i t hm   w h i c i n c l ude d   t w o   ph a s e s   o n e   f o r   de c i s i o n   t r e e   c r e a t i o n   f r o m   t ra i ni n d a t a   a n t h e   o t h e r   f o r   ge n e r a t i n g   t h e   t a gge o ut pu t   t h a t   i s   b a s e o t h e   de c i s i o n   t r e e .     A n o t h e e a rl y   w o r w a s   do n e   b y   B i ke l ,   S c h w a rt z   a nd  W e i s c he de l   [11].   A ut h o r s   us e H i dde n   M a r ko M o de l   (H M M t o   i de n t i fy   n a m e e nt i t y .   P r i m a r y   fe a t u r e s   l i ke   b i - g r a m   a n d   o rt h o g r a p hi c   f e a t u r e s   l i ke   w o r d   c a s e ,   w o r s ha pe   e t c .   w e r e   us e d.   T h e   a ut h o r s   e v a l u a t e d   t h e   m o de l   i E ngl i s h ,   S p a n i s a n d   o s pe e c i n pu t .   T qua n t i fy   t h e   pe r f o r m a n c e   o n   da t a   a v a i l a b l e   t o   t h e   c o m m u n i t y   (M U C - a n M E T - 1) ,   r e s ul t s   a r e   r e po r t e o n   s t a n d a r m a t e ri a l s   o nl y .   T h e   r e s ul t s   o b t a i n e ha v e   be e n   f ound  b e t t e r   c o n s i s t e nt l y   t ha n   a n y   o t h e r   l e a rni n a l go ri t hm .   B o r t h w i c [12]   i hi s   P h D   t h e s i s   us e m a xi m um   e nt r o p y   a l go r i t h m .   T hi s   t h e s i s   e xpl a i n s   a   s t a t i s t i c a l   na m e d - e n t i t y   r e c o gn i t i o s y s t e m   k n o w n   a s   M E N E   (M a xi m u m   E nt r o p y   N a m e d   E nt i t y ). It   u t i l i z e s   a   v e r y   f l e xi b l e   ob j e c t - b a s e a r c hi t e c t u r e   w h i c h   a l l o w s   i t   t o   m a ke   us e   o f   a   b r o a r a n ge   o f   kn o w l e dge   s o ur c e s   i n   m a k i n i t s   t a gg i n g   de c i s i o n s .   M c Ca l l um   a n d   L i   [ 13]   de v e l o pe Co n di t i o n a l   R a n do m   F i e l ds   b a s e a l go ri t hm   t o   e xt r a c t   N E R   i c o N L L - 2003  s h a r e d   t a s k   c o m pe t i t i o n .   T h e   w o r k   de s c r i b e W e b L i s t i n g   w h i c i s   a   m e t h o d   t o   o b t a i s e e ds   fo r   t h e   l e xi c o n s   f r o m   t h e   l a b e l e da t a .   It   t h e n   us e s   W e b   a n H T M L   fo r m a t t i n r e gu l a ri t i e s ,   s e r v i c e   of  s e a r c h   e n gi n e   f o r   a u gm e n t a t i o o f   t h o s e   l e xi c o n s .     S a ra w a gi   a nd  Co h e n   [ 14]   p r o po s e   a   s e m i   M a r ko v   CR F   (C o n di t i o na l   R a n do m   F i e l d)   a l go r i t hm   f o r   na m e e nt i t y   e xt ra c t i o n.   S e m i - CR F s   o ff e r   m uc h   o f   t h e   po w e o f   h i g h e r - o rde m o de l s .   T h e   m a j o r   a dv a n t a ge   i s   t h a t   i t   a l l o w s   f e a t ur e s   w h i c h   m e a s u r e s   p r o pe r t i e s   of   s e gm e n t s   t ha n   i n di v i du a l   e l e m e nt s .   T h e s e   fe a t u r e s   c a n   b e   qui t e   na t u ra l   f o r   a p pl i c a t i o n s   l i ke   N E R .   T h e   r e s e a r c h e r s   e x t e n de t h e i r   w o r w i t h   t h e   us e   o f   di c t i o n a r y   a n n o t i o n   o f   s i m i l a ri t y   f un c t i o n   [15] .   N a i du   a nd  S e ki n e   [16]   p rov i de   w i de   ove r a l l   s u r v e y   of   N E R   r e s e a r c h.   T h e   r e s e a r c h e r s   p r e s e nt e a   s u r v e y   of   15  y e a r s   o f   r e s e a r c h   i t h e   N E R f i e l f r o m   19 91  t o   2006 .   H a n dc r a f t e r u l e - b a s e a l go r i t h m s   w e r e   us e by   e a r l y   s y s t e m s .   M a c h i n e   l e a rni ng  t e c hni que s   a r e   b e i n us e i t h e   r e c e n t   s y s t e m s .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 8 ,   N o .   2 M a y   20 2 :     946   -   95 2   948   T h e   s u r v e y   of   t h e   t e c hni que s   w a s   c o n duc t e a s   w e l l   a s   o t he r   c r i t i c a l   a s pe c t s   o f   N E R s uc h   a s   f e a t u r e s   a nd  e v a l ua t i o m e t h o ds .   A r o n s o n   [17 de v e l o p e M e t a M a t o   m a b i o - m e di c a l   c o n c e pt s   f r o m   U n i f i e M e di c a l   L a n g ua ge   S y s t e m   (U M L S ).   M e t a M a p   i s   a   p r o g r a m   de v e l o pe a t   t h e   N L M   (N a t i o n a l   L i b ra r y   of   M e di c i n e t h a t   c a b e   us e t o   m a p   b i o m e di c a l   t e xt   t o   t h e   M e t a t h e s a u r us .   M e t a M a p   us e s   a   k n o w l e dge   i n t e n s i v e   a pp r o a c h   b a s e o n   s y m bo l i c ,   n a t u r a l   l a ngua ge   p r o c e s s i n (N L P a n c o m pu t a t i o n a l   l i n g ui s t i c   t e c hni que s .   T h e   r e s e a r c h e r s   de v e l o pe M e t a M a b a s e N L P   s y s t e m   i [18]  t ha t   e x t r a c t s   v a r i o us   e nt i t i e s   l i ke   t e m po ra l   i n f o r m a t i o n ,   c o r r e s po n d i n g   c o de s   f r o m   c l i n i c a l   n o t e s   by   m a t c h i n g   w i t h   U n i f i e M e di c a l   L a n gu a ge   S y s t e m   ( U M L S ).   In   t hi s   m e t h o d,   m a t c h i ng  o f   M e d L E E   ge ne r a t e s t r uc t u r e o ut put   t ha t   c o n s i s t s   o f   f i n di n gs   a n m o di f i e r s   t o   ge t   m o s t   s pe c i f i c   c o de .   Re c a l l   a nd  p r e c i s i o a pp l i e d   t o   U n i f i e M e di c a l   L a n gu a ge   S y s t e m   (U M L S c o di n g   w e r e   e v a l ua t e d.   T h e   r e s ul t s   w e r e   c o m pa r e d   w i t r e f e r e n c e   s t a n d a r d   de t e r m i n e i t h e   m a n u a l   m e t h o by   s e v e n   e xpe r t s .     M i n a r d   e t   a l .   [1 9]  p r o v e t ha t   t h e   de v e l o p e h y b r i a pp r o a c h   t h a t   i s   b a s e o n   b o t do m a i k n o w l e dge   a n d   m a c h i n e   l e a rni n g   g i v e s   b e t t e pe r f o r m a n c e .   T h e   w o r i s   c o m pa r e d   w i t m u l t i pl e   a p p r o a c h e s   b a s e o n   do m a i n - k n o w l e dge   a nd  m a c h i n e - l e a rn i ng  t e c hn i q ue s   t o   M e di c a l   E nt i t y   R e c o gn i t i o n. T h e   a pp r o a c h e s   r e l y   o n   m a c h i n e   l e a rn i ng  a nd  r u l e - b a s e d   m e t h o ds .   T o   e xt r a c t   f e a t u r e s   f r o m   t h e   i nput   t e xt s ,   N L P   i s   us e d.   L a t e r   t h e y   a r e   f e t o   m a c h i n e   l e a rni n g   m e t h o ds .   F o c o n c e pt   e x t r a c t i o n ,   t h e   r e s e a r c h e us e Co n di t i o na l   R a n do m   F i e l ds ,   a n d   S uppo r t   V e c t o r   M a c hi n e s   f o r   a s s e rt i o n   a n d   r e l a t i o n   a nn o t a t i o n .   T h e   a ut h o r s   t e s t e v a ri o us   c o m b i n a t i o n s   of  r u l e - b a s e a n d   m a c hi n e - l e a rni n g   m e t h o ds   de pe n di ng  o t h e   t a s k.   L i ,   S c h ul e r   a n d   S a v o v a   [20]  ha v e   us e bo t h   CR F   a n d   S V M   b a s e f o r   m o de l   e xt ra c t i o o f   di s o r de i c l i n i c a l   t e x t .   T h e   a u t h o r s   p r e s e n t e d   a   c o m pa ra t i v e   a na l y s i s   be t w e e n   s uppo rt   v e c t o r   m a c h i n e s   a n d   Co ndi t i o na l   R a n do m   F i e l ds   f o r   c l i ni c a l   na m e e nt i t y   r e c o gn i t i o n.   T h e   a ut h o r s   a l s o   e xpl o r e t h e   a p pl i c a b i l i t y   of   t h e s e   m e t h o ds   t o   c l i ni c a l   do m a i n.   T h e   o ut c o m e   of   t h e   c o m pa r i s o i ndi c a t e s   t ha t   CR F s   pe r f o r m   b e t t e r   t ha S V Ms  w h e n   e v a l ua t e a ga i n s t   a   s e t   o f   go l s t a nda r d   n a m e e n t i t i e s .   T h e   b e s t   F - s c o r e   w i t CR F s   i s   0 . 86  a n d   f o r   t h e   S V M s   i s   0 . 64   a s   c o m pa r e t o   a   b a s e l i n e   o f   0. 60 .   V a ri o us   t e c h ni que s   ha v e   b e e n   p r o po s e fo r   na m e d   e nt i t y   r e c o gn i t i o [21 - 25] .   B ut ,   t h e r e   e xi s t   s c o pe   fo r   i m p r o v e m e n t .       3.   D A TA   C O LL EC TI O N   T h e   da t a   s e t   us e d   f o r   t ra i ni n g   t h e   m o de l   i s   gi v e i t h e   T a b l e   1.       T a b l e   1 .   D a t a   S e t   D e t a i l s   D a t a   s e t   P u rp o s e   N o t e s   E n t i t i e s   E n t i t y   t y p e s   i 2 b 2   2 0 1 0   T ra i n i n g   349   2 7 , 8 3 7   P ro b l e m ,   T re a t m e n t     T e s t   477   4 5 , 0 0 9   T e s t       4.   TH E   P R O P O S ED   M O D EL   P a t i e n t s   h e a l t s t a t us ,   t e s t s   c o n duc t e d,   di s e a s e s   a n r e s po n s e   t o   t h e   t r e a t m e nt s   a r e   s t o r e i n   c l i n i c a l   r e c o r ds .   A n a l y s i s   of   s uc h   i n f o r m a t i o p r o v i de s   i m m e n s e   v a l ue   f o c l i ni c a l   p ra c t i c e ,   o r ga ni z a t i o a n d   m a na ge m e n t   o f   h e a l t h c a r e   s e r v i c e s .   Co n c e pt   e xt ra c t i o n   (C E a c t i v i t y   a i m s   t o   r e c o gn i z e   m e n t i o n s   t o   m e di c a l   c o n c e pt s   l i ke   p r o b l e m s ,   d i a g n o s i s   d a t a   (t e s t s )   a n d   t r e a t m e n t s   m e nt i o n e d   i t h e   c l i ni c a l   r e c o r ds .   (e . g. ,   p r o gr e s s   r e po rt s   a n d   di s c h a rge   s u m m a r i e s ).   F u rt h e t h e s e   i de n t i f i e d   c o n c e pt s   a r e   c l a s s i f i e i nt o   p r e de f i n e d   c a t e go ri e s .   T h e   c o n c e pt   i c l i ni c a l   d a t a   i s   us u a l l y   m e n t i o n e i t e xt   f o rm a t .   H e n c e ,   i t   i s   a   c ha l l e n g i n t a s f o r   N a t u r a l   L a n g ua ge   P r o c e s s i n s y s t e m s   t o   e xt ra c t   t h e s e   c o n c e pt s   a ut o m a t i c a l l y .     In  t h e   p r o po s e m o de l ,   m a c hi n e   l e a rni ng  m o de l   h a s   b e e n   us e t o   r e c o gn i z e   a nd  e xt ra c t   c o n c e pt s   f r o m   c l i n i c a l   da t a .   T hi s   w o r e m pl oy s   a   n e w   a pp r o a c h   k n o w a s   b i di r e c t i o n a l   L o n S h o r t   T e m   M e m o r y     Co n di t i o na l   R a ndo m   F i e l (L S T M - CR F i n i t i a l i z e w i t h   g e n e ra l - pu r po s e ,   o ff - t h e - s h e l f   w o r e m b e ddi n gs F i gu r e   1   de pi c t s   t h e   t ra i ni n g   f o r   na m e e n t i t y   de t e c t i o n .   F i gu r e   2   i n d i c a t e s   t h e   t ra i ni n g   f o r   na m e e n t i t y   bo un da r y   de t e rm i na t i o n .     H e   w a s   a dm i t t e d   t o   ICU   f o r   m e ni n gi t i s .   H e   w a s   c o n t i n ue o n   A c y c l ov i r       P o s i t i v e   e xa m pl e     N e ga t i v e   e xa m p l e     Ca n   o n l y   m e a n   di s o r de r     Ca nn o t   m e a di s o r de r     Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A   f r am e w or k   f or   n am e d   e n t i t y   r e c ogni t i on  o f   c l i ni c a l   da t a   ( R av i k um ar   J )   949       F i gu r e   1 .   T r a i n i ng  f o r   na m e e n t i t y   de t e c t i o n           F i gu r e   2 .   T r a i n i ng  f o r   na m e e n t i t y   bo un da r y   de t e r m i n a t i o n       T h e   i n p ut   s e que n c e   i s   x = (x1 , x2 , x3, …x m   ) ,   i . e . ,   t h e   w o r ds   of   a   s e nt e n c e   a nd  a   s e que n c e   o f   o ut put   s t a t e s   S = (s 1, s 2 , s 3, …s m   ),   i . e .   t h e   n a m e e n t i t y   t a gs .   I c o n d i t i o n a l   ra n do m   f i e l ds   t h e   c o n di t i o na l   p r o b a b i l i t y   P (s 1, s 2, s 3 , …s m |   x1 , x2 , x3 , …x m )   i s   m o de l e a s   t h e   o ut put   s t a t e   s e que n c e .   I t   h a s   b e e n   do n e   b y   de f i n i ng   a   f e a t u r e   m a p .         (1)     t h a t   m a ps   a e nt i r e   i n pu t   s e que n c e   pa i r e w i t a e nt i r e   s t a t e   s e que n c e   t o   s o m e   di m e n s i o n a l   f e a t u r e   v e c t o r .   T h e   p r o b a b i l i t y   a s   a   l o g - l i n e a m o de l   w i t h   t h e   p a r a m e t e v e c t o r   ha s   b e e n   m o de l e a s       R d   (2)       (3)     w h e r e   s ’  ra n ge s   o v e r   a l l   po s s i b l e   o ut put   s e que n c e s .   T h e   e xp re s s i o n   w   .   (x, s )   =   s c o r e   crf   (x, s )   c a n   b e   v i e w e a s   a   s c o r i n g   h o w   w e l l   t h e   s t a t e   s e que n c e   f i t s   t h e   gi v e n   i n pu t   s e que n c e .   T h e   i de a   i s   n o w ,   t o   r e pl a c e   t h e   l i n e a s c o r i n g   f un c t i o by   a   n o n - l i n e a n e u ra l   n e t w o r k.   H e n c e   s c o r e   c a n   b e   de f i n e a s ,     s c o r e   l s t m - crf   (x, s =   s i - 1, s . L S T M (x) i   + b   s i - 1 ,   s i   (4)   w h e r e   W s i - 1,   s a nd  b   a r e   t h e   w e i gh t   v e c t o r   a n t h e   b i a s   c o rr e s po n di n g   t o   t h e   t r a n s i t i o n   f r o m   s i - 1   t o   s i1 e s pe c t i v e l y .     T h e   s c o r e   f un c t i o n s   a r e   a l s o   c a l l e p ot e nt i al   f un c t i ons .   A f t e c o n s t ruc t i n g   t hi s   s c o r e   f un c t i o n,   t h e   c o n d i t i o n a l   pr o b a b i l i t y   p(S | : W , b c a b e   o pt i m i z e a s   i t h e   us ua l   CR F   a n d   p r o pa g a t i n g   b a c t hr o ug t h e   n e t w o r k.     In  t h e   i nput   s e n t e n c e ,   e a c w o r i s   f i r s t   m a ppe d   t o   ra n do m   v e c t o r   o a   v e c t o r   f r o m   a   w o r d   e m b e ddi ng.   W o r e m b e ddi ngs   a r e   v e c t o r   r e p r e s e nt a t i o o f   w o r ds   o f   na t u ra l   l a n gu a ge   t ha t   p r e s e r v e   t h e   s y n t a c t i c   a nd  s e m a n t i c   s i m i l a r i t i e s   b e t w e e n   t h e m .   T h e   v e c t o r   r e p r e s e nt a t i o n s   a r e   ge n e r a t e by   c o un t - b a s e d   a pp r o a c h e s   s uc a s   o t r a i n e m o de l s .   I i t s   e m b e dde r e p r e s e nt a t i o n,   e a c w or d   i a   t e xt   i s   r e p r e s e n t e d   by   a   r e a l - v a l ue d   v e c t o r ,   x,   o f   a r b i t ra r y   di m e n s i o n a l i t y ,   d.   F i gu r e   3   i ndi c a t e s   t h e   a l go ri t h m   us e f o r   na m e d   e nt i t y   r e c o gn i t i o n .   T o   c o n duc t   e xpe r i m e n t s ,   m o r e   t h a s o m e   c o n c e pt - a nn o t a t e d   re po r t s   a r e   t a ke n   f o t ra i ni n g;   t e s t i n g   a nd  r e s ul t s   a r e   e xa m i n e d   a f t e e xe c ut i o t hr o ug p r o po s e m e t h o do l o g y .   F i gur e   4   a n d   F i gu r e   6   i n d i c a t e   t h e   e xa m pl e   f o r   c l i n i c a l   r e c o r ds   a n d   F i gu r e   a n d   F i gu r e   a r e   p re s e n t   t h e   o ut p ut   o f   t h e   p r o po s e m e t h o d.     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 8 ,   N o .   2 M a y   20 2 :     946   -   95 2   950   S t e p   1   S ta r t   In p u t :   Cl i n i c a l   r e c o r d s   h a v i n g   p a t i e n t s   h e a l t h   s t a t u s ,   t e s t s   c o n d u c t e d ,   d i s e a s e s   a n d   r e s p o n s e   t o   t h e   t r e a t m e n t s .   T h e   i n p u t   s e q u e n c e   i s   x = (x 1 , x 2 , x 3 , x m   ).   S t e p   2   D e v e l o p m e n o C l a s s i fi c a t i o n   M o d e l   Id e n t i f i e d   c o n c e p t s   l i k e   p r o b l e m s ,   d i a g n o s i s   d a t a   (t e s t s )   a n d   t r e a t m e n t s   m e n t i o n e d   i n   t h e   c l i n i c a l   r e c o rd s   a re   c l a s s i f i e d   i n t o   p r e d e fi n e d   c a t e g o ri e s .   S t e p   3   F e e d   th e   tr a i n i n g   d a t a   to   m o d e l   T h e   r e c o rd s   a re   d i v i d e d   i n t o   t ra i n i n g   d a t a   a n d   t e s t i n g   d a t a .   7 0 %   o f   d a t a   i s   u s e d   a s   t ra i n i n g   d a t a   a n d   i t   i s   f e d   t o   t h e   m o d e l .   S t e p   4   F e e d   th e   te s d a t a   to   m o d e l   3 0   %   o t h e   d a t a   i s   u s e d   a s   t e s t i n g   d a t a .   T h e   d a t a   c o n s i s t i n g   o p a t i e n t s   i n f o r m a t i o n   a r e   fe d   t o   t h e   m o d e l   t o   t e s t   t h e   a c c u ra c y   o t h e   m o d e l   S t e p   5   F e e d   th e   c l i n i c a l   r e c o r d s   to   m o d e l   O n c e   t h e   m o d e l   i s   b u i l t ,   t h e   r e a l   d a t a   ( c l i n i c a l   r e c o rd s a r e   fe d   t o   t h e   p r e   d e v e l o p e d   m o d e l .   T h i s   g e n e ra t e s   o u t p u t   S t e p   6   O b ta i n   o u tp u t   T h e   o u t p u t   i s   t h e   d o c u m e n t   t h a t   i n c l u d e   l i s t   o f   w o rd s   t h a t   i n d i c a t e   p ro b l e m   d i a g n o s e d ,   t e s t   c o n d u c t e d   o t r e a t m e n t   g i v e n     S t e p   7   En d     F i gu r e   3 .   A l go r i t hm   s t e ps               F i gu r e   4 .   C l i ni c a l   r e c o r 1   F i gu r e   5 .   O u t put   o f   t h e   a l go ri t hm   f o r   c l i ni c a l   r e c o r d   1           F i gu r e   6 .   C l i ni c a l   r e c o r 2         F i gu r e   7 .   O u t put   o f   t h e   a l go r i t hm   f o r   c l i n i c a l   r e c o r 2       5.   R ES U LTS   A N D   D I S C U S S I O N S   T h e   pe r f o r m a n c e   c o m pa r i s o b e t w e e n   t h e   p r o po s e m e t h o a n e xi s t i n g   s t a t e   o f   t h e   a rt   C E   s y s t e m s   i n di c a t e   t ha t   t h e   b i di r e c t i o n a l   L S T M - CR F   i ni t i a l i z e w i t G l o V e   o ut pe r fo r m s   a l l   r e c e n t   a pp r o a c h e s .   T h e s e   r e s ul t s   a r e   n o t   d i r e c t l y   c o m pa r a b l e   s i n c e   t h e   s o m e   o f   t h e   p r e v i o us   w o r ks   h a v e   us e d   t h e   o r i gi na l   d a t a s e t   w hi c h   ha s   a   s i g ni f i c a n t l y   l a rge n u m b e r   o f   t ra i ni n g   s a m pl e s .   I ge n e ra l ,   t h e   r e s ul t s   a c hi e v e w i t t h e   p r o po s e d   a pp r o a c a r e   c l o s e   a n d   i m a n y   c a s e s   a b ov e   t h e   r e s ul t s   a c h i e v e by   s y s t e m s   b a s e o h a nd - e ngi n e e r e d   f e a t u r e s .   F i gu r e   i n d i c a t e s   t h e   p r e di c t i o n   a c c ura c y .   R e s ul t   c o m pa r i s o n   o f   pr o po s e m e t h o w i t h   o t h e r   s t a t e - o f - t h e - a r t   t e c hn i q ue s   s h o w n   i n   T a b l e   2 .   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A   f r am e w or k   f or   n am e d   e n t i t y   r e c ogni t i on  o f   c l i ni c a l   da t a   ( R av i k um ar   J )   951     T a b l e   2 R e s ul t   Co m p a r i s o n   o f   P r o po s e M e t h o w i t O t h e S t a t e - o f - T h e - A r t   T e c hni que s   M e t h o d   F - s c o r e   P ro p o s e d   M e t h o d   0 . 2 9 1   M e t a M a p [3 1 ]   0 . 1 1 3   Z E ’1 3 [1 3 ]   0 . 2 6 5           F i gu r e   8 .   P r e di c t i o a c c ura c y       6.   C O N C LU S I O N   In  t h i s   w o r k,   a   n e w   a pp r o a c h a s   b e e n   p r o po s e fo r   e x t r a c t i o o f   na m e d   e n t i t i e s   a n d   c l a s s i fy i n t h e m .   T h i s   i s   o f   i m m e n s e   us e   t o   p r a c t i t i o n e r s   a s   w e l l   a s   m a na ge m e nt   o f   t h e   h o s pi t a l s .   T h e   ke y   f i n di n g   o f   t h i s   w o r i s   i t s   a b i l i t y   t o   p r o v i de   e n d - to - e nd  r e c o gni t i o us i n g   ge n e r a l - pu rpo s e ,   of f - t h e - s h e l f   w o r e m b e ddi n gs .   T h i s   a v o i ds   a ddi t i o na l   e f fo r t s   f r o m   t i m e - c o n s um i n g   f e a t u r e   c o n s t r uc t i o n .   T h i s   w o r c a b e   a   go o c o n t r i b ut i o t o   a   r e s e a r c i n   t h e   a r e a   o f   N E R   e xt ra c t i o n   i n   c l i n i c a l   da t a .       R EF ER EN C ES   [ 1]   Z .   L i u,   X .   W a ng ,   Q .   C he n   a nd   B .   T a ng ,   " C h i ne s e   C l i ni c al   E nt i t y   R e c ogni t i on   v i a   A t t e n t i o n - B as e d   C N N - L ST M - C R F , "   I E E E   I nt e r na t i o na l   C o nf e r e nc e   o H e a l t hc a r e   I nf o r m a t i c s   W o r ks h o ( I C H I - W ) ,   N e w   Y o r k,   N Y ,   2 018 ,   pp .   68 - 69 ,   2018 .     [ 2]   Y e f e ng   W a ng ,   J o P a t r i c k,   C as c adi ng  C l a s s i f i e r s   f o r   N am e E n t i t y   R e c ogn i t i on   i C l i ni c al   N o t e s ,   W o r ks ho B i o m e di c a l   I nf o r m a t i o E xt r a c t i o n - B o r ov e t s ,   B ul g a r i a ,   pp .   42 - 49 ,   2 009.     [ 3]   Z e ng j i a n   L i u M i ng   Y a ng X i a o l o ng   W a ng ,   E nt i t y   r e   c og ni t i o n   f r o m   c l i ni c a l   t e x t s   v i a   r e c ur r e n t   ne ur a l   n e t w o r k ,   B M C   M e di c a l   I n f or m a t i c s   a nd  D e c i s i on   M ak i ng ,   17( S 2) .     [ 4]   M a x i m i l i a H o f e r A ndr e y   K o r m i l i t z i n P a ul   G o l dbe r g A l e j o   N e v a do - H o l g a do ,   F e w - s ho t   L e a r n i ng   f o r   N a m e d   E nt i t y   R e c og ni t i o i n   M e d i c a l   T e x t ,   a r X i v : 1811. 0546 8 , p p: 1 - 10, N O V   2018 .     [ 5]   T .   J o a c hi m s ,   C .   N e d e l l e c ,   a nd   C .   R o uv e i r o l .   T e x t   c at e go r i z at i on   w i t h   s u p por t   v e c t or   m ac hi ne s :   l e ar n i n w i t h   m any   r e l e v ant .   I n   M ac h i ne   L e ar n i n g :   E C M L - 98  10 t E ur o pe a C o nf e r e nc e   o M a c hi n e   L e a r ni ng ,   C h e m ni t z ,   G e r m a ny   S pr i ng e r ,   p p.   13 7 - 142 ,   1 998 .     [ 6]   L .   R a b i ne r   e t   a l .   A   t u t or i a l   on   h i dde n   M ar k ov   m ode l s   and   s e l e c t e appl i c at i on s   i n   s pe e c r e c o gni t i on . P r o c e e di ng s   o f   t he   I E E E ,   v o l .   77 ( 2) ,   pp .   257 - 286 ,   198 9.     [ 7]   S . M .   M e y s t r e ,   G . K .   S a v o v a ,   K . C .   K i ppe r - S c hul e r ,   J . F .   H ur d l e ,   E x t r a c t i ng   i nf o r m a - t i o f r o m   t e xt ua l   do c um e nt s   i n   t he   e l e c t r o ni c   he a l t h   r e c o r d :   A   R e v i e w   O f   R e c e n t r e s e a r c h” ,   Y e ar b   M e d.   I n f o r m .   35 ,   pp .   128 - 144 ,   200 8.     [ 8]   R . W . V .   F l y nn,   T . M .   M a c do na l d ,   N .   S c he m br i ,   G . D .   M u r r a y ,   A . S . F .   D o ne y ,   A ut o m a t e d   da t a   c a pt ur e   f r o m   f r e e - t e xt   r a d i o l o gy   r e po r t s   t o   e nha nc e   a c c ur a c y   o f   ho s pi t a l   i n pa t i e nt   s t r o ke   c o de s ,   P h a r m a c o e pi d e m i o l ,   D r ug   S a f .   1 9.     [ 9]   H.   Y a ng ,   I .   S pa s i c ,   J . A .   K e a ne ,   G .   N e na di c ,   A   t e x t   m i n i ng   a p pr o a c t o   t h e   pr e - d i c t i o o f   d i s e a s e   s t a t us   f r o m   c l i n i c a l   di s c ha r g e   s um m a r i e s ,   J .   A m .   M e d.   I n f o r m .   A s s oc ,   pp .   596 - 600 ,   20 09.     [ 10]   S e ki ne ,   S .   19 98.   N y u:   D e s c r i pt i on  of   t he   J apane s e   N E   S y s t e m   U s e F or   M et - 2 .   I P r o c .   M e s s a g e   U nde r s t a n di ng   C o nf e r e nc e ,   1998 .     [ 11]   B i ke l ,   D .   M . ,   S c hw a r t z ,   R . ,   &   W e i s c he d e l ,   R .   M ,   A a l g o r i t hm   t h a t   l e a r ns   w h a t ' s   i n   a   na m e .   M a c h i ne   L e ar ni n g v o l . 34,   pp .   2 11 - 231 ,   199 9.     [ 12]   B o r t hw i c k ,   A .   A   m a xi m um   e n t r o py   a ppr o a c t o   na m e e nt i t y   r e c og ni t i o n” .   P hD   di s s . ,   N e w   Y o r U ni v e r s i t y ,   1999 .     [ 13]   M c C a l l um ,   A   &   W e i   L .   E a r l y   r e s ul t s   f or   n am e e nt i t y   r e c ogn i t i o n   w i t c ond i t i o nal   r and om   f i e l ds ,   f e at ur e   i nd uc t i o and   w e b - e nhanc e l e x i c o ns .   I P r o c e e di ng s   o f   t he   s e v e nt h   c o nf e r e n c e   o N a t u r a l   l a ng ua g e   l e a r n i ng   a t   H L T - N A A C L   2003 - V o l um e   4,   pp .   188 - 19 1, 2003 .     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 8 ,   N o .   2 M a y   20 2 :     946   -   95 2   952   [ 14]   S a r a w a g i ,   S .   &   C o he n ,   W .   W .   S e m i - m a r ko v   c o ndi t i o na l   r a n do m   f i e l d s   f o r   i nf o r m a t i o e xt r a c t i o n” .   I A d v an c e s   i n   N e ur al   I n f or m at i on   P r oc e s s i ng   S y s t e m s pp .   1185 - 11 92.   2 004 .     [ 15]   C o he n,   W .   W . ,   & S a r a w a g i ,   S .   E x p l o i t i n di c t i ona r i e s   i n   nam e e n t i t y   e x t r a c t i on :   c om b i n i ng   s e m i m a r k ov   e x t r ac t i o pr oc e s s e s   a nd   da t a   i nt e gr a t i on   m e t ho ds .   I P r o c e e di ng s   o f   t h e   t e nt h   A C M   S I G K D D   i n t e r na t i o na l   c o nf e r e nc e   o n   K no w l e dg e   d i s c o v e r y   a nd  d a t a   m i n i ng ,   pp:   89 - 98. A C M ,   2 004 .     [ 16]   N a de a u,   D .   & S e k i ne ,   S .   A   s ur v e y   o f   na m e e n t i t y   r e c og ni t i o a nd  c l a s s i f i c a t i o n.   L i ng v i s t i c a e   I nv e s t i g a t i o ne s     pp.   3 - 26 ,   2007 .     [ 17]   A r o ns o A R .   E f f e c t i v e   m a pp i ng   o f   bi o m e di c a l   t e x t   t o   t he   U M L S   m e t a t he s a u r u s :   T he   M e t a   M ap pr o gr am ,   2001 .     [ 18]   F r i e dm a n ,   C . ,   S h a g i na ,   L . ,   L us s i e r ,   Y . ,   & H r i pc s a k,   G .   ( 2 004 ) .   A ut o m a t e E nc o di ng   o f   C l i n i c a l   D o c um e nt s   B a s e o N a t ur a l   L a ng ua g e   P r o c e s s i ng .   J o ur na l   o f   t he   A m e r i c an   M e di c a l   I nf or m a t i c s   A s s o c i a t i on   ( J A M I A ) ,   11 ( 5) ,     pp.   39 2 - 402,   2 004 .     [ 19]   M i n a r A L ,   L i g oz a t   A L ,   B e A ba c ha   A ,   e t   a l .   H y br i m e t ho d s   f o r   i m pr o v i ng   i nf o r m a t i o a c c e s s   i n   c l i n i c a l   do c um e nt s :   c o nc e pt ,   a s s e r t i o n,   a nd   r e l a t i o i de n t i f i c a t i o n” .   J   A m   M e I n f or m   A s s oc .   201 1; pp.   58 8 - 93,   20 11 .     [ 20]   L i ,   D . ,   K i p pe r - S c hul e r ,   K . ,   & S a v o v a ,   G .   C ond i t i o na l   r and om   f i e l d s   and  s up por t   v e c t o r   m a c h i ne s   f o r   d i s or de r   nam e d   e nt i t y   r e c o gni t i on  i n   c l i n i c al   t e x t s .   I P r o c e e di ng s   o f   t he   w o r ks ho o c ur r e n t   t r e nds   i n   b i o m e di c a l   na t ur a l   l a ng ua g e   pr o c e s s i ng ,   pp .   94 - 95 .   A s s o c i a t i o f o r   C o m put a t i o na l   L i ng ui s t i c s ,   2 008.     [ 21]   O .   G h i a s v a nd   a nd   R .   J .   K a t e ,   " B i om e di c a l   N am e d   E n t i t y   R e c ogn i t i o n   w i t h   l e s s   S upe r v i s i on " .   I nt e r na t i o na l   C o nf e r e nc e   o H e a l t hc a r e   I nf o r m a t i c s ,   D a l l a s ,   T X ,   pp .   495 - 495 ,   201 5.     [ 22]   H .   T .   L e ,   R .   C .   S a m ,   H .   C .   N g uy e a nd   T .   T .   N g u y e n,   " Na m e e nt i t y   r e c ogn i t i o n   i n   v i e t nam e s e   t e x t   us i n g   l a be l   pr opa ga t i o n " .   I nt e r na t i o na l   C o nf e r e nc e   o S o f t   C o m put i ng   a nd   P a t t e r n   R e c o g ni t i o ( S o C P a R ) ,   H a no i ,   pp.   3 66 - 370 ,   2013 .     [ 23]   S .   S .   S o na w a n e   a nd   P .   A .   K u l ka r n i ,   " E nt i t y   bas e d   c o - r e f e r e nc e   r e s o l ut i on   w i t h   nam e   e n t i t y   r e c ogn i t i o us i ng   hi e r ar c hi c a l   c l a s s i f i c at i on " .   A nnua l   I E E E   I ndi a   C o nf e r e nc e   ( I N D I C O N ) ,   N e w   D e l hi ,   pp .   1 - 6 ,   2015 .     [ 24]   S .   P .   T r i p a t hi   a n H .   R a i ,   " Si m N E R - A n   A c c ur at e   and   F as t e r   A l g or i t hm   f or   N am e E n t i t y   R e c o gni t i on " ,   S e c o nd   I nt e r na t i o na l   C o nf e r e nc e   o A dv a nc e s   i n   C o m put i ng ,   C o nt r o l   a nd   C o m m uni c a t i o T e c hno l o gy   ( I A C 3T ) ,   A l l a ha ba d,   I ndi a ,   p p.   11 5 - 119 ,   2018 .     [ 25]   F .   S u   a nd   C .   X i a o ,   " A   C om p l e x   N am e E nt i t i e s   E x t r a c t i on   M o d e l   O r i e nt e d   W e V i de o , "   S e c o nd  I nt e r na t i o na l   W o r ks ho o E duc a t i o T e c hno l o gy   a nd  C o m put e r   S c i e nc e ,   W uha n,   pp .   276 - 279 ,   201 0.         B I O G R A P H I ES   O F   A U T H O R S         M r .   R a v i kum a r   J   W o r ki ng   a s   A s s i s t a n t   p r o f e s s o r   a t   D r .   A m be dka r   I ns t i t u t e   o f   T e c hno l o gy ,   B e ng a l u r u,   h a v i ng   a bo u t   8   y e a r s   o f   T e a c hi ng   a nd   1   y e a r   o f   i ndus t r y   E xpe r i e nc e   a nd   a r e a   o f   I nt e r e s t   i s   D i g i t a l   I m a g e   pr o c e s s i ng ,   c o m put e r   n e t w o r k s   a nd   I O T         D r   R a m a ka n t h   K um a r   P   W o r ki ng   a s   P r o f e s s o r   &   H o D   D e pa r t m e nt   o f   C o m put e r   S c i e nc e   a n E ng i ne e r i ng ,   ha v i ng   25   y e a r s   o f   T e a c hi ng   a n 14   y e a r s   o f   R & D   E xpe r i e nc e   a nd  a r e a   o f   i n t e r e s t   i s   D i g i t a l   I m a g e   P r o c e s s i ng ,   P a t t e r n   R e c o g ni t i o n,   N a t ur a l   L a ng ua g e   p r o c e s s i ng   e t c     Evaluation Warning : The document was created with Spire.PDF for Python.