I n t e r n at ion al   Jou r n a l   of   I n f o r m at ics   an d   Com m u n icat ion   T e c h n ol ogy  ( I J - I CT )   Vo l .   1 4 ,   N o .   3 De c e m b e r   20 2 5 ,   pp.   881 ~ 8 9 1   I S S N:  2252 - 8776 DO I 10 . 11591/i ji c t . v 1 4 i 3 . pp 88 1 - 8 9 1             881       Jou r n al  h o m e page ht tp: // ij ict . iaes c or e . c om   R e v ie w  o f  N L P  i n   E M R :  ab b r e v ia t io n , d ia gn os is , an d  ICD   c la ssi f ic at io n       Nur u l   Ani s   B al q is   I q b al   B as h e e r 1 ,   S h ar if a l i ll ah   Nor d in 1 ,   S az z l S h ah l an   K as im 2 Az l i z M oh d   A l i 1 Nurz e at u l   Ham im ah   Abd u l   Ham id 1   1 F a c ul t y   of  C omput e r  a nd M a th e ma ti c a S c ie n c e s , U ni ve r s it T e kn o l o gi  M A R A , S ha h A la m, S e la ng o r , M a la y s ia   2 C a r di ov a s c u la r  A d v a nc e m e nt  a nd R e s e a r c E x c e ll e n c e  I ns ti tu t e  ( C A R E  I ns ti tu t e )  U ni ve r s it T e kn o l o g M A R A , S e la ngor , M a la y s ia       Ar t ic l e   I n f o     AB S T RA CT     A r ti c le  h is tor y :   R e c e i ve Oc t   24,   2024   R e vi s e J a n   2,   2025   A c c e pt e J un   9,   2025       T h i s   r e v i ew   e x p l o r e s   s t at e - of - the - art   n at u ra l   l a n g u ag p ro ce s s i n g   (N L P)   me t h o d s   ap p l i e d   t o   e l ec t ro n i c   med i c a l   r ec o r d s   (E MRs fo k ey   t as k s   s u ch   as   e x p an d i n g   me d i c al   ab b re v i at i o n s ,   a u t o m at ed   d i ag n o s i s   g e n e rat i o n ,   i n t e r n at i o n al   c l as s i fi c at i o n   o f   d i s e as e s   ( I C D )   cl as s i fi c a t i o n ,   an d   e x p l ai n i n g   mo d e l   o u t c o me s .   W i t h   t h e   g ro w i n g   d i g i t i zat i o n   o f   h e a l t h c ar e   d at a,   t h c o m p l e x i t y   o f   E MR   an a l y s i s   p r e s en t s   s i g n i f i c an t   ch al l e n g e   f o a ccu rat an d   i n t e rp re t ab l e   r e s u l t s .   T h i s   p ap e e v a l u at e s   v ar i o u s   me t h o d o l o g i e s ,   h i g h l i g h t i n g   t h ei s t ren g t h s ,   l i mi t at i o n s ,   a n d   p o t en t i al   f o i m p ro v i n g   c l i n i c al   d eci s i o n - m ak i n g .   Sp eci al   at t e n t i o n   i s   g i v en   t o   ab b re v i at i o n   e x p an s i o n   as   a   c ru ci al   s t e p   f o d i s a m b i g u at i n g   t e r m s   i n   t h e   cl i n i c a l   t e x t ,   fo l l o w ed   b y   a n   e x p l o rat i o n   o au t o - d i a g n o s i s   mo d el s   an d   I CD   co d e   as s i g n m en t   t ech n i q u e s .   Fi n a l l y ,   i n t e rp re t ab i l i t y   me t h o d s   l i k e   i n t e g rat e d   g rad i e n t s   an d   at t e n t i o n - b as ed   ap p ro ac h e s   ar e   r ev i ew ed   t o   u n d e rs t an d   m o d e l   p re d i c t i o n s   an d   t h ei r   ap p l i c ab i l i t y   i n   h e al t h c ar e .   T h i s   r e v i ew   a i m s   t o   p ro v i d c o m p r e h en s i v g u i d e   f o r e s e ar c h e rs   a n d   p ra c t i t i o n e rs   i n t e r e s t e d   i n   l ev e rag i n g   N L f o r   c l i n i c al   t e x t   an al y s i s .   K e y w o r d s :   D i a g n o s i s   E M R   E x pa n d i ng  a bb r e vi a t i o n s   I C c l a s s i f i c a t i o n   NL P   R e vi e w   Th i s   i s   a n   o p en   a c ces s   a r t i c l u n d e r   t h CC  B Y - SA   l i cen s e.     C or r e s pon din A u th or :   S h a r i f a li ll a h   No r di n   F a c u l t y   o f   C o m put e r   a n M a t h e m a t i c a l   S c i e n c e s ,   Uni ve r s i t i   T e k n o l o g i   M A R A   S h a h   Al a m ,   S e l a n go r ,   M a l a y s i a     E m a i l s h a r if a li l l a h@u i t m . e du. m y       1.   I NT RODU C T I ON    E l e c t r o ni c   m e d i c a l   r e c o r ds   ( E M R s )   s e r v e   a s   c om pr e h e n s i ve   d i g i t a l   r e po s i t or i e s   f o r   pa t i e n t   da t a ,   c e n t r a l i z i ng  pa t i e n t   de m o gr a phi c s ,   m e d i c a l   hi s t o r i e s ,   t e s r e s u l t s ,   a n t r e a t m e n t s   [ 1] - [ 4 ] .   W hil e   E M R s   h a ve   t r a n s f o r m e h e a l t h c a r e   by   s t r e a m li ni ng  da t a   m a na ge m e n t ,   t h e y   a l s o   i n t r o duc e   s i g ni f i c a n t   c h a l l e n g e s   due   to  t h e   s h e e r   v o l u m e   a n c o m p l e xi t y   o f   t h e   da t a .   He a l t h c a r e   pr o vi d e r s   a r e   o f t e n   o v e r w h e lm e by   t h e   n e e t n a vi ga t e   a n upda t e   t h e s e   e x t e n s i ve   r e c o r ds ,   l e a d i n t o   c o gni t i v e   o v e r l o a a n po t e n t i a l   b ur n o ut   [ 5] .   F ur t h e r m o r e ,   E M R s   c o n t a i n   a   l a r ge   a m o u n t   o f   un s t r uc t ur e da t a ,   whi c h   po s e s   d i f f i c u l t i e s   f o r   tas ks   li ke   a ut o m a t e d i a g n o s i s   ge ne r a t i o n   a n i n t e r n a t i o n a c l a s s i f i c a t i o n   o f   d i s e a s e s   ( I C D )   c l a s s if i c a t i o n   c r i t i c a l   f o r   pa t i e n t   c a r e ,   bi l li ng,   a n h e a l t h c a r e   m a n a ge m e n t   [ 6] - [ 8] .   T h e   I C i s   a   g l o b a ll y   r e c o gni z e s y s t e m   f o r   c o di n d i s e a s e s   a n h e a l t h   c o n d i t i o ns ,   pl a yi ng  a   vi t a l   r o l e   i n   c li ni c a l   de c i s i o n - m a k i n g,   he a l t h   m a n a g e m e n t ,   a n e p i de mi o l o g y   [ 9] - [ 13] .   Ho we v e r ,   a s s i g ni ng   a c c ur a t e   I C c o de s   o f t e n   i nv o l v e s   m a n ua l   i nput   f r o m   m e d i c a l   c o de r s ,   whi c h   i n t r o duc e s   t h e   r i s o f   h u m a e r r o r   a n i n e f f i c i e nc y .   M i s i n t e r pr e t a t i o n   o f   c l i n i c a l   n o t e s ,   pa r t i c u l a r l y   u n s t r uc t ur e da t a ,   c a n   l e a t o   c o di n i na c c ur a c i e s ,   c o m pr o m i s i ng  bil li ng  a c c ur a c y   a n he a l t h c a r e   qua l i t y   [ 3] ,   [ 14] - [ 17] .   R e l yi ng  s o l e ly   o n   s t r uc t ur e d   da t a   i n   h e a l t h c a r e   ov e r l o o ks   t h e   c o m p l e xi t y   a n r i c hn e s s   o f   pa t i e n t   i n f o r m a t i o n ,   a s   i t   i s   l im i t e t pr e de f i ne c a t e go r i e s   li ke   d i a g n o s i s   c o de s   a n l a b   r e s u l t s .   T hi s   c a n   mi s s   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2252 - 8776   I n t   J   I n f   &   C o m m u n   T e c hn o l Vo l .   1 4 ,   N o.   3 De c e m be r   20 2 5 :   881 - 8 9 1   882   c r i t i c a l   c o n t e x t   f o un i n   u ns t r uc t u r e da t a ,   s uc a s   de t a i l e s ym pt o m   de s c r i pt i o ns ,   t r e a t m e n t   p l a ns ,   a n d   pr o g r e s s   n ot e s ,   whi c h   a r e   vi t a l   f o r   pe r s o n a l i z e c a r e   a n a c c ur a t e   di a g n o s e s .   A dd i t i o n a ll y ,   t h e   pe r v a s i ve   us e   o f   m e d i c a l   a bb r e vi a t i o n s   i n   E M R s   po s e s   uni que   c h a l l e n g e s ,   a s   t h e i r   m e a ni ng s   o f t e n   de pe n o n   c o n t e x t .   M i s i n t e r pr e t a t i o n   c a n   l e a to   i n c o r r e c t   di a g n o s e s ,   i m pr o pe r   I C c l a s s i f i c a t i o ns ,   a n c o m pr o m i s e pa t i e n t   o u t c o m e s ,   hi g hli g h t i n t h e   n e e to   i n t e gr a t e   s t r u c t ur e d   a n un s t r uc t ur e d   da t a   f o r   c o m pr e h e ns i ve   de c i s i o n - m a k i ng .   T h e   b e s t   a ppr o a c h ,   t h e r e f o r e ,   i s   t c o m bi ne   b o t h   s tr uc t ur e d   a n un s t r uc t ur e d   da t a .   L e v e r a g i ng   n a t ur a l   l a n gua ge   pr o c e s s i n ( NL P )   t e c hni que s   a ll o ws   h e a l t h c a r e   pr o vi de r s   to  i n t e gr a t e   s t r uc t ur e d,   e a s i ly  a c c e s s i bl e   i n f o r m a t i o n   w i t h   t h e   r i c h   de t a i l   f o u nd  i n   uns t r uc t ur e da t a .   T hi s   c o m bi na t i o n   e n a bl e s   a   m o r e   c o m pr e h e ns i ve   vi e o f   pa t i e n t   h e a l t h ,   e nh a n c e s   d iagn o s i s   a c c ur a c y ,   im pr o v e s   t r e a t m e n t   pl a n s ,   a n u l t i m a t e ly   l e a d s   to   b e tt e r   pa t i e n t   o u t c o m e s .   C o m bi n i ng  b o t h   da t a   t y pe s   a l s o   i m pr o v e s   t h e   e f f i c a c y   o f   a ut o m a t e s y s t e m s ,   s uc h   a s   I C c l a s s if i c a t i o n   a n d i a g n o s i s   ge ne r a t i o n ,   m a k i ng  he a l t h c a r e   m o r e   i n t e l li ge n t   a n da t a - dr i v e n .   NL P   o f f e r s   po we r f u l   m e t h o ds   to   a dd r e s s   t h e s e   i s s ue s .   NL P   t e c h ni que s   c a n   pr o c e s s   a n t r a n s f o r m   un s t r uc t ur e c l i ni c a l   t e x t   i n t o   a c t i o n a bl e   i ns i g h t s ,   e n a bli ng  m o r e   e f f i c i e n t   da t a   h a n d li ng,   s uppo r t i ng  c l i n i c a l   de c i s i o n - m a k i ng,   a n i m pr o vi ng  pa t i e n t   c a r e   [ 18] - [ 20] .   I n   t hi s   r e vi e w,   we   f o c us   o n   NL P   s o l ut i o n s   f o r   f o ur   c r i t i c a l   E M R - r e l a t e t a s ks e x pa n d i ng  a bb r e vi a t i o n s ,   ge ne r a t i n a ut o m a t e di a g n o s e s ,   a s s i g ni ng  I C c o de s ,   a n i n t e r pr e t i n m o de l   pr e d i c t i o n s .   On e   m a j o r   c h a ll e n g e   i n   E M R   i n t e r pr e t a t i o n   i s   t h e   pe r v a s i ve   us e   o f   m e d i c a l   a bb r e vi a t i o ns ,   whi c h   c a v a r y   gr e a t l y   de pe n d i ng  o n   c o n t e x t .   M i s i n t e r pr e t i n a bb r e vi a t i o n s   c a n   r e s u l t   i n   i nc o r r e c t   di a g no s e s   o r   im pr o pe r   I C c l a s s if i c a t i o n s ,   u l t i m a t e l y   a f f e c t i n pa t i e n t   c a r e   a n h e a l t h c a r e   da t a   i n t e gr i t y   [ 21] ,   [ 22 ] .   E x pa n d i ng  t h e s e   a bb r e vi a t i o ns   a c c ur a t e l y   i s   c r i t i c a l   t e n s ur e   t h e   r e l i a bi li t y   o f   d i a g n o s e s   a n I C a s s i g nm e n t s .   T r a di t i o n a l   m a c hi ne   l e a r ni ng  m e t h o ds ,   s uc h   a s   s uppo r v e c to r   m a c hi ne s   ( S VM )   a n r a n do m   f o r e s t s ,   h a v e   b e e n   a pp li e i n   t hi s   f i e l d,   b ut   t h e i r   r e l i a n c e   o n   s t r uc t u r e da t a   m a ke s   t h e m   l e s s   e f f e c t i v e   f o r   pr o c e s s i n g   un s t r uc t ur e d   c l i n i c a l   n o t e s ,   whi c h   r e qu i r e   e x t e n s i ve   f e a t ur e   e n g i ne e r i n a n do m a i n   e x pe r t i s e   [ 19] - [ 22] .   Ne we r   NL P   m e t h o ds ,   h o we v e r ,   a r e   we l l - s u i t e to  h a n d li ng  uns t r uc t u r e da t a   i n   E M R s   a n c a n   im pr o v e   e f f i c i e nc y   by   a ut o m a t i n t h e s e   t a s ks .   Al t h o ugh   r e s e a r c h   h a s   f o c us e o n   e a c h   o f   t h e s e   a r e a s   i n d e pe n de n t l y ,   li mi t e wo r h a s   i n t e gr a t e d   a bb r e vi a t i o n   e x pa ns i o n ,   a uto m a t e d i a g n o s i s ,   I C c l a s s if i c a t i o n ,   a n m o de l   i n t e r pr e t a t i o n   i n t o   a   uni f i e d   f r a m e wo r k.   T hi s   r e vi e e v a l ua t e s   r e c e n t   m e t h o do l o g i e s   ( 2019 2024) ,   hi g hl i g h t s   t h e i r   s t r e n gt h s   a n d   li mi t a t i o ns ,   a n e x p l o r e s   pot e n t i a l   f ut ur e   de v e l o p m e n t s .   Ul t i m a t e l y ,   t hi s   r e vi e s e e ks   to   p r o vi de   a   c o m pr e h e ns i ve   pe r s pe c t i v e   o n   h o NL P   c a n   a ddr e s s   t h e s e   c h a ll e n ge s ,   i m pr o v e   E M R   u s a bil i t y ,   a n d   e nh a nc e   t h e   qua l i t y   o f   h e a l t h c a r e   de l i ve r y .         2.   RE S E AR CH  M E T HO   T hi s   s e c t i o n   o u t l i ne s   t h e   pr o c e dur e s   f o l l o we t c o n duc t hi s   r e vi e w.   T h e   pr o c e s s   b e g i ns   by  f o r m u l a t i n r e s e a r c h   que s t i o ns   t h a t   a ddr e s s   m u l t i p l e   ke y   t o pi c s .   B a s e o n   t h e s e   que s t i o n s ,   r e l e va n t   k e y wo r ds   a n li t e r a t ur e   a r e   i de n t i f i e a n s e a r c h e d.   S ub s e que n t l y ,   i nf o r m a t i o n   f r o m   e a c h   s o ur c e   i s   e x t r a c t e a n a n a ly z e to  hi g hl i g h t   t h e   d i f f e r e n c e s   b e t we e n   t h e   v a r i o us   a ppr o a c h e s .   F i gur e   i l l u s t r a t e s   t hi s   pr o c e s s ,   whi c c o n s i s t s   o f   f i ve   e s s e n t i a l   s t e ps .   E a c h   o f   t h e s e   s t e ps   i s   e x p l a i ne i n   de t a i l   i n   t h e   f o l l o w i ng  s u b s e c t i o n s .           F i gur e   1.   R e vi e pr o c e dur e       2. 1.     Re s e ar c h   q u e s t ion s   G i v e n   t h e   c o m p l e xi t y   o f   i n t e r pr e t i n E M R s   f o r   a bb r e vi a t i o n   e x pa n s i o n ,   a uto m a t i c   d i a g n o s i s ,   a n d   I C c l a s s i f i c a t i o n ,   t a r ge t e r e s e a r c h   que s t i o n s   a r e   e s s e n t i a l .   C li n i c a l   n o t e s   a r e   o f t e n   a m b i guo us   a n c o n t e x t - de pe n d e n t ,   y e t   s t udi e s   a ddr e s s   t h e s e   t a s ks   s e pa r a t e l y .   T h e   f i r s t   r e s e a r c h   que s t i o n   i s :   1)   W hy   do e s   E M R   a n a ly s i s   us u a l ly   f o c us   o n   t a s ks   li ke   a bb r e vi a t i o n   e x p a n s i o n ,   a uto m a t i c   d i a g n o s i s ,   o r   I C c l a s s i f i c a t i o n   s e pa r a t e l y ,   a n n o t   a dd r e s s   a l l   th e s e   a r e a s   to ge t h e r ?   T h e   s e c o n r e s e a r c h   que s t i o n   e x p l o r e s   t h e   ke y   m e t h o ds   a n r e qu i r e m e n t s   f o r   e f f i c i e n t   E M R   de c i p h e r in g:   2)   W h a t   m e t h o ds   a r e   us e to   de c i p h e r   E M R s ,   s uc h   a s   e x p a n d i n a bb r e vi a t i o n s ,   a uto m a t i c   d i a g n o s i s ,   a n d   I C c l a s s i f i c a t i o n ,   a n wh a t   c h a r a c t e r i s t i c s   a r e   n e e de f o r   t h e s e   m e t h o ds   to  b e   s uc c e s s f u l ?   Re s e arc h   Q u e s t i o n s Se arc h   K e y w o rd s L i t e rat u re   Se arc h K n o w l ed g e   E x t rac t i o n K n o w l ed g e   E x c l u s i o n Evaluation Warning : The document was created with Spire.PDF for Python.
I n t   J   I n f   &   C o m m u n   T e c hn o l     I S S N:   2252 - 8776       R e v ie w   of   N L P   in  E M R :   abbr e v iat ion,   diagnos is ,   a nd  I C D   c las s if ication   ( N ur ul  A nis   B alqi s   I qbal  B as he e r )   883   F i na ll y ,   i de n t i f yi ng  a n o v e r c o m i ng  c h a ll e n ge s   i n   N L P   i m p l e m e n t a t i o n   i s   c r i t i c a l .   T h e   t hi r d   r e s e a r c que s t i o n   i s :   3)   W h a t   a r e   t h e   m a i n   c h a ll e n g e s   i n   u s i ng  NL P   f o r   E M R   t a s ks   l i ke   a bb r e vi a t i o n   e x pa n s i o n ,   a ut o m a t i c   d i a g n o s i s ,   a n I C c l a s s if i c a t i o n ,   a n h o c a n   t h e y   b e   o v e r c o m e ?   T h e s e   que s t i o ns   gu i de   t h e   r e vi e t e nh a n c e   a c c ur a c y   a n e f f i c i e n c y   i n   E M R   de c i p he r i n g.     2. 2.     S e ar c h   k e yw o r d s   an d   l it e r at u r e   s e a r c h   T hi s   s t ud y   us e da t a b a s e s   l i ke   I E E E ,   S c i e n c e D i r e c t ,   G oo gl e   S c h o l a r ,   W e b   o f   S c i e n c e   ( W o S ) ,   a n S c o pus ,   wi t h   m o s t   pa pe r s   s o ur c e f r o m   Goo gl e   S c h o l a r .   T h e   s e l e c t i o n   c r i t e r i a   we r e :   -   T h e   m e t h o wa s   de v e l o pe o r   a ppl i e b e t we e n   20 19  a n d   e a r l y   2024.   -   S t udi e s   f o c us i ng  o n   NL P   a pp l i c a t i o n s   i n   m e d i c a l   s e tt i n gs .   -   R e s e a r c h   o n   de c i p h e r i n E M R s ,   c l i ni c a l   n o t e s ,   or   m e d i c a l   n o t e s .   -   M e t h o ds   s pe c i f i c   to   a b b r e vi a t i o n   e x p a n s i o n ,   a uto m a t i c   d i a g n o s i s ,   or   I C c l a s s i f i c a t i o n .   F i gur e   i ll us t r a t e s   t h e   e v o l ut i o n   o f   s e a r c ke y wo r ds ,   i n c l ud i ng  " a ut di a g n o s i s , "   " I C D   c l a s s if i c a t i o n , "   " de c i p h e r i ng  c l i n i c a l   n ot e s   or   m e d i c a l   n ot e s , "   " NL P , "   a n " de c i p h e r i ng  E M R s , "   s h o w i n t h e   s e a r c h   t e r m s ,   r e s u l t s ,   a n s e l e c t e pa pe r s .   W e   b e g i by   s e a r c hi ng  f o r   pa pe r s   us i n t h e s e   ke y wo r ds   a n t h e s e l e c t   r e l e v a n t   l i t e r a t ur e ,   s uc h   a s   [ 23]   o n   I C c l a s s i f i c a t i o ns   a n [ 24]   o n   e x pa n d i ng  a bb r e vi a t i o ns   i m e d i c a l   n o t e s .   S o m e   a r t i c l e s   we r e   e x c l ude f o r   n ot   m e e t i ng  t h e   c r i t e r i a ,   i n c l ud i ng  dup l i c a t e s .           F i gur e   2.   S e a r c h   ke y wo r ds   a n l i t e r a t ur e   s e a r c h   pr o c e dur e       2. 3.     K n owl e d ge   e x t r a c t ion   an d   e x c l u s ion   T h e   kn o w l e dge   e x t r a c t i o n   pr o c e s s   i nv o l v e i d e n t i f yi ng  r e l e v a n t   da t a   f r o m   t h e   s e l e c t e s t udi e s ,   f o c us i ng  o n   m e t h o ds ,   m o t i v a t i o n s ,   a n s t a n da r ds   f o r   E M R   de c i p h e r i ng  t a s ks   l i ke   a bb r e vi a t i o n   e xpa ns i o n ,   a uto m a t i c   d i a g n o s i s ,   a n I C c l a s s i f i c a t i o n .   S t u d i e s   publ i s he b e t we e n   2019  a n 2024  we r e   p r i o r i t i z e d.   E x c l us i o n   c r i t e r i a   we r e   pu i n   p l a c e   to  ke e p   th e   r e vi e f o c us e by   r e m o vi ng  i r r e l e v a n t ,   o u tdat e d,   o r   m e t h o do l o g i c a ll y   we a s t udi e s .   T h e   s t ud i e s   we r e   c r i t i c a ll y   a n a ly z e t o   i de n t i f y   c o nf li c t i n i nf o r m a t i o n   a n d   ga ps   i n   t h e   l i t e r a t ur e .   T hi s   s t ud y   s y n t h e s i z e s   th e   r e c e n t   a dv a n c e s   i n   NL P   f o r   m e d i c a l   i n f o r m a t i c s   b y   i n t e gr a t i n t h e s e   pr o c e s s e s ,   un de r li n i ng  ke y   f i nd i ngs ,   a n i de n t i f yi ng  ga p s   i c ur r e n t   r e s e a r c h .   T hi s   w il pr o vi de   i ns i g h t s   f o r   f ut ur e   s t udi e s   to   de v e l o i n t e g r a t e d   m e t h o d o l o g i e s   f o r   de c i p he r i n E M R s .       3.   CHAL L E NG E S   I I NT E GRA T I NG  E M DE CI P HE R I NG,   AU T OM AT I DI AGNOS I S   AN I CD   CODI NG   E M R   de c i p he r i n s i g nif i c a n t l y   i nf l ue n c e s   w hy   m o s t   r e s e a r c h   t e n ds   t f o c us   o n   de c i p h e r i ng  E M R s   li ke   s t r a t e gi e s   f o r   e x pa n d i ng  a bb r e vi a t i o n s   i E M R ,   a uto m a t i c   d i a g n o s i s ,   o r   I C c l a s s i f i c a t i o n ,   r a th e r   t h a a ddr e s s i ng  t h e m   c o n c ur r e n t l y .   A   pr i m a r y   r e a s o n   f o r   t h i s   d i vi d e   i s   t h e   c o m p l e xi t y   o f   c li n i c a l   l a n gu a g e .   E M R s   a r e   c o m po s e o f   un s t r uc t ur e d   c l i n i c a l   n o t e s   t h a i nc o r p o r a t e   m e d i c a l   j a r go n ,   a bb r e vi a t i o n s ,   a n c o n t e x t - s pe c i f i c   t e r m s   [ 5] .   NL P   i s   pa r t i c u l a r l y   e f f e c t i ve   f o r   n a vi ga t i n t h e   i n t r i c a c i e s   a n n ua n c e s   o f   h u m a l a n gua ge ,   m a k i ng  i t   a   vi t a l   too l   f o r   i n t e r pr e t i n E M R s .   T o   e f f e c t i v e ly   pr e pr o c e s s   un s t r uc t ur e d   t e x t   da t a   i E M R s ,   v a r i o us   NL P   t e c h ni qu e s ,   s uc h   a s   to ke ni z a t i o n ,   pa r t - of - s pe e c h   t a ggi n g,   a n na m e e n t i t y   r e c o gni t i o n ,   a r e   e m p l o y e [ 5] ,   [ 25] ,   [ 26] .     T h e s e   p r e pr o c e s s i ng  s t e ps   a r e   c r uc i a l   f o r   tr a n s f o r mi ng  r a c l i n i c a l   t e x t   i n t s tr uc t u r e da t a   t h a c a b e   a n a ly z e f ur t h e r   [ 27] .   A dva n c e NL P   m o de l s ,   l i ke   B E R T   a n C li n i c a l B E R T   [ 9] ,   [ 8 ] ,   u t i l i z e   c o n t e x t ua l   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2252 - 8776   I n t   J   I n f   &   C o m m u n   T e c hn o l Vo l .   1 4 ,   N o.   3 De c e m be r   20 2 5 :   881 - 8 9 1   884   e m b e d d i n gs   to  g r a s p   t h e   m e a ni n gs   o f   w or ds   a n d   ph r a s e s   w i t hi n   t h e   b r oa d e r   c o n t e x o f   c l i ni c a l   n otes   [ 28 ] ,   [ 29 ] .   T hi s   c o n t e x t ua l   c o m pr e he n s i o n   i s   e s s e n t i a l   f o r   a c c ur a t e l y   i n t e r pr e t i n m e d i c a l   i n f o r m a t i o n   [ 30] .   F ur th e r m o r e ,   NL P   m o de l s   c a n   b e   f i ne - t un e f o r   s pe c i f i c   t a s ks ,   s uc h   a s   e x pa n d i ng  a bb r e vi a t i o n s ,   a uto m a t i c   d i a g n o s i s ,   o r   I C c o di n [ 22] ,   [ 31] .   H o we v e r ,   t h e   uni que   r e qu i r e m e n t s   a n c h a ll e n ge s   a s s o c i a t e wi t h   e a c h   t a s n e c e s s i t a t e   s pe c i a li z e m e t h o do l o g i e s .   T hi s   s pe c ia l i z a t i o n   o f t e n   l e a ds   r e s e a r c h e r s   to  c o n c e n t r a t e   o n   a   s i n g l e   t a s a t   a   t i m e   t o   a c hi e v e   o pt i m a l   r e s u l t s .   B y   f o c u s i ng  o n   o n e   t a s k,   r e s e a r c h e r s   c a n   e nh a n c e   t h e i r   m o de l s   a n m e t h o ds   f o r   t h a s pe c i f i c   pur po s e ,   wh e t h e r   i t   i nv o l v e s   de c i p he r i n E M R s   o r   a u to m a t i n I C c o di n [ 32] .     T h e   d i s t i nc t   c h a l l e n g e s   t i e to  e a c h   t a s c l a r i f y   why   r e s e a r c h   f r e que n t l y   e m p h a s i z e s   e i t h e r   E M R   de c i p h e r i ng  o r   I C c l a s s if i c a t i o n .   E M R   de c i p h e r in r e qu i r e s   un de r s t a n d i n a n s t r uc t ur i n u n s t r uc t ur e d   or   s tr uc tu r e d   tex t,   whi l e   I C c l a s s i f i c a t i o n   i n v o l v e s   m a ppi n g   c l i ni c a l   i nf or m a t i o n   to  s tan da r di z e d   c ode s   [ 2 7 ] ,   [ 33 ] .   E a c h   t a s pr e s e n t s   uni que   h ur d l e s   a n m a y   r e qu i r e   d i f f e r e n t   m e t h o do l o gi e s   a n e v a l ua t i o n   m e t r i c s .   M o r e o v e r ,   m o de l s   t a i l o r e f o r   E M R   de c i p h e r i ng  a r e   t y p i c a ll y   o p t i mi z e f o r   na t ur a l   l a n gua g e   un d e r s t a n d i n g,   wh e r e a s   t h o s e   de s i g n e f o r   I C c l a s s i f i c a t i o n   f o c us   o n   c l a s s i f i c a t i o n   t a s ks .   A t t e m pt i n t c o m bin e   t h e s e   t a s ks   c a n   c o m p li c a t e   t h e   m o de l   t r a i ni ng  a n e v a l ua t i o n   pr o c e s s e s .   I n   c o n t r a s t ,   a u to m a t i c   d i a g n o s i s   i n t e gr a t e s   di f f e r e n t   da t a ,   s uc h   a s   pa t i e n t   hi s t or y ,   s ym pto m s ,   a n d   l a b o r a tor y   r e s u l t s .   M o s t   s t a t e - of - t h e - a r t   NL P   m o de l s   a r e   de s i g n e f o r   pur e l y   t e x t - b a s e a n a ly s i s   a n th us   f a c e   c h a ll e n g e s   i n   i n t e gr a t i n t h e s e   t y pe s   o f   da t a .   M o d e l s   n e e l a r ge ,   v a r i e da t a s e t s   to  un de r s t a n t h e   g a m ut   o f   po s s i bil i t i e s   i n   a   m e d i c a l   c o n t e x t   to  m a ke   a ppr o pr i a t e   di a g n o s e s .   I n s u f f i c i e n t   da t a   m e a ns   a   l a c o f   s p e c i a li z e kn o w l e dge   t gr a s s uc h   c o m p l e x   c o n d i t i o n s   a n a r r i v e   a t   de pe n da bl e   d i a g n o s t i c   de c i s i o ns .   F i na ll y ,   c o n c e n t r a t i n o n   o n e   t a s a l l o ws   r e s e a r c h e r s   to  a l l o c a t e   r e s o u r c e s   a n t i m e   m o r e   e f f e c t i v e ly .   C o n duc t i n c o m pr e h e n s i ve   s t ud i e s   o n   b ot h   E M R   de c i p h e r i n a n I C c l a s s if i c a t i o s i m u l t a n e o us ly   c a n   b e   r e s o ur c e - i n t e n s i ve   a n m a y   d il ut e   e f f o r t s   to  a c hi e ve   hi g h   pe r f o r m a nc e   i n   e i t h e r   t a s k.   B y   l e v e r a g i ng  NL P   f o r   E M R   de c i p h e r i n g,   r e s e a r c h e r s   c a n   t a c k l e   t h e   c o m p l e xi t i e s   o f   c li n i c a l   l a n g ua ge   a n d   e nh a nc e   t h e   a c c ur a c y   o f   i n t e r pr e t i n m e d i c a l   t e x t s .   T h i s   f o c us   o n   s pe c i a l i z a t i o n   h e l ps   e x p l a i n   why   m o s s t udi e s   pr i o r i t i z e   e i t h e r   E M R   de c i p h e r i n o r   I C c l a s s i f i c a t i o ns ,   b ut   n ot  a t h e   s a m e   t i m e .   Un de r s t a n d i n g   t h e s e   d y n a mi c s   c a n   i nf o r m   f ut ur e   r e s e a r c h   d i r e c t i o n s   to wa r d   m o r e   i n t e gr a t e d   a n h o l i s t i c   a ppr o a c h e s   i n   t h e   f i e l o f   m e d i c a l   i n f o r m a t i c s .       4.   NL P   M E T HO DS    4. 1.     L ar ge   l an gu age   m od e l s   On e   n o t a bl e   m e t h o w i t hi N L P   i s   t h e   us e   o f   l a r ge   l a n gua ge   m o de l s   ( L L M s ) ,   whi c h   g a i ne d   w i de s pr e a a tt e n t i o n   w i t h   t h e   e m e r ge n c e   o f   C h a t GPT .   L L M s ,   i nc l ud i ng  m o de l s   l i ke   bi d i r e c t i o na l   e n c o de r   r e pr e s e n t a t i o ns   f r o m   t r a n s f o r m e r s   ( B E R T ) ge n e r a t i v e   pr e - t r a i n e t r a n s f o r m e r   ( GPT ) ,   a n t e x t - to - t e x t r a n s f e r   t r a n s f o r m e r   ( T 5) ,   p o s s e s s   a r c hi t e c t ur e s   t h a t   a l l o t h e m   t o   a n a l y z e   c o n t e x t   f r o m   b o t h   d i r e c t i o n s   i a   s e que n c e   o f   wo r ds .   T hi s   c a pa bil i t y   s i g nif i c a n t l y   e nh a n c e s   t h e i r   un de r s t a n d i ng  o f   wo r d   m e a ni ngs   i n   c o n t e x t .   T h e s e   m o de l s   a r e   t y p i c a ll y   pr e - t r a i n e o n   a   wi d e   a r r a y   o f   t a s ks ,   s uc h   a s   l a n gua ge   m o de l i ng,   t e x c o m p l e t i o n ,   a n o t h e r   NL P - r e l a t e f u n c t i o n s .   T hi s   pr e - t r a i ni ng  ph a s e   e qu i ps   t h e   m o de l s   w i t h   a   s o l i f o u n da t i o n   i ge n e r a l   l a n gua ge   pa t t e r n s ,   m a k i ng  L L M s   po we r f u l   too l s   f o r   un de r s t a n d i n a n ge n e r a t i n h u m a n - li ke   t e x t .   T h e y   a r e   i nva l ua bl e   f o r   v a r i o us   l a n gu a ge - r e l a t e t a s ks   a n a pp l i c a t i o n s   i n   h e a l t hc a r e   [ 23] ,   [ 34] - [ 37] .     M or e o v e r ,   tr a n s f or m e r - b a s e d   a r c hi tec tu r e s   l i ke   B E R T   a n d   G P T   h a v e   de m o n s tr a t e d   e x c e p t i o n a l   p e r f or m a n c e .   B E R T ' s   b i d i r e c t i o n a l   c o n tex un de r s tan di n g   e n a bl e s   i to  g r a s n u a n c e d   m e a ni n gs   i n   c l i ni c a l   tex t   e f f e c t i v e l y ,   m a ki n i t   we l l - s u i t e d   f or   tas ks   r e qui r i ng   de tai l e c o m p r e h e n s i o n .   G P T ,   r e n o wn e f or   i t s   ge n e r a t i v e   c a pa b i l i t i e s ,   c a n   a l s b e   f i n e - tun e d   f or   s pe c i f i c   a p pl i c a t i o n s   s uc h   a s   a u to m a te d   di s e a s e   d i a gn o s i s ,   a l b e i a the  c os o f   i n c r e a s e d   c o m pu ta t i o n a l   r e s ou r c e s   [ 2 4] ,   [ 36 ] ,   [ 3 7 ] .   N u m e r ous   pr e vi ous   s tudi e s   h a v e   l e v e r a ge d   L L M s   [ 2 7 ] ,   [ 3 1]   to  e x pa n d   a b b r e vi a t i o n s   a s   a   s tr a tegy   f or   de c i ph e r i n g   E M R s .   T 5,   de v e l o pe by   Go o gl e   R e s e a r c h ,   i n t r o duc e s   a   uni f i e f r a m e wo r f o r   a   r a n ge   o f   NL P   t a s ks   by  f r a mi ng  t h e m   a s   t e x t   ge n e r a t i o n   pr o bl e m s .   I n   t hi s   m o de l ,   b ot h   i n put   a n o u t pu a r e   t r e a t e a s   t e x s t r i n gs ,   a l l o w i ng  f o r   a   c o n s i s t e n t   tr a i ni ng  a ppr o a c h   a c r o s s   di ve r s e   t a s ks .   B y   e m p l o yi ng  t hi s   t e x t - to - t e x f o r m a t ,   T 5   l e v e r a ge s   i t s   pr e - t r a i n e c a pa bil i t i e s   t o   ge n e r a t e   c o n t e x t ua l ly   r e l e v a n t   a n s e m a n t i c a ll y   m e a ni ng f u l   m e d i c a t e x t.   W h e n   t a s ke w i t h   e x pa n d i ng  a bb r e vi a t i o n s ,   T i n t e r pr e t s   t h e   i n put   a s   a n   a bb r e vi a t e f o r m   a n g e n e r a t e s   t h e   c o r r e s p o n d i n e x p a n de f o r m   o r   a   de t a i l e e x p l a n a t i o n ,   t h e r e by   f a c i li t a t i n c l e a r e r   c o m m u ni c a t i o n   i c l i n i c a l   s e t t i n g s   [ 6] .   R e v i e ws   by   [ 3 ]   ou t l i n e d   t h a s ta te - of - t h e - a r c l i ni c a l   N E R s   a r e   a l l   v a r i a n t s   o f   B E R T ,   m o s t l y   f i n e - tun e or   tr a i n e d   o n   d o m a i n - s p e c i f i c   c or p or a .   T h e   v e r y   s i g ni f i c a n d r a wb a c k   wi t h   t h e s e   m o d e l s   i s   t h e   l a c k   o f   v a r i e t y   i th e   m e di c a l   c or p us   t h e   m o de l s   h a v e   b e e n   tr a i n e wi t h ,   whi c h   m i g h n e g a t i v e l y   i m pa c pe r f or m a n c e .   B E R T   m ode l s   a r e   e x tr e m e l y   de pe n d e n o n   c o n tex t ua l   i nf or m a t i o n ,   a n d   i f   t h e   c or pus   i s   n ot  r e p r e s e n t a t i v e   o f   a l l   m e d i c a l   s pe c i a l t i e s ,   c o n tex t s ,   a n d   d oc um e n t y pe s ,   ge n e r a l i z a t i o n   to  di v e r s e   h e a l t h   s c e n a r i o s   c a n   b e   p oor .   E v e n   d o m a i n - Evaluation Warning : The document was created with Spire.PDF for Python.
I n t   J   I n f   &   C o m m u n   T e c hn o l     I S S N:   2252 - 8776       R e v ie w   of   N L P   in  E M R :   abbr e v iat ion,   diagnos is ,   a nd  I C D   c las s if ication   ( N ur ul  A nis   B alqi s   I qbal  B as he e r )   885   s pe c i f i c   v a r i a n t s   s u c h   a s   C l i ni c a l B E R T   a n d   B i o B E R T   [ 8 ] ,   [ 2 5 ] ,   [ 30 ] ,   whi l e   i m pr o vi n p e r f or m a n c e ,   ha v e   m o s o f   t h e   s a m e   c h a l l e n ge s   a s s oc i a t e d   wi t h   t h e   r e p r e s e n t a t i v e n e s s   o f   t h e   c or p us .   On   t h e   oth e r   h a n d ,   th e   p r e tr a i ni n g   o f   G P T   m o de l s   i n v o l v e s   di v e r s e   ge n e r a l   t e x ts   s u c h   a s   b ooks ,   w e b s i tes ,   a n d   e s s a y s .   T hi s   b r o a d   tr a i ni n g   d a ta   e n a bl e s   G P T   to  w or k   on   di f f e r e n ki n ds   o f   tas ks ,   b u i l a c ks   s pe c i f i c i t y   i n   a   pa r t i c ul a r   d o m a i n .   M or e   s pe c i f i c a l l y,   f or   h e a l t h c a r e   p ur p o s e s ,   G P T   m o d e l s   h a v e   to  b e   f i n e tun e d .   R e ga r d l e s s ,   G P T   m ode l s ,   i n   h e a l t h   e s pe c i a l l y ,   p r o m i s e   to  m a ke   qui te   a   r e v o l u t i o n   i n   c l i ni c a l   de c i s i o n   s u pp or t,   i m pr o v e m e n o f   c o m m uni c a t i o n   wi t h   pa t i e n t s ,   a n d   ge n e r a l l y   i n   s m ooth i n da ta   m a n a ge m e n pr oc e s s e s   [ 3 8 ] .   H ow e v e r ,   d o m a i n - s p e c i f i c   kn ow l e d ge   h a s   pr o v e d   to  b e   a   b i c h a l l e n ge   f o r   GP T   m o d e l s ,   s uc h   a s   C h a tG P T   a nd  G P T - 4 ,   wh e r e a s   tas k - s pe c i f i c   m ode l s   ou tpe r f or m   ge n e r a l i z e d   m ode l s   l i ke   C h a tG P T   [ 39 ] .   I n   t h e   e v o l vi ng  l a n ds c a pe   o f   de e l e a r ni ng - b a s e d   n a t ur a l   l a n gua g e   pr o c e s s i n g,   B E R T   m o de l s   a r e   r e c o gni z e a s   s t a t e - of - t h e - a r t   f o r   v a r i o us   l a n gua g e   un de r s t a n d i ng  b e n c hm a r ks .   B y   ut i li z i ng  a   s e lf - a tt e n t i o m e c h a ni s m   a n t r a n s f e r   l e a r ni ng,   B E R T   h a s   o u t p e r f o r m e pr e vi o us   m o de l s   i n   n u m e r o us   NL P   d o w n s t r e a m   t a s ks .   P r e t r a i n e B E R T   m o de l s   a r e   c o n s t r uc t e d   on   d i v e r s e   t e x c or p o r a ;   h o we v e r ,   C l i n i c a l B E R T ,   a   t a i l o r e d   v a r i a n t   o f   B E R T ,   i s   s pe c if i c a ll y   t r a i ne o n   s pe c i a li z e c o r p o r a   t h a i n c l ude   c l i n i c a l   t e x t s .   T hi s   t a r ge t e d   t r a i ni ng  a l l o ws   t h e   r e pr e s e n t a t i o ns   l e a r n e f r o m   m e d i c a l   t e x t s   t o   b e   e f f e c t i ve l y   p r o c e s s e f o r   s ub s e que n t   c l i n i c a l   a pp li c a t i o n s   [ 40] .   L L M s   l i ke   B E R T ,   GPT ,   a n T 5   h o l gr e a t   p ot e n t i a l   f o r   e x pa n d i ng  a bb r e vi a t i o ns   a n im pr o vi n g   E M R   i n t e r pr e t a t i o n .   T m a xim i z e   t h e i r   i m p a c t   i n   h e a l t h c a r e ,   a ddr e s s i ng  l i mi t a t i o ns   s uc h   a s   c on t e x t ua l   un de r s t a n d i ng  a n do m a i n   k n o w l e dge   i s   c r uc i a l .   E nh a n c i ng  pe r f o r m a n c e   t h r o ugh   di v e r s e   t r a i ni ng  c o r p or a ,   hy br i m o de l s ,   a n f i ne - t uni ng  f o r   s pe c i f i c   t a s ks   c a n   i m pr o v e   I C c l a s s i f i c a t i o n ,   d i a g n o s i s ,   a n E M R   de c i p h e r i ng.   Ho we v e r ,   wi t h o ut   r o b us un de r s t a n d in g,   t h e s e   m o de l s   r i s i nc o r r e c di a g n o s e s   a n I C D   c o di n g,   pot e n t i a ll y   c o m pr o m i s i ng  pa t i e n t   c a r e .     4. 2.     I n f or m at ion   e x t r ac t ion   m e t h od s   I nf o r m a t i o n   e x t r a c t i o n   ( I E )   i s   a   c o r e   NL P   t e c h ni qu e   t h a s tr uc t ur e s   i nf o r m a t i o n   f r o m   uns t r uc t u r e o r   s e m i - s t r uc t ur e t e x t.   I i s   w i de ly   a pp li e i n   he a l t h c a r e   to  pr o c e s s   E M R s ,   i de n t i f y i ng  ke y   e n t i t i e s   li ke   d i s e a s e s ,   m e d i c a t i o ns ,   a n pr o c e dur e s   to  e n a bl e   e f f i c i e n t   I C c l a s s if i c a t i o n   a n s uppo r t a s ks   l i ke   a ut o m a t i c   di a g n o s i s .   I E   t e c h ni que s   s uc h   a s   n a m e e n t i t y   r e c o gni t i o ( NE R ) ,   L L M s ,   a n hy b r i m o de l s   a r e   i ns t r um e n t a l   in  c o n v e r t i n c o m p l e x   c li n i c a l   n o t e s   i n to   s t r uc t ur e d   d a t a   [ 41] - [ 45] .   A   n o t a bl e   s t udy   a pp l i e I E   f o r   I C D - 10   c l a s s if i c a t i o n   us i ng  c o - o c c ur r e n c e   a na l y s i s   a n e m b e dd i ng - b a s e r e pr e s e n t a t i o n s   t o   e x t r a c t   s y n o nym s ,   hy p o ny m s ,   a n hy pe r ny m s   [ 4] .   W hi l e   e f f e c t i v e   f o r   s h o r t e r     n - gr a m s ,   t hi s   a ppr o a c h   s t r uggl e w i t h   l o n ge r   s e que n c e s ,   r e qu i r i ng  a li g nm e n t   wi t h   e m be dd i ng  s p a c e s   a n d   d i s a bl i ng  s y n t a c t i c   f il t e r s .   T hi s   l im i t a t i o n   r e duc e s   ge ne r a l i z a bi li t y   a c r o s s   c o n t e x t s .   Hy b r i m e t ho ds   t h a i n t e gr a t e   s y n t a c t i c   a n s e m a n t i c   i nf o r m a t i o n   m a o v e r c o m e   s uc h   c h a ll e n g e s   a n im pr o v e   t h e   e x t r a c t i o n   o f   l o n ge r   t e r m s   [ 16] .   Da t a   m i n i ng  t e c hni que s   we r e   a pp li e to   i m pr o v e   pa t i e n t   s a f e t y   i n   c l a s s i f i c a t i o n ,   de c i s i o n   t r e e s ,   a n d   e i ge nv a l u e   a n a ly s i s .   T e c hni que s   we r e   s c a l a bl e   a n pe r f o r m e o n   kn o wl e dge   vi s ua li z a t i o n ,   d i a g n o s i s   im pr o v e m e n t ,   a n m e d i c a t i o n   de c i s i o ns   [ 18] ,   [ 42 ] ,   [ 43 ] .   Da t a   m i ni ng  m o de l s   t h e m s e l ve s   o f t e n   h a v e   i s s ue s   s uc h   a s   i n t e r pr e t a bi li t y ,   da t a   s e t s   t h a t   c h a n ge   d i s t r i b ut i o n ,   a n do c um e n t s   e xi s t i n a s   u n s t r uc t ur e d   da t a   i h a n dwr i t t e n   n o t e s   [ 44 ] .   S o l ut i o ns   m a y   i nc l ude   t r a n s f e r   l e a r ni ng,   c o upl e w i t h   m o r e   i n t e r pr e t a bl e   mo de l s   to  a c c o m m o d a t e   c h a n g i n da t a   pa tt e r n s ,   h e n c e   m a k i n i m pr o v e m e n t s   i n   uns t r uc t u r e da t a   p r o c e s s i n g.   A   c r i t i c a l   li m i t a t i o n   o f   t h e   c ur r e n t   I E   a n da t a   mi n i ng  m e t h o ds   i s   t h e i r   i na bil i t y   to   h a n d l e   t h e   c o n t e x t ua l   a m b i gu i t y   i c li n i c a l   a bb r e vi a t i o ns .   F o r   e x a m p l e ,   " C HF"   m a y   i nd i c a t e   " c o n ge s t i v e   h e a r t   f a il ur e "   o r   " c h r o ni c   h e a r t   f a il ur e , "   de pe n d i ng  o n   t h e   c o n t e x t .   W i t h o ut   s o phi s t i c a t e c o n t e x t ua l   a n a ly s i s ,   m o de l s   m a mi s u n de r s t a n t h e s e   a bb r e vi a t i o n s ,   l e a d i ng  to  e r r o n e o us   di a g n o s e s   a n tr e a t m e n t   de c i s i o ns .   I n tegr a t i n g   c o n t e x t ua l   u n de r s t a n d i ng  i n t o   de v e l o p m e n t   t e c hniques   i s   c r uc i a l   f o r   a c c ur a c y   i m pr o v e m e n t   i n   a bb r e vi a t i o e x pa ns i o n   a n u l t i m a t e l y ,   i n   pa t i e n t   c a r e .   W hil e   I E   o f f e r s   s e v e r a l   a d v a n t a ge s   i n   s t r uc t ur i n c li n i c a l   da t a   a n s uppo r t i n d i a g n o s i s ,   l im i t a t i o n s   l i ke   ha n d l i ng  o f   c o n t e x t ,   i n t e r pr e t a bi li t y ,   a n a da pt a bi li t y   t un s tr uc t u r e da t a   r a i s e   t h e   c h a l l e nge s   t h a t   n e e to   b e   c o v e r e i n   f ur t h e r   r e s e a r c h   t t un e   t h e s e   m e t h o ds   f o r   m o r e   r o b us t n e s s   i n   h e a l t h c a r e   a pp l i c a t i o n s .   Opt i c a l   c h a r a c t e r   r e c o gni t i o n   ( OC R )   h a s   e m e r ge a s   a   r o b us t e c hni que   f o r   e x t r a c t i n da t a   f r o m   E M R s   a n c li n i c a l   n o t e s ,   e f f i c i e n t l y   pr o c e s s i n va r i o us   do c um e n t   t y pe s ,   i nc l ud i n h a n dwr i t t e n   a nd  pr i n t e m a t e r i a l s   [ 15] ,   [ 45] .   I t s   r a pi pr o c e s s i ng  c a pa bil it i e s   a n hi g h   a c c ur a c y   a r e   a t tr i b ut e to  a dv a n c e m e n t s   i m a c hi ne   l e a r ni n a n c o m put e r   vi s i o n   [ 46] ,   [ 47] .   Ho we v e r ,   OC R   s t r uggl e s   w i t h   l o w - qua l i t y   i m a ge s   a n poo r   h a n dwr i t i ng,   l e a d i ng  t o   i n a c c ur a c i e s .   T o   m i t i ga t e   t h e s e   c h a ll e n ge s ,   i m pr o v e m e n t s   i n   pr e pr o c e s s i ng   t e c h ni que s   a n d i v e r s e   t r a i ni n da t a s e t s   c a n   e nh a nc e   OC R ' s   r o b us t n e s s   i n   r e a l - wo r l a pp l i c a t i o n s .   A   hy br i m e t h o d,   h y b r i d - NE R   ( h NE R ) ,   i n t e gr a t e s   d i c t i o na r y - b a s e a ppr o a c h e s   a n h u m a n - in - t h e - l o o ( HI T L )   v a l i da t i o n   to   i de n t i f y   m e d i c a l   e n t i t i e s   l i ke   s ym pto m s   a n do s a ge   f o r m s   [ 47] .   T h e   di c t i o n a r y - b a s e m e t h o e n s ur e s   a c c ur a c y   by   c o m pa r i ng  e n t i t i e s   t o   pr e de f i ne d i c t i o n a r i e s ,   w hi l e   HI T L   a ll o w s   do m a i e x pe r t s   to  v a l i d a t e   p r e d i c t i o ns .   Al t h o ugh   HI T L   pr o vi de s   f l e xi b il i t y   a n i ns i g h t s   f o r   a m bi guo us   e n t i t i e s ,   i t   i s   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2252 - 8776   I n t   J   I n f   &   C o m m u n   T e c hn o l Vo l .   1 4 ,   N o.   3 De c e m be r   20 2 5 :   881 - 8 9 1   886   li mi t e by   s u bj e c t i vi t y   a n v a r i a bi li t y   i n   e x p e r t   i n t e r pr e t a t i o n s .   T hi s   l im i t a t i o n   hi g hl i g h t s   t h e   n e e f o r   tr a i ni ng   a n s t a n da r d i z e gu i de li ne s   t e n s ur e   c o n s i s t e nc y .   C l i n i c a l B E R T ,   a   s pe c i a li z e B E R T   m o de l ,   h a s   b e e n   a da pt e f o r   m e d i c a l   t e x t   pr o c e s s i n g,   e x c e ll i ng   i n   t a s ks   l i ke   NE R   a n m e d i c a l   c o n c e pt   i d e n t i f i c a t i o n   [ 3 1] .   I t s   m u l t i t a s a da pt a t i o n ,   M u l t i t a s k - C l i n i c a l B E R T ,   a ddr e s s e s   m u l t i p l e   c li n i c a l   t a s ks   s im u l t a n e o us l y .   Ho we v e r ,   i t s   m u l t i t a s k i ng  n a t ur e   c a n   d i l ut e   pe r f o r m a n c e   in  s pe c i a li z e t a s ks   li ke   a bb r e vi a t i o n   e x pa n s i o n ,   w hich   r e qu i r e s   de e c o n t e x t ua l   u n de r s t a n d i ng.   L im i t a ti o n s   a l s o   i nc l ude   i t s   i n a bil i t y   to   a da p qui c k ly   t e m e r g i n m e d i c a l   t e r m i n o l o g y   a n pr a c t i c e s .   I n c o r po r a t i n g   e x p l a n a t i o n   m e t h o ds ,   s uc h   a s   i n t e r pr e t a bi li t y   t e c hni que s ,   m a y   pa r t i a ll y   a ddr e s s   t h e s e   i s s ue s .   T h e   de v e l o p m e n t   o f   a ut o m a t e I C c o di n ha s   e v o l ve o v e r   t h e   de c a de s ,   w i t h   n u m e r o us   r e s e a r c h e r s   c r e a t i n v a r i o us   m e t h o ds   to  r e duc e   t h e   t i m e - c o ns u m i ng  t a s ks   t y p i c a ll y   ha n d l e by   h u m a n   c o de r s .   On e   f r e qu e n t l y   e m p l o y e a ppr o a c h   i s   t h e   r u l e - b a s e m e t h o do l o g y ,   whi c h   s e e ks   t t r a n s f o r m   p l a i t e x t   i n t e x e c u t a bl e   l o g i c a l   de c i s i o ns   f o r   a u to m a t i c   c o d i n pr e d i c t i o n .   A   ke y   a s pe c t   o f   e n ha n c i ng  t h e   e f f e c t i ve n e s s   o f   t h e s e   r u l e - b a s e s y s t e m s   i s   t h e   i nc l us i o n   o f   a   b r o a de r   r a n ge   o f   m e d i c a l   c o n c e pt s   w i t hi t h e   c o di n r u l e s .   B y   i n t e gr a t i n e qu i va l e n t   t e r m s   f r o m   gu i d e l i ne s   a l o n w i t h   t h e i r   s y n o nym s ,   a bb r e vi a t i o ns ,   a nd  r e l a t e i n f o r m a t i o n ,   r e s e a r c he r s   c a n   e x pa n t h e   v o c a b u lar y   o f   h e a l t h - r e l a t e t e r m s   c o v e r e d.   H o we v e r ,   r u l e - b a s e a ppr o a c h e s   c o m e   w i t h   n o t a bl e   dr a w b a c k s ,   pa r t i c u lar l y   i t e r m s   o f   f l e xi b il i t y   a n a da pt a bi li t y .   T h e   o v e r l a o f   s y m pt o m s   a c r o s s   m u l t i p l e   d i s e a s e s   c a n   l e a t o   i s s ue s   s uc h   a s   o v e r - c o di n a n mi s s e c o de s .   F ur t h e r m o r e ,   a s   t h e   n u m b e r   o f   c o de s   i n c r e a s e s ,   d i s put e s   m a y   a r i s e   b e t we e n   c o nf li c t i n r ul e s ,   c o m p li c a t i n t h e   c o di n g   pr o c e s s   [ 10] ,   [ 17] ,   [ 34] ,   [ 37 ] ,   [ 4 7] ,   [ 48] .     M a yy a   e al.   [ 49]   i n t r o duc e s   t h e   l a be l   a t t e n t i v e   t r a n s f o r m e r   a r c hi t e c t ur e s   ( L A T A )   m o de l ,   whi c e nh a nc e s   i n put   c o n t e x l e a r ni ng  f o r   s pe c i f i c   o ut p ut  c l a s s e s   i n   NL P   t a s ks   w i t h   l im i t e t r a i ni ng  s a m p l e s   b ut  n u m e r o us   o u t pu c l a s s e s .   L A T A   a uto m a t e s   I C D - 1 c o de   a s s i g nm e n t s   us i n pa t i e n t   c a s e   r e p o r t s   a n e m p l o ys   l a b e l   a t t e n t i o n   m e c ha ni s m s   a c r o s s   B E R T   v a r i a n t s   to   i m pr o v e   pr e d i c t i v e   a c c ur a c y .   A   s i g ni f i c a n t   c o n tr i b ut i o o f   t h e   s t udy   i s   t h e   us e   o f   a   unif i e to ke ni z e r   a n c o n s i s t e n t   hy pe r pa r a m e t e r s   a c r o s s   B E R T   v a r i a n t s ,   e n a bli ng   i ns i g h t s   i n t pa r a m e t e r   v a r i a t i o ns .   L A T A   a l s o   a ddr e s s e s   t h e   n e e f o r   e x p l a i na bl e   c l i n i c a l   de c i s i o s uppo r s y s t e m s   ( C DSS s )   by   vi s ua li z i ng  a t t e n t i o n   we i g h t s ,   t h e r e by   l i nk i ng  c li n i c a l   n ot e   t e x t   to  di a g n o s t i c   c o de s   a n e nh a nc i n t r us t   i n   t h e   m o de l .   W hil e   t h e   s t ud y   do e s   n o t   e x p l i c i t ly   a ddr e s s   li mi t a t i o ns ,   i t   hi g hli g h t s   r e duc i n g   f a l s e   po s i t i v e s   a s   a   ke y   f ut ur e   di r e c t i o n   t i m pr o v e   c o di n a c c ur a c y   a n r e l i a bil i t y   i h e a l t h c a r e   s y s t e m s .   An o t h e r   s t udy   a im s   t o   de v e l o a   pr e di c t i ve   m o de l   f o r   I C c o de s   us i n t h e   M I M I C - I I I   c l i n i c a l   t e x t   da t a s e t.   B y   l e v e r a g i ng  n a t ur a l   l a n gua g e   pr o c e s s i ng  t e c hni que s   a n de e l e a r ni ng  a r c hi t e c t ur e s ,   t h e   r e s e a r c h e r s   c o n s t r uc t e a   pi pe li ne   t o   e x tr a c r e l e va n t   i nf o r m a t i o n   f r o m   M I M I C - I I I ,   a   l a r ge ,   de - i de n t i f i e d,   a n publi c l y   a c c e s s i b l e   m e d i c a l   r e c o r ds   da t a b a s e .   T h e ir   m e t h o do l o g y   pr e d i c t s   di a g n o s i s   c o de s   f r o m   uns tr uc t u r e da t a ,   i n c l ud i ng  d i s c h a r ge   s u m m a r i e s   a n n o t e s   de t a i li ng  s y m pt o m s .   T h e y   e m p l o y e s t a t e - of - t h e - a r de e p   l e a r ni ng  a l go r i t hm s   s uc h   a s   r e c ur r e n t   n e ur a l   ne t wo r ks   ( R NN s ) ,   l o n s h o r t - t e r m   m e m o r y   ( L S T M )   ne t w o r ks ,   bi d i r e c t i o n a l   L S T M   ( B i L S T M ) ,   a n B E R T   m o de l ,   by   f i r s t   to ke ni z i ng  t h e   c l i n i c a l   t e x t   wi t h   B i o - C l i n i c a l B E R T ,   a   pr e - tr a i n e m o de l   f r o m   Hugg i n g   F a c e .   T e v a l ua t e   t h e   e f f e c t i v e n e s s   o f   t h e i r   a ppr oa c h ,   t h e   r e s e a r c h e r s   c o n duc t e e x pe r i m e n t s   us i n t h e   di s c h a r ge   da t a s e f r o m   M I M I C - I I I .   T h e y   e x p l o r e a   v a r i e t y   o f   de e l e a r ni ng  m o de l s ,   w i t h   pa r t i c u l a r   e m p h a s i s   o n   B i o - C li n i c a l B E R T ,   whi c h   i s   s pe c if i c a ll y   pr e - t r a i ne f o r   bi o m e d i c a l   t e x t s   [ 2] .     T h e y   r e po r t e t h a t   by   ut i li z i ng  t h e   B E R T   m o de l ,   t h e i r   a ppr o a c h   a c hi e ve hi g h   a c c ur a c y   in   pr e d i c t i n t h e   to p   10   a n to p   50   di a g n o s i s   c o de s ,   whi c h   r e f e r   to  t h e   m o s f r e que n t l y   a s s i g n e d i a gn o s t i c   c o de s   i n   t h e   M I M I C - I I I   da t a s e t.   T hi s   da t a s e t   c on t a i n s   de - i de n t i f i e h e a l t h   da t a ,   a n pr e di c t i n th e s e   to c o de s   i s   c r uc i a l   f o r   a uto m a t i n m e d i c a l   c o di n t a s ks .   T hi s   f o c us   e nh a n c e s   t h e   m o de l s   a bil i t y   t a c c ur a t e l i n t e r pr e t   c l i ni c a l   l a n gua ge .   Ho we v e r ,   t h e   s t udy   i de n t i f i e s   s e v e r a l   li mi t a t i o n s ,   i n c l ud i ng  t h e   de m a n d s   o n   c o m put a t i o n a l   r e s o ur c e s   a n c h a ll e n ge s   r e l a t e to   t h e   c o m p l e xi t y   a n h e t e r o ge n e i t y   o f   h e a l t h c a r e   da t a   w i t hi M I M I C - I I I ,   whi c h   c a n   r e s u l t   i i s s ue s   s uc h   a s   im b a l a n c e c l a s s e s   a n m i s s i ng  v a l ue s   t h a t   n e ga t i v e ly   im pa c t   m o de l   p e r f o r m a n c e .   L a s t l y ,   t h e y   hi g hli g h t   t h e   i mpo r t a n c e   o f   a ddr e s s i n t h e   l im i t a t i o n s   i n   e x p l a i na bil i t y   a n d   t r a n s pa r e n c y   a s s o c i a t e w i t h   t h e s e   c o m p l e x   m o de l s   [ 50] .     4. 3.     E x p l ain ab le  ar t i f icial   in t e ll igence   W hil e   e x p l a i na bl e   a r t i f i c i a l   i n t e ll i ge n c e   ( X A I )   i t s e lf   i s   a   b r o a de r   f i e l f o c us e o n   m a k i n A I   m o de l s   i n t e r pr e t a bl e   a n d   un de r s t a n da bl e ,   i t   b e c o m e s   e s p e c i a ll y   r e l e va n t   a n i n t e gr a t e d   wi t hi n   t h e   c o n t e x o f   NL P   wh e n   t h e s e   m o de l s   a r e   us e t o   pr o c e s s   a n a n a lyze   t e x t .   T h us ,   i t   c a n   c e r t a i nly   c o n s i de r   X A I   a s   pa r t   o f   t h e   NL P   l a n d s c a pe ,   pa r t i c u l a r l y   i a pp li c a t i o ns   wh e r e   u n de r s t a n d i ng  m o de l   de c i s i o n s   i s   c r i t i c a l.   C l e a r   e x p l a n a t i o ns   a r e   e s s e n t i a l ,   e s pe c i a l ly   i t h e   m e d i c a l   f i e l a s   c o nf u s i o n   o r   a m bi gu i t y   c a n   h a v e   s e r i o us   c o n s e que n c e s .   M i s u n de r s t a n d i ng s   i n   c r i t i c a l   m e d i c a l   s i t ua t i o ns   c a n   l e a t e r r o r s   i n   pa t i e n t   c a r e ,   di a g n o s i s ,   o r   t r e a t m e n t   [ 7 ] ,   [ 15 ] ,   [ 51] - [ 53] .   F o r   e x a m p l e ,   l i nk i ng   m e d i c a l   a bb r e vi a t i o ns   to  t h e i r   e x pa n de f o r m s   c a n   r e duc e   t h e   c h a n c e s   o f   m i s t a ke s   a n im pr o v e   t h e   qua l i t y   o f   c a r e .   I n   h e a l t h c a r e ,   wh e r e   a c c ur a c y   i s   vi t a l ,   pr o vi d i ng   c l e a r   a n un d e r s t a n da bl e   i nf o r m a t i o n   i s   ke y   to   m a in t a i ni ng  hi g h   s t a n da r d s .     Evaluation Warning : The document was created with Spire.PDF for Python.
I n t   J   I n f   &   C o m m u n   T e c hn o l     I S S N:   2252 - 8776       R e v ie w   of   N L P   in  E M R :   abbr e v iat ion,   diagnos is ,   a nd  I C D   c las s if ication   ( N ur ul  A nis   B alqi s   I qbal  B as he e r )   887   S e v e r a l   X A I   m e t h o ds   h e l i n t e r pr e t   m a c hi ne   l e a r ni ng  m o de l   o u t pu t s .   L o c a l   I n t e r pr e t a bl e   m o de l - a gn o s t i c   e x p l a na t i o ns   ( L I M E )   a n s h a p l e y   a dd i t i v e   e x p l a n a t i o n s   ( S HA P )   a r e   t w o   p o pul a r   too l s .   L I M E   c r e a t e s   s i m p l e r   m o de l s   by   l o c a l ly   a ppr o xim a t i n t h e   b e ha vi o r   o f   c o m p l e x   m o de l s   a r o un s pe c i f i c   i ns t a n c e s ,   m a k i ng  i t   e a s i e r   to   un de r s t a n t h e   i nf l ue n c e   o f   f e a t ur e s   o n   pr e di c t i o n s .   S HA P ,   gr o un de i n   ga m e   t h e or y ,   a s s i g ns   c r e d i t   to   e a c h   f e a t ur e   by   a v e r a g i ng  c o n t r i b ut i o n s   f r o m   a ll   po s s i bl e   f e a t ur e   s ubs e t s .   B ot h   gi v e   c l e a r   e x p l a n a t i o ns   b ut   a r e   c o m put a t i o n a ll y   e x p e n s i ve   s in c e   t h e y   r u n   t h e   m o de l   m u l t i p l e   t i m e s ;   h e n c e ,   t h e y   c a nn o b e   us e f o r   r e a l - t i m e   e x p l a n a t i o n s ,   e s pe c i a ll y   f o r   l a r ge   n e ur a l   ne t wor ks   [ 33 ] .   L I M E   a l s o   a ppr o x im a t e s   a   l o c a ll y   l i n e a r   m o de l   r a t h e r   t h a n   d i r e c t l y   e x p l a i n i ng   bl a c k - b o x   m o de l s   [ 54] .   An o t h e r   a ppr o a c h ,   i n t e gr a t e g r a di e n t s   ( I G ) ,   i s   c a l c u l a t i n wo r i m po r t a n c e   i n   a   ph r a s e   by   ut i li z i ng   gr a d i e n t - b a s e t e c hni que s .   I r e qui r e s   t h e   m o de l   to  b e   n o n - m a n da t or y   d i f f e r e n t i a bl e ,   s o   i t   w or ks   f o r   c o m p l e m o de l s ,   i nc l ud i ng  t r a n s f o r m e r s .   I d o e s   t hi s   by   c a l c u l a t i n t h e   gr a d i e n t   f o r   b ot h   b a s e l i ne   a n t a r ge i n put s   to  a s s e s s   t h e   c o n t r i b ut i o n   o f   e a c h   wo r d   to   t h e   p r e d i c t i o n .   Al t h o ugh   I i s   v e r y   e nli g h t e ni ng,   on e   s t ud y   de m o ns t r a t e t h a L L M s   no pr e - tr a i n e o n   m e d i c a l   da t a   pr o duc e p oo r   pe r f o r m a nc e   o n   c o m p l e c l i ni c a l   i nd i c a t i o n s ,   w hi c h   l e t o   i n c o r r e c pr e di c t i o ns .   M o r e o v e r ,   15%   o f   t h e   e r r o r s   we r e   due   to   m i s s i ng  k e y   i nput  s e c t i o n s ,   pr o b a bly   i nduc e by   t r a i ni ng  bi a s e s   o r   t h e   l a c o f   go o d   e dge   c a s e s .   L i   e al.   [ 46]   pe r f o r m e a   s t udy   t h a c o m bi ne a   L L M   w i t h   s e m a n t i c   r o l e   l a b e li ng  ( S R L )   to  de t e c t h e   m a i pr e d i c a t e ,   a r gum e n t s ,   a n t h e i r   r e l a t i o n s   in   a   s e n t e n c e .   S R L   wo r ks   by   l a be li ng  t h e   gr a m m a t i c a l   r o l e s   o f   wo r ds ,   i de n t i f y i ng  pr e d i c a t e s ,   a n li nk i n t he m   t o   r e l e v a n t   a r gum e n t s ,   s uc h   a s   pa t i e n t s   o r   do c to r s .   Al t h o ugh   t h e   pr o p o s e m e t h o pe r f o r m e we ll   o n   t h e   s m a ll   d a t a s e t ,   pe r f o r m a n c e   i nc r e a s e s   w i t h   l a r ge r   da t a s e t s ,   wh e r e   m o r e   d i v e r s e   e x a m p l e s   a r e   i n c l ud e d.   Ho we v e r ,   i f   a pp li e t o   o u t - of - do m a i n   t e x t s ,   S R L   f a c e s   c h a ll e n g e s   t h a t   r e duc e   i t s   r o b us t n e s s   a n e f f e c t i v e n e s s .   I n   a l l ,   t h e s e   XA I   m e t h o ds   e nh a n c e   m o de l   i n t e r pr e t a bi li t y .   Ho we v e r ,   t h e y   a l l   h a v e   t h e i r   own   s h o r t f a ll s c o m put a t i o n a l   c o m p l e xi t y ,   s us c e p t i bil i t y   t o   t r a i ni ng  da t a ,   a n l im i t e pe r f o r m a n c e   o n   o ut - of - d o m a i n   t e x t s .   W hil e   s o m e   o f   t h e s e   c a n   b e   m i t i ga t e t h r o ugh   m o r e   d i v e r s e   da t a s e t s   o r   d o m a i n - s p e c i f i c   t r a i ni n g,   ot h e r s   m a y   i n d e e r e qu i r e   f ur t h e r   i nn o v a t i o to   f u l ly  o p t i mi z e   t h e i r   a pp li c a bil i t y   i n   r e a l - t i m e   a n i n   a   c l ini c a l   s e t t i n g.   E x p l a i na bi li t y   i s   vi t a l   i t h e   m e d i c a l   do m a in   f o r   c l e a r   c o m m u ni c a t i o n   a m o n h e a l t hc a r e   pr o f e s s i o n a l s   a n pa t i e n t s ,   pa r t i c u l a r l y   f o r   c l i n i c a l   a bb r e vi a t i o ns   [ 55] .   M e t h o ds   l i k e   L I M E ,   S HA P ,   I G,   a n S R L   e nh a nc e   i n t e r pr e t a bi li t y   i n   N L P   b ut   f a c e   c ha l l e n ge s .   L I M E   a n S HA P   a r e   c o m p ut a t i o n a ll y   in t e ns i ve ,   hi nde r i ng  r e a l - t i m e   us e ,   whi c h   a ppr o xim a t i o n   m e t h o ds   c o ul a ddr e s s .   I s t r uggl e s   w i t h   c o m p l e m e d i c a l   l a n gua ge ,   r e qu i r i n do m a i n - s pe c if i c   t r a i ni ng,   w hil e   S R L ' s   pe r f o r m a n c e   o n   o u t - of - do m a i n   t e x t s   c o ul d   im pr o v e   t h r o ugh   a da pt i v e   l e a r ni n g.   B i a s e s   i t r a i nin da t a   a l s o   po s e   r i s k s ,   e m p ha s i z i ng  t h e   n e e f o r   t h o r o ugh   a ud i t i n g.   T a c k l i ng  t h e s e   i s s ue s   i s   c r uc i a l   f o r   r e l i a bl e   NL P   m o de l s ,   e n s ur i ng  pr e c i s i o n   i m e d i c a c o m m u ni c a t i o n   a n pa t i e n t   c a r e .       5.   RE S UL T   AN DI S CU S S I ON   I m p l e m e n t i n N L P   t e c h ni que s   f o r   E M R   de c i ph e r i ng  a n I C c o di n pr e s e n t s   s e v e r a l   ke c h a ll e n g e s .   On e   s i g ni f i c a n t   i s s u e   i s   t h e   l a c o f   d i ve r s e   tr a i ni ng  da t a ;   m a ny   N L P   m o de l s ,   i n c l ud i ng  B E R T   a n i t s   v a r i a n t s ,   r e l y   h e a vil y   o n   do m a i n - s p e c i f i c   t r a i ni ng  da t a s e t s   t h a t   o f t e n   l a c t h e   n e c e s s a r y   d i ve r s i t y .   T his   li mi t a t i o n   c a n   hi nde r   t h e   m o de l ' s   a bi li t y   t ge n e r a li z e   a c r o s s   v a r i o us   m e d i c a l   s pe c i a l t i e s   a n t y p e s   o f   c l i n i c a t e x t s .   T a ddr e s s   t hi s   c ha l l e n g e ,   i t   i s   c r uc i a l   t de v e l o m o r e   c o m pr e he n s i ve   t r a i ni ng  da t a s e t s   t h a e nc o m pa s s   a   w i de r   r a n ge   o f   m e d i c a l   c o n t e x t s .   A dd i t i o n a ll y ,   ge n e r a l - pur po s e   m o de l s   li ke   GPT   m a y   s t r uggl e   wi t h   t a s ks   r e qu i r i n s pe c i a l i z e kn o w l e dg e ,   a s   t h e i r   pr e - t r a i ni ng  da t a   i s   n o t a i l o r e to   h e a l t h c a r e   c o n t e x t s .   F i ne - t uni n t h e s e   m o de l s   o n   s pe c i f i c   h e a l t h c a r e   da t a s e t s   c a n   e nh a n c e   t h e i r   pe r f o r m a n c e ,   whil e   hy br i m o de l s   t h a c o m bi ne   t h e   s t r e n gt h s   o f   d i f f e r e n t   a r c hi t e c t u r e s   s uc h   a s   B E R T   f o r   un de r s t a n d i n c o n t e x a n GPT   f o r   ge n e r a t i n c o h e r e n t   t e x t   c o ul i m pr o v e   t h e i r   e f f e c t i ve n e s s   i n   c li n i c a l   a pp li c a t i o n s .   An o t h e r   c h a l l e nge   l i e s   i n   t h e   c o m p l e xi t y   o f   c li ni c a l   l a n gua ge ,   wh e r e   t h e   n ua n c e a n v a r i e n a t ur e   o f   m e d i c a l   t e r m i n o l o g y   c a n   hi nde r   N L P   s y s t e m s un de r s t a n d i ng,   m a k i ng  i t   d i f f i c u l t   t o   a c c ur a t e l y   i n t e r pr e a bb r e vi a t i o n s   a n c o n c e pt s .   I m p l e m e n t i n a d va n c e t e c h ni que s   l i ke   do m a i a da pt a t i o n   a n d   u t i li z i ng   kn o w l e dge   gr a p h s   to   i nf o r m   m o de l s   a b o ut   th e   r e l a t i o ns hi ps   b e t we e n   m e d i c a l   t e r m s   c a n   im pr o v e   c o m pr e h e ns i o n   a n a c c ur a c y .   F ur t h e r m o r e ,   i n t e gr a t i n NL P   s y s t e m s   i n t e xi s t i n h e a l t h c a r e   wo r kf l o ws   po s e s   d i f f i c u l t i e s   due   t o   p ot e n t i a l   r e s i s t a nc e   to   c h a n ge   a n t h e   n e e f o r   us e r - f r i e n d ly   i n t e r f a c e s .   E n ga g i ng   s t a ke h o l de r s   e a r l y   i n   t h e   de v e l o p m e n t   pr o c e s s   a n e ns ur i n t h a NL P   too l s   a l i g n   w i t h   c l i n i c a l   ne e ds   w i l l   f a c il i t a t e   s m o ot h e r   a d o p t i o n .   L a s t l y ,   r e gu l a t or y   a n e t hi c a l   c o n c e r ns   s ur r o un d i ng  pa t i e n t   p r i va c y   a n c o m p li a n c e   w i t h   h e a l t h c a r e   r e gu l a t i o n s   a r e   c r i t i c a l   t c o n s i de r .   De v e l o p i ng  c l e a r   gui de li ne s   f o r   da t a   us a ge ,   i nc o r p o r a t i n r o b us s e c ur i t y   m e a s ur e s ,   a n e n s ur i ng  tr a n s pa r e n c y   i n   m o de l   de c i s i o ns   c a n   h e l a ddr e s s   t h e s e   c o n c e r n s .   B y   t a c k l in t h e s e   c h a ll e n g e s   t h r o ugh   t a r ge t e d   da t a   c o l l e c t i o n ,   f i ne - t u ni ng,   hy b r i m o de l i ng,   a n c a r e f u l   i n t e gr a t i o n   i n t c l i n i c a wo r kf l o ws ,   we   c a n   s i g nif i c a n t l y   e nh a nc e   t h e   e f f e c t i v e n e s s   o f   NL P   t e c hni qu e s   f o r   E M R   de c i p h e r i ng  a n I C c o di n g,   u l t i m a t e l y   l e a d i n t i m pr o v e pa t i e n t   o u tco m e s   a n s t r e a m li ne h e a l t h c a r e   pr o c e s s e s .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2252 - 8776   I n t   J   I n f   &   C o m m u n   T e c hn o l Vo l .   1 4 ,   N o.   3 De c e m be r   20 2 5 :   881 - 8 9 1   888   6.   CONC L USI ON    I n   c o n c l us i o n ,   t h e   i m p l e m e n ta t i o n   o f   NL P   te c h niq ue s   f or   E M R   de c i ph e r i n g   a n d   I C D   c odi n g   h o l ds   s i gni f i c a n p r o m i s e   f or   e n h a n c i n g   h e a l t h c a r e   de l i ve r y .   H ow e v e r ,   th e   ke y   c h a l l e n ge s   a s s oc i a t e d   w i t di v e r s e   tr a i ni n g   d a ta ,   t h e   c o m p l e xi t y   o f   c l i ni c a l   l a n gua g e ,   i n t e g r a t i o n   i n to  e x i s t i n g   w or k f l o ws ,   a n d   r e g ul a tor y   c o m pl i a n c e   m us b e   e f f e c t i v e l y   a d d r e s s e d   to  m a xi m i z e   t h e   p oten t i a l   o f   t h e s e   tec h n o l o gi e s .   B y   de v e l op i n g   c o m p r e h e n s i v e   tr a i ni n d a tas e ts   t h a e n c o m pa s s   a   b r oa r a n ge   o f   m e di c a l   c o n tex t s   a n d   e m p l o y i n f i n e - tuni n s tr a tegi e s   f o r   s pe c i a l i z e d   m o d e l s ,   we   c a n   i m pr o v e   th e   a c c u r a c y   a n d   r e l i a bi l i t y   o f   NL P   a p pl i c a t i o n s   i c l i ni c a l   s e tt i n gs .   F ur th e r m or e ,   l e v e r a g i n hy b r i d   m ode l s   t h a c o m bi n e   t h e   s tr e n g t h s   o f   v a r i o us   a r c hi t e c tu r e s   c a n   l e a d   to   b e tt e r   un d e r s tan di n a n d   ge n e r a t i o n   o f   m e d i c a l   tex t s ,   f a c i l i t a t i n c l e a r e r   c o m m uni c a t i o n   a n d   i m pr o v e d   d e c i s i o n - m a k i n g.   E n g a gi n s ta ke h o l de r s   t h r ough ou t h e   pr oc e s s   a n d   e n s u r i n c o m p l i a n c e   wi t h   e t h i c a l   a n r e gul a tor y   s tan da r ds   wi l l   p r o m ote   t h e   s u c c e s s f u l   a d op t i o n   o f   N L P   tool s   i n   h e a l t h c a r e .   Ul t i m a t e l y ,   by   o v e r c o m in g   th e s e   c h a l l e n ge s ,   w e   c a n   h a r n e s s   t h e   f u l l   c a pa bi l i t i e s   o f   NL P   to  s tr e a m l i n e   c l i ni c a l   w or kf l o ws ,   i m pr o v e   pa t i e n t   ou tc o m e s ,   a n d   tr a n s f or m   t h e   l a n ds c a p e   o f   h e a l t h c a r e   a n a l y t i c s   a n d   d oc um e n ta t i o n .       AC K NOWL E DGE M E NT S     W e   e x t e n o ur   h e a r t f e l t   gr a t i t ude   to   o ur   r e s e a r c h   t e a m   f o r   t h e i r   un w a v e r i n s uppo r t ,   gui da nc e ,   a n d   i nva l ua bl e   f e e d b a c t h r o ugh o u t hi s   pr o j e c t .   W e   a l s o   t h a n t h e   F a c u l t y   o f   C o m p ut e r   a n M a t h e m a t i c a S c i e n c e s ,   Uni ve r s i t i   T e kn o l o g i   M A R A ,   S h a h   Al a m ,   S e l a n go r ,   M a l a y s i a   f o r   p r o vi d i ng  t h e   e s s e n t i a l   r e s o ur c e s   f o r   t hi s   s t udy .   W e   a ppr e c i a t e   t h e   c o n t r i b ut i o ns   o f   t h e   r e s e a r c h e r s   a n a ut h o r s   r e vi e we i n   t hi s   pa p e r .   T hi s   wo r k   wa s   s uppor t e by   t h e   H i g h e r   I n s t i t u t i o n   C e n t r e   o f   E x c e ll e n c e   ( HI C o E )   r e s e a r c h   gr a n t   600 - R M C / M OH E   HI C o E   C A R E - I   5/3  ( 01/2025)   a wa r de to  t h e   C a r d i o va s c u l a r   A d v a n c e m e n t   a n R e s e a r c E x c e ll e n c e   I n s t i t ut e   ( C A R E   I ns t i t ut e ) ,   Uni ve r s it i   T e kn o l o g i   M AR A .   T h a n y o a ll   f o r   m a k i n t h i s   a c hi e ve m e n t   p o s s i bl e       F UN DI NG  I N F ORM AT I ON    A ut h o r s   s t a t e   n f u n d i ng  i nv o l v e d.       AU T HO CONT RI B UT I ONS   S T AT E M E NT       Nam e   of   Aut h or   C   M   So   Va   Fo   I   R   D   O   E   Vi   Su   P   Fu   Nur u l   Ani s   B a l q i s   I qb a B a s h e e r                               S h a r i f a li ll a h   No r di n                               S az z l i   S ha hl a n   Ka s s im                               A z li z a   M o h Ali                               Nur z e a t ul   Ha mi m a h   Ab du l   Ha mi                                 C     C o n c e pt ua li z a ti o n   M     M e th o d o l o g y   So     So f twa r e   Va     Va li da ti o n   Fo     Fo r ma a na l y s is   I     I nve s ti ga ti o n   R     R e s o u r c e s   D   :   D a ta  C ur a ti o n   O   :   W r it in -   O r ig in a D r a f t   E   :   W r it in -   R e v i e w  &   E di ti ng   Vi     Vi s ua li z a ti o n   Su     Su pe r v is io n   P     P r o j e c a dmi ni s tr a ti o n   Fu     Fu ndi ng a c qui s it i o n         CONF L I CT   OF   I NT E RE S T   S T AT E M E NT     A ut h o r s   s t a t e   n c o nf li c t   o f   i n t e r e s t .       DA T AV AI L AB I L I T   Da t a   a v a i l a bil i t y   i s   n o a ppl i c a bl e   to   t hi s   pa pe r   a s   n o   n e da t a   we r e   c r e a t e or   a n a l y z e i n   t hi s   s t udy .       RE F E R E NC E S   [ 1]   A B o hr   a nd  K M e ma r z a de h,  T h e   r is e   of   a r ti f ic ia in te l l ig e n c e   in   h e a lt h c a r e   a ppl ic a ti o ns ,”   in   A r ti f ic ia I nt e ll ig e nc e   in   H e al th c ar e , 2020, pp. 25 60. do i:  10.1016/b978 - 0 - 12 - 818438 - 7.00002 - 2.   [ 2]   H G oo dr um,  K R o b e r ts   a nd  E V B e r ns ta m,  A ut o ma ti c   c la s s if i c a ti o of   s c a nn e e l e c tr o ni c   h e a lt r e c or doc um e n ts ,”   I nt e r nat io nal  J our nal  of  M e di c al  I n f or m at ic s , v o l.  144, p. 1043 02, De c . 2020, d oi 10.1016/j .i jm e di n f .2020.104302.   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t   J   I n f   &   C o m m u n   T e c hn o l     I S S N:   2252 - 8776       R e v ie w   of   N L P   in  E M R :   abbr e v iat ion,   diagnos is ,   a nd  I C D   c las s if ication   ( N ur ul  A nis   B alqi s   I qbal  B as he e r )   889   [ 3]   M .   C D u r a ngo ,   E .   A .   T o r r e s - S il v a   a nd   A .   O r o z c o - D u que N a me e nt i t y   r e c o gn it io n   in   e le c tr o n ic   he a lt h   r e c o r d s :   a   me t ho do lo g ic a r e v ie w ,”   H e al th c a r e   I n fo r m at i c s  R e s e a r c h , v o l.  2 9,  no .  4 pp 28 6 3 00 O c t.  2 02 3,  do i 10 .4 25 8/ h ir . 20 23 .2 9. 4. 28 6.   [ 4]   J F e r gus o n I C D - 10  P r oc e du r e   c o d e s :   ha r ne s s in g   th e   po w e r   of   pr oc e du r e   c o d e s ,”   H e a lt C a ta l y s t,   2023.  [ O nl in e ] A v a il a bl e :   ht tp s :/ /ww w .he a lt hc a ta l y s t. c om/ in s ig ht s /i c d - 10 - p c s - ha r ne s s in g - th e - p o w e r - of - pr oc e dur e - c o d e s   ( a c c e s s e d 8 Oc t o b e r  2024 ) .   [ 5]   F T e ng,  Y L iu T L i,   Y Z ha ng,  S L a nd  Y Z ha o " A   r e vi e w   o de e ne u r a ne tw o r ks   f o r   I C D   co di ng, "   in   I E E E   T r ans ac ti ons   on K now le dge  and Data E ngi ne e r in g , vo l.  35, n o . 5, pp. 4357 - 4 375, 1 M a y  2023, d o i 10.1109/ T K D E .2022.3148267.    [ 6]   C . B le a s e ,  J T o r o us   a nd M . H ä ggl und, “ D oe s  pa ti e nt  a c c e s s  t o   c li ni c a n o t e s  c ha ng e  d oc ume n ta ti o n? ,"   F r ont ie r s  i P ubl ic  H e al th vo l.  8, N ov . 2020, d o i:  10.3389/ f pubh.2020.577896.   [ 7]   H. - J K o ng,  M a na gi ng  uns tr uc tu r e bi da ta   in   he a lt hc a r e   s y s t e m,”   H e al th c ar e   I n f or m at ic s   R e s e ar c h ,   v o l.   25,  n o 1,  p p.   1 - 2 J a n.   2019, do i:  10.4258/hi r .2019.25.1.1.   [ 8]   V D L a e al . C h a tG P T   B e y ond  E ngl is h:   t o w a r ds   a   c ompr e h e ns i v e   e v a lu a ti o of   la r g e   la ngua ge   m o d e ls   in   mul ti li ngua le a r ni ng,”   ar X iv  ( C or ne ll  U ni v e r s it y ) , J a n. 2023, do i:  10.48550/ a r x i v .2304.05613.   [ 9]   A M N a ir   a nd  K R B in du,  S e ma nt i c   r ol e   la b e ll in us in g   tr a ns f e r   l e a r ni ng  m o d e l,   J our nal   of   P hy s ic s   C on f e r e nc e   Se r ie s   vo l.  1767, n o . 1, p. 012024, F e b. 2021, d o i:  10.1088/1742 - 6596 /1 767/ 1/ 012024.   [ 10]   C B a s u,  R V a s u,   M Y a s una ga , a nd  Q Y a ng,  M e d - E A S I f in e l y   a nn o ta te da ta s e a nd  m o d e ls   f o r   c o nt r ol la bl e   s im pl i f ic a ti on  of   me di c a te xt s ,”   ar X iv  ( C or ne ll  U ni v e r s it y ) ,   J a n. 2023, do i:  10.48550/ar x i v .2302.09155.   [ 11]   C L u,  C K R e dd y P W a ng,  a nd  Y N in g,  T o w a r ds   s e mi - s tr uc tu r e a ut o ma ti c   I C D   c o di ng  v ia   tr e e - ba s e c o nt r a s ti v e   l e a r ni ng,”   ar X iv  ( C or ne ll  U ni v e r s it y ) ,   J a n. 2023, do i:  10.48550/ar x i v .2310 .09672.   [ 12]   C P e s qui ta T o w a r ds   s e ma nt i c   in t e g r a ti o f o r   e x pl a in a bl e   a r ti f i c ia in t e ll ig e nc e   in   th e   bi o m e di c a d o ma i n,”   Sc ie nc e   and   T e c hn ol ogy  P ubl ic at io ns , J a n. 2021, do i:  10.5220/001038970 7 470753.   [ 13]   N S F a r a ma r z i,   M P a t e l,   S H B a nda r upa ll y a nd  R B a ne r j e e C o nt e x t - a w a r e   m e di c a ti o e ve nt   e x t r a c ti o n   f r o m   uns tr uc t ur e te x t,   A c la nt hol ogy ,   J a n. 2023, do i 10.18653/ v 1/ 2023. c li ni c a ln l p - 1.11.   [ 14]   A . K ugi c B P f e i f e r S . S c hul z , a nd M K r e u z th a l e r , “ E mbe ddi ng - ba s e d t e r mi n o l o g y   e x pa ns i o v ia  s e c o nda r y   us e   of  l a r g e   c li n ic a l   r e a l - w o r ld  da ta s e ts ,”   J our nal  of  B io m e di c al  I n f or m at ic s , v o l.  1 47, p. 104497, Nov . 2023, d o i:  10.1016/j .j b i. 2023.10 4497.   [ 15]   A S a th y a n,  A I W e in be r a nd  K C o he n,   I nt e r pr e ta bl e   A I   f o r   bi o - m e di c a a ppl i c a ti o ns ,”   C om pl e x   E ngi ne e r in Sy s te m s v ol 2,   no . 4, p. 18, J a n. 2022, do i 10.20517/ce s .2022.41.   [ 16]   A M il la n - F e r na nd e z - M o nt e s D P e r e z - R e y G .   H e r na nde z - I b a r bu r u,  M B .   P a lc huk,   C M ue ll e r ,   a nd  B .   C la e r h o ut ,   M a ppi ng   c li ni c a pr o c e du r e s   t o   th e   I C D - 10 - P C S th e   G e r ma o pe r a t io a nd  pr o c e dur e   c la s s if i c a ti o s y s t e us e   c a s e ,”   J our nal   o B io m e di c al  I nf or m at ic s , v o l.  109, p. 103519, S e p. 2020, d o i:  10 .1016/j .j bi .2020. 103519.   [ 17]   R L .   J o hns o n,  H H e de ga a r d,  E S .   P a s a li c a nd  P D .   M a r ti ne z U s e   of   I C D - 10 - C M   c o d e h o s pi ta li s a ti o a nd  e me r ge nc de pa r tm e nt   da ta   f or   in ju r y   s ur v e il la nc e ,”   I n ju r y   P r e v e nt io n vol 27,  n o S uppl   1,  pp.  i1 i2 ,   M a r 2021,  d o i:   10.1136/ in ju r y   p r e v - 2019 - 043515.   [ 18]   G B G e br e m e s ke l,   B H a il u   a nd  B B ia z e n,  A r c hi t e c tu r e   a nd  o pt i mi z a ti o n   of   da ta   mi ni ng  m o de l in f o r   v is ua li z a ti on  of   kno w l e dg e   e x t r a c ti o n:   P a ti e n s a f e t y   c a r e ,”   J our nal   of   K in Sa ud  U ni v e r s it y C om put e r   and  I nf o r m at io Sc ie nc e s vo l.   34,  n o.  2,  pp. 468 479, F e b. 2022, d o i:  10.1016/j . jk s uc i. 2019.12.001.   [ 19]   H A S ha ms i,   A G A lm ut a ir i,   S A M a s hr a f i   a nd  T A K a lb a ni I mpl ic a ti o ns   of   la ngua ge   ba r r i e r s   f o r   he a lt h c a r e a   s y s te m a ti c   r e v i e w ,”   O m an M e di c al  J our nal , vo l.  35, n o . 2, p.   e 122, M a r . 2020, do i:  10.5001/ o m j. 2020.40.   [ 20]   L .   O u,  Y Y a o X L u o X L a nd  K C h e n,  C o nt e x tAD c o nt e x t - a w a r e   a c r o n y di s a mbi gua ti o n   w it s ia me s e   B E R T   ne t w or k,”   I nt e r nat io nal  J our nal  of  I nt e ll ig e nt  Sy s te m s , v o l.  2023, pp. 1 1 4, J ul . 2023, do i:  10.11 55/ 2023/5014355.   [ 21]   S L F l e mi ng  e al . M e dA li gn:   a   c li n i c ia n - g e ne r a te da ta s e t   f o r   in s tr u c ti o f o ll o w in w it e le c t r o ni c   m e di c a r e c or ds ,”   ar X iv   ( C or ne ll  U ni v e r s it y ) , J a n. 2023, do i:  10.48550/ar x i v .2308.1408 9.   [ 22]   S T a l e bi E .   T o ng   a nd  M R K .   M of r a d,  E x pl or in th e   p e r f o r ma n c e   a nd  e x pl a in a bi li t y   of   B E R T   f o r   me d ic a im a ge   pr o t oc o a s s ig nme nt ,”   m e dR x iv  ( C ol d Spr in g H ar bo r  L abor at or y ) , A pr . 2023, do i:  10.1101/2023.04.20 .23288684.   [ 23]   S W a ng,  H L in Y Z ha ng,  X L i,   a nd  W Q u,  M K F N mul ti mo da kn o w l e dge   f us i o n e tw o r f o r   a ut o ma ti c   I C D   c o d in g,”   I E E E   I nt e r nat io nal  C onf e r e nc e  on B io in f or m at ic s  and B io m e di c in e D e c . 2023, d oi 10.1109/bi bm58861.2023.1038 5669.   [ 24]   A R a jk o ma r   e al . D e c ip h e r in c li ni c a a bbr e v ia ti o ns   w it a   pr iv a c y - p r o te c ti ng  ma c hi n e   l e a r ni ng  s y s t e m,”   N at ur e   C om m uni c at io ns , v o l.  13, n o . 1, D e c . 2022, d o i:  10.1038/s 4146 7 - 022 - 35007 - 9.   [ 25]   A R a hma e al . F e de r a t e le a r ni ng - ba s e A I   a ppr o a c h e s   in   s ma r he a lt hc a r e c o n c e pt s ta xo n o mi e s c ha ll e ng e s a nd  ope is s ue s ,”   C lu s te r  C om put in g , v o l.  26, n o . 4, pp. 2271 2311, Aug . 2022, do i:  10.1007/s 10586 - 022 - 03658 - 4.   [ 26]   J S A lp e r t,   T he   e le c t r o ni c   m e di c a r e c o r d   in   2016:   ad v a nt a g e s   a nd  di s a dv a nt a g e s ,”   D ig it al   M e di c in e vo l.   2,  n o .   2,  pp.  48 51,  A pr . 2016, do i:  10.4103 /2 226 - 8561.189504   [ 27]   A S ol e i ma ni C M o n z   a nd  M W o r r in g,  B E R T   f or   e v id e n c e   r e tr i e v a a nd  c la im   ve r i f i c a ti o n,”   A dv anc e s   in   I nf or m a ti on  R e tr ie v al , 2020, pp. 359 366. do i:   10.1007/978 - 3 - 030 - 45442 - 5 _45 .   [ 28]   Y .   K im ,   J . - H .   K im ,   Y . - M .   K i m,   S . S o ng  a n H . J . J o o ,   P r e di c ti ng  me di c a l  s pe c i a l t y   f r o te x t   b a s e d   o n  a  do ma in - s pe c if ic   p r e - tr a in e B E R T ,”   I n te r na ti on al   J ou r na o f   M e di c a I n fo r m at ic s ,   v o l.  1 70 p.   10 49 56 , F e b.  2 02 3,  do i:  1 0. 10 16 /j .i j me di nf .2 02 2. 10 49 56 .   [2 9]   J Y e   e al .,   " T h e   r o l e s   of   e l e c tr o ni c   h e a lt r e c or ds   f o r   c li ni c a t r ia ls   in   lo w -   a nd  mi dd le - in c ome   c o unt r ie s s c o p in r e v i e w , "   J M I R   M e di c al  I nf or m at ic s , v ol . 11, 2023, d o i:  10.2196/47052.   [ 30]   S B A ta ll a h,  N R .   B a nda A B a nda  a nd  N . A R o e c k,  H o w   la r ge   la ngua ge   m o de ls   in c lu di ng  ge n e r a ti ve   pr e - tr a in e tr a ns f o r me r   ( G P T )   a nd  w il im pa c me di c in e   a nd  s ur ge r y ,”   T e c hni que s   in   C ol op r oc to lo gy v o l.   27,  no 8,  pp.  609 614,  J ul 2023,  do i:   10.1007/s 10151 - 023 - 02837 - 8.   [ 31]   A . M ul y a r , O . U z u ne r   a nd   B . M c I n ne s , “ M T - c li ni c a B E R T s c a l in c li ni c a in f o r ma ti o e x tr a c ti o n w i th  mu lt i ta s le a r ni n g,   J our n al   o th e  A m e r i c an  M e di c al   I n fo r m at i c s  A s s o c ia t io n ,  v o l.   28 no 10 p p.  2 10 8 21 15 A u g.  2 02 1,  do i:  1 0. 10 93 /j a m ia /o c a b 12 6.   [ 32]   P N N gugi M C W e r e   a nd  A B a bi c U s e r s   pe r c e pt i o on  f a c t o r s   c o nt r ib u ti ng  t o   e l e c tr o ni c   m e di c a r e c o r ds   s y s t e ms   us e a   f oc us   gr o up   di s c us s io s tu d y   in   h e a lt hc a r e   f a c il it i e s   s e tt in in   K e n y a ,”   B M C   M e di c al   I nf or m at ic s   and  D e c is io M ak in g,   v o l.   21,  no . 1, D e c . 2021, d oi 10.1186/s 1291 1 - 021 - 01737 - x.   [ 33]   V A lo ns o   e al . H e a lt r e c o r ds   a s   th e   ba s is   of   c l in ic a c o di n g:   I s   th e   qua li t y   a d e qua t e ?   A   qua li ta ti ve   s tu d y   of   m e di c a c o d e r s   pe r c e pt i o ns ,”   H e al th   I nf o r m at io M anage m e nt   J our nal /H e al th   I nf or m at io M anage m e nt ,   v o l.   49,  no 1,  pp.  28 37,  F e b.  2019,   do i:  10.1177/183335831 9826351.   [ 34]   J P a r k,  S e le c ti ve l y   c o nn e c te s e l f - a tt e nt i o ns   f o r   s e ma nt i c   r o l e   la be li ng,”   A ppl ie Sc ie nc e s ,   v o l.   9,  n o 8,  p.  1716,  A pr 2019, do i:   10.3390/a pp9081716.   [ 35]   R A be y s in gh e   e al . ,   T o w a r ds   qua li t y   im pr ove m e nt   of   v a c c in e   c o nc e pt   ma ppi ngs   in   th e   O M O P   voc a bul a r y   w it h   a   s e mi - a ut o ma t e d me th o d,”   J our nal  of  B io m e di c al  I n f or m at ic s , v ol . 13 4, p. 104162, Oc t.  2022, d o i:  10.1016/j .j bi .2022.104162.   [ 36]   S S ung,  H . - A P a r k,   H .   J ung,  a nd  H K a ng,  A   S N O M E D   C T   ma ppi ng  gui d e li n e   f o r   th e   l o c a te r ms   us e t o   d oc um e nt   c li ni c a f in d in gs   a nd  pr o c e dur e s   in   e l e c tr o ni c   me d ic a r e c o r d s   in   S o ut K o r e a me th o d ol o gi c a s tu d y ,”   J M I R   M e di c al   I nf or m at ic s v o l.   11,  p. e 46127, Apr . 2023, d o i:  10.2196/46127.   Evaluation Warning : The document was created with Spire.PDF for Python.
                                I S S N :   2252 - 8776   I n t   J   I n f   &   C o m m u n   T e c hn o l Vo l .   1 4 ,   N o.   3 De c e m be r   20 2 5 :   881 - 8 9 1   890   [ 37]   T .   S a nt o s   e al . P a th o l o g y B E R T   --   P r e - tr a in e d   v s a   ne w   tr a ns f o r m e r   la ngua ge   m o d e l   f o r   pa th ol o g y   d o ma in ,”   ar X iv   ( C or ne ll   U ni v e r s it y ) , do i:  10.48550/ar x i v .2205.06885.   [ 38]   M W o r n o w   e al . T he   s ha k y   f o unda ti o ns   of   la r g e   la ngua ge   mo d e ls   a nd  f o unda ti o m o d e ls   f or   e le c t r o ni c   he a lt h   r e c or ds ,”   N pj   D ig it al  M e di c in e , vo l.  6, n o . 1, J ul . 2023, d o i:  10.1038/s 41746 - 023 - 00879 - 8.   [ 39]   Y L iu   e a l. S umm a r y   of   C ha t G P T - r e la t e r e s e a r c h   a nd  p e r s pe c ti ve   t o w a r ds   th e   f ut u r e   of   la r ge   la ngua ge   m o de ls ,”   M e ta - r a di o l o g y vo l . 1, n o . 2, p. 100017,  S e p. 2023, d oi 10.1016/j .m e tr a d.2023.100017.   [ 40]   N S a r a s w a t,   C L a nd  M J ia ng,  I de nt if y in th e   que s ti o s im il a r it y   of   r e gul a t or y   d oc um e nt s   in   th e   pha r ma c e ut i c a in dus tr y   b y   us in g t he  r e c o gni z in g qu e s ti o e nt a il m e nt   s y s t e m:   e v a l ua ti o s tu d y ,”   J M I R  A I vo l.  2, p.  e 43483, S e p. 2023, d o i:  10.2196 /4 348 3.   [ 41]   Z S hua e t   al . C o mpa r is o of   di f f e r e nt   f e a tu r e   e xt r a c t i o n   me th o ds   f or   a ppl ic a bl e   a ut o ma t e d   I C D   c o di ng,”   B M C   M e d ic al   I nf or m at ic s  and De c is io n M ak in g , v o l.  22, n o . 1, J a n. 2022 , do i 10.1186/s 12911 - 022 - 01753 - 5.   [ 42]   L J Y F lo r e s ,   H H u a n g,  K S hi ,   S .   C hhe a n g,   a nd   A C oh a n,  M e d ic a te x s i mp li f ic a ti o n:   o pt i mi z i ng  f o r   r e a d a bi li t y   w it h   u nl ik e l ih o o tr a i ni n a nd  r e r a nke be a s e a r c de c o di n g,   a r X i v   ( C o r n e ll   U ni v e r s it y ) J a n 20 23 do i:   10 .4 85 50 / a r x iv .2 31 0. 11 19 1.   [ 43]   N J o s e ph  e al . A ut o ma te da ta   e xt r a c ti o of   e l e c tr o n ic   m e di c a r e c or ds v a li di t y   of   da ta   mi ni ng   t o   c o ns tr u c r e s e a r c da ta b a s e s   f or   e li gi bi li t y   in   ga s tr oe nt e r o l o gi c a c li ni c a tr ia ls ,”   U ps al J our nal   o f   M e di c al   Sc ie nc e s v o l.   127,   J a n.  2022,     do i:  10.48101/uj ms .v 127.8260.   [ 44]   D H P B e ni c i o J C X a v ie r - J úni o r K R S D e   P a iv a   a nd  J D D e   A r a új o   S a nt   C a ma r go A ppl y in te x mi ni ng  a nd  na tu r a la ngua ge   pr oc e s s in t o   e l e c t r o ni c   m e di c a r e c or ds   f o r   e x tr a c ti n a nd  tr a ns f or mi ng  t e x ts   in t o   s tr u c tu r e da ta ,”   Soc ia Sc ie nc e   R e s e ar c h N e tw or k , J a n. 2021, do i:  10.2139/s s r n.3991515.   [ 45]   S N L a iq u e   e al .,  A ppl i c a ti o of   o pt i c a c ha r a c t e r   r e c o gni ti o w it na tu r a la ngua ge   p r o c e s s in f o r   la r g e - s c a le   qua li t y   m e tr ic   d a ta   e x t r a c ti o in   c o l o n o s c o p y   r e p o r ts ,”   G as tr oi nt e s ti na E ndos c opy v ol 93,  no 3,  pp.  750 757,  M a r 2021,    do i:  10.1016/j .g ie .2020.08.038.   [ 46]   X L i,   H .  C he n, C L iu , J L i,  M Z ha ng, J . Y u a nd M Z ha ng,  " L L M s   c a n a ls o  d o w e l l !   B r e a ki ng ba r r ie r s  i n s e ma nt ic  r o l e   la be li ng  v ia  l a r g e  l a ngua ge  m o d e ls , "   ar X iv ,   2025, d o i:  10.48550/ar X i v .2 506.05385.   [ 47]   R R a ma c ha ndr a a nd  K A r ut c h e l v a n,  N a me d   e nt it y   r e c ogni ti o n   o bi o - m e di c a l   li t e r a tu r e   d oc um e nt s   us in h y b r id   b a s e a ppr o a c h,”   J ou r nal  of  A m bi e nt  I nt e ll ig e nc e  &  H um ani z e d C om put in g , M a r . 2021, do i:  10.1007/s 12652 - 021 - 03078 - z.   [ 48]   D W e a th e r s p oo a nd  A C h a tt o pa dh y a y I nt e r na ti o na c la s s if i c a ti o of   d is e a s e s   c o d e s   a nd  th e ir   us e   in   de nt is tr y ,   P ubM e C e nt r a ( P M C ) , 2013.  [ O nl in e ] . A v a il a bl e ht tp s :/ /n c bi .nl m.ni h. gov /p m c /a r ti c l e s /P M C 4394630/   ( a c c e s s e d 8 Oc t o b e r  2024 ) ..   [ 49]   V . M a y y a ,  S .  S K a ma th  a nd V . S ugu ma r a n,  L A T A   -   la b e a tt e nt i o tr a ns f o r m e r  a r c hi te c tu r e s   f or   I C D - 10  c o di ng   of  uns tr u c t ur e d   c li ni c a n o t e s ,   I E E E   C onf e r e nc e   on  C om put at io nal   I nt e ll ig e nc e   in   B io in f or m at ic s   and  C om put at io nal   B io lo gy ,   2021,  do i:   10.1109/c ib c b49929.2021.9562815.   [ 50]   I A de n,   C H T C hi ld   a nd   C C R e y e s - A ld a s o r o ,   " I n te r na ti o na c la s s if ic a ti o n   of   d is e a s e s   pr e di c ti o n   f r o m   M I M I I C - I I I   c li ni c a te x us in g   p r e - tr a in e c li ni c a lB E R T   a nd  N L P   d e e l e a r ni n mo d e ls   a c hi e v in s ta te   of   th e   a r t, "   B ig   D at and   C ogni ti v e   C om put in g , vo l.  8, n o . 5, p. 47, 2024, d o i:  10.3390/bd c c 805004 7.    [ 51]   H D o ng,  V S r e z - P a ni a gua W W hi te l e y   a nd  H W u,  E x pl a in a bl e   a ut o ma te c o d in g   of   c li ni c a n o t e s   us in hi e r a r c h ic a la be l - w is e   a tt e nt i o n e tw o r ks   a nd  la be e mb e ddi ng  in it ia li s a ti o n,”   J our nal   of   B io m e di c al   I nf o r m at ic s ,   v ol 116,  p.  103728,  A pr 2021,   do i:  10.1016/j . jb i. 2021.103728.   [ 52]   J A ma nn,  A B la s im me E V a y e na D F r e y   a n V I M a da i,   E x pl a in a bi li t y   f o r   a r ti f i c ia in t e ll ig e nc e   in   h e a lt h c a r e a   mul ti di s c ip li na r y   p e r s p e c ti v e ,”   B M C   M e di c al   I nf or m at ic s   and  D e c is io M ak in g v ol 20,  n o 1,  N ov 2020,  d o i:   10.1186/s 129 11 - 020 - 01332 - 6.   [ 53]   P Z ha ng  a nd  M N K B o ul o s G e n e r a t i ve   A I   in   m e di c in e   a nd  he a lt h c a r e pr o m is e s o pp o r tu ni ti e s   a nd  c ha ll e nge s ,”   F ut ur e   I nt e r ne t , vo l.  15, n o . 9, p. 286, Aug. 202 3, d o i:  10.3390/ f i1 509 0286.   [ 54]   S M ir z a e i,   H M a o R R O .   A l - N im a a nd   W L W oo E x p la in a bl e   A I   e v a lu a ti o n:   a   to p - d o w a ppr o a c f o r   s e le c ti ng  o pt i ma e x pl a na ti o ns  f or  bl a c k - b ox  m o d e ls ,”   I nf or m at io n,   v o l.  15, n o . 1 , p. 4, De c . 2023, d oi 10.3390/i n f o 15010004.   [ 55]   S . A li   e al . ,  “ E x pl a in a bl e   a r ti f i c ia in te l li ge n c e   ( X A I ) W ha w e  kn o w  a nd w ha is  l e f t o  a tt a in   tr us twor th y   a r ti f i c ia in t e ll ig e n c e ,”   I nf or m at io n F us io n , vo l.  99, p. 101805, N ov . 2023, d o i:  10.101 6/ j. in f f us .2023.101805.       B I OG RA P HI E S   OF   AU T HO RS        N u r u l   A ni s   Ba l qi s   I qba l   Ba s h eer           i s   p u rs u i n g   h e r   m as t e r's   d e g r ee  i n   co m p u t e r   s c i e n ce   at   U n i v e rs i t i   T e k n o l o g i   M A RA   ( U i T M),   S h ah   A l a m .   S h e   o b t ai n ed   h e d i p l o m i n   c o m p u t e s ci e n ce   fro m   U i T M,   K ed ah .   Sp ec i a l i zi n g   i n   art i fi ci al   i n t el l i g en ce ,   s h e   h as   k ee n   fo cu s   o n   i n t el l i g en ce   p ro g ra mmi n g   an d   d at s c i en ce .   Sh e   c o n ce n t rat e d   o n   p red i c t i n g   s t o c k   p ri ce s   d u r i n g   h e b ach e l o r's   s t u d i e s   at   U i T M,   Sh ah   A l a m .   C u rr e n t l y ,   h e r e s e ar ch   i n t e r e s t   l i e s   i n   b i o i n fo r m at i c s .   S h e   c an   b e   co n t a c t ed   at   em ai l :   n u r u l a n i s b al q i s i q b al b as h e e r @ g m a i l . c o m .         D r.   S h a ri f a l i l l a h   N o rdi n           l e arn ed   h e Ba ch el o o I n fo rm at i o n   T ec h n o l o g y   fr o U n i v e rs i t i   U t ara  Mal a y s i ( U U M)   i n   2 0 0 1 ,   fo l l o w ed   b y   a   Mas t e o S ci e n ce  i n   In t e r n e t   Co m p u t i n g   fro m   t h e   U n i v e rs i t y   o Su rr ey ,   U K ,   i n   2 0 0 3 ,   an d   Ph . D .   i n   b i o i n f o r m at i c s   fro m   U n i v e rs i t i   Mal a y (U M)  i n   2 0 1 0 .   Cu rre n t l y   s e r v i n g   a s   Se n i o L ec t u r e at   t h e   Fa c u l t y   o f   Co m p u t e a n d   Mat h em at i c al   S c i en ce s ,   U n i v e rs i t i   T ek n o l o g i   MA R A ,   S h ah   A l a m ,   S e l a n g o r,   Mal a y s i a ,   s h e   h as   b ee n   mem b e o t h U i T ac a d em i c   co mm u n i t y   s i n ce  2 0 0 9 .   Sh e   i s   d ee p l y   c o mmi t t e d   t o   t e a ch i n g   a n d   r e s e ar c h ,   w i t h   h e r   e x p e rt i s e   s p an n i n g   b i o d i v e rs i t y   i n f o r m at i c s ,   k n o w l ed g e n g i n ee ri n g ,   a n d   art i fi ci al   i n t el l i g e n ce.   F o i n q u i ri e s ,   s h e   c a n   b e   co n t a c t ed   at   em a i l s h ari fal i l l a h @ u i t m . ed u . my .   Evaluation Warning : The document was created with Spire.PDF for Python.