I
nte
rna
t
io
na
l J
o
urna
l o
f
Rec
o
nfig
ura
ble a
nd
E
m
be
dd
e
d Sy
s
t
e
m
s
(
I
J
R
E
S)
Vo
l.
14
,
No
.
1
,
Ma
r
ch
20
25
,
p
p
.
2
5
4
~
2
64
I
SS
N:
2089
-
4864
,
DOI
:
1
0
.
1
1
5
9
1
/i
j
r
es
.
v
1
4
.
i
1
.
pp
2
54
-
2
64
254
J
o
ur
na
l ho
m
ep
a
g
e
:
h
ttp
:
//ij
r
es.ia
esco
r
e.
co
m
M
ulti
m
o
da
l
recog
nition w
ith
deep l
ea
rning
:
a
udio
,
i
m
a
g
e
,
a
nd
text
Ra
v
i G
u
mm
u
la
,
Vino
t
h
ku
ma
r
Aru
m
ug
a
m
,
A
bil
a
s
ha
Ara
ng
a
na
t
ha
n
D
e
p
a
r
t
me
n
t
o
f
El
e
c
t
r
o
n
i
c
s a
n
d
C
o
mm
u
n
i
c
a
t
i
o
n
En
g
i
n
e
e
r
i
n
g
,
D
r
.
M
.
G
.
R
.
E
d
u
c
a
t
i
o
n
a
l
a
n
d
R
e
se
a
r
c
h
I
n
st
i
t
u
t
e
,
C
h
e
n
n
a
i
,
I
n
d
i
a
Art
icle
I
nfo
AB
ST
RAC
T
A
r
ticle
his
to
r
y:
R
ec
eiv
ed
Au
g
1
,
2
0
2
4
R
ev
i
s
ed
Sep
1
1
,
2
0
2
4
A
cc
ep
ted
Sep
2
8
,
2
0
2
4
Em
o
ti
o
n
d
e
tec
ti
o
n
is
e
ss
e
n
ti
a
l
in
m
a
n
y
d
o
m
a
in
s
in
c
lu
d
in
g
a
ffe
c
ti
v
e
c
o
m
p
u
ti
n
g
,
p
sy
c
h
o
lo
g
ica
l
a
ss
e
ss
m
e
n
t
,
a
n
d
h
u
m
a
n
c
o
m
p
u
ter
in
tera
c
ti
o
n
(HCI).
It
c
o
n
tras
ts
t
h
e
stu
d
y
o
f
e
m
o
ti
o
n
d
e
tec
ti
o
n
a
c
ro
ss
tex
t,
ima
g
e
,
a
n
d
sp
e
e
c
h
m
o
d
a
li
ti
e
s
to
e
v
a
lu
a
te
st
a
te
-
of
-
th
e
-
a
rt
a
p
p
ro
a
c
h
e
s
in
e
a
c
h
a
re
a
a
n
d
id
e
n
ti
f
y
th
e
ir
b
e
n
e
f
it
s
a
n
d
sh
o
rt
c
o
m
in
g
s.
W
e
lo
o
k
e
d
a
t
p
re
se
n
t
m
e
th
o
d
s,
da
tas
e
ts
,
a
n
d
e
v
a
lu
a
ti
o
n
c
rit
e
ria
b
y
c
o
n
d
u
c
ti
n
g
a
c
o
m
p
re
h
e
n
siv
e
li
tera
tu
re
re
v
ie
w
.
In
o
rd
e
r
to
c
o
n
d
u
c
t
o
u
r
st
u
d
y
,
we
c
o
ll
e
c
t
d
a
ta,
c
lea
n
it
u
p
,
i
d
e
n
ti
f
y
it
s
c
h
a
ra
c
teristics
a
n
d
th
e
n
u
se
d
e
e
p
lea
rn
in
g
(DL
)
m
o
d
e
ls.
In
o
u
r
e
x
p
e
rim
e
n
ts
w
e
p
e
r
f
o
r
m
e
d
tex
t
-
b
a
se
d
e
m
o
t
io
n
id
e
n
ti
f
ica
ti
o
n
u
sin
g
l
o
n
g
s
h
o
rt
-
term
m
e
m
o
r
y
(
L
S
T
M
),
ter
m
f
re
q
u
e
n
c
y
-
in
v
e
rse
d
o
c
u
m
e
n
t
f
re
q
u
e
n
c
y
(T
F
-
IDF)
v
e
c
to
rize
r
,
a
n
d
im
a
g
e
-
b
a
se
d
e
m
o
ti
o
n
re
c
o
g
n
it
io
n
u
sin
g
a
c
o
n
v
o
lu
ti
o
n
a
l
n
e
u
ra
l
n
e
tw
o
rk
(CNN
)
a
lg
o
rit
h
m
.
Co
n
tri
b
u
t
in
g
to
t
h
e
b
o
d
y
o
f
k
n
o
w
led
g
e
in
e
m
o
t
io
n
re
c
o
g
n
it
i
o
n
,
o
u
r
st
u
d
y
'
s
re
su
lt
s
p
ro
v
id
e
li
g
h
t
o
n
th
e
in
n
e
r
w
o
rk
in
g
s
o
f
d
iff
e
r
e
n
t
m
o
d
a
li
ti
e
s.
Ex
p
e
ri
m
e
n
tal
f
in
d
in
g
s
v
a
li
d
a
te
th
e
e
ff
ica
c
y
o
f
th
e
p
ro
p
o
se
d
m
e
th
o
d
w
h
il
e
a
lso
h
ig
h
l
ig
h
ti
n
g
a
re
a
s f
o
r
im
p
ro
v
e
m
e
n
t.
K
ey
w
o
r
d
s
:
C
o
n
v
o
lu
tio
n
al
n
e
u
r
al
n
e
t
w
o
r
k
E
f
f
icac
y
E
m
o
tio
n
d
etec
tio
n
E
v
alu
a
tio
n
cr
iter
ia
L
o
n
g
s
h
o
r
t
-
ter
m
m
e
m
o
r
y
T
er
m
f
r
eq
u
e
n
c
y
-
i
n
v
er
s
e
d
o
cu
m
en
t f
r
eq
u
e
n
c
y
v
ec
to
r
ize
r
T
h
is i
s
a
n
o
p
e
n
a
c
c
e
ss
a
rticle
u
n
d
e
r th
e
CC B
Y
-
SA
li
c
e
n
se
.
C
o
r
r
e
s
p
o
nd
ing
A
uth
o
r
:
R
av
i G
u
m
m
u
la
Dep
ar
tm
en
t o
f
E
l
ec
t
r
o
n
ics
an
d
C
o
m
m
u
n
icatio
n
E
n
g
in
ee
r
in
g
,
Dr
.
M
.
G
.
R
.
E
d
u
c
ati
o
n
al
an
d
R
esea
r
ch
I
n
s
t
itu
te
C
h
e
n
n
ai,
T
am
i
l N
ad
u
,
I
n
d
ia
E
m
ail:
r
av
i.g
u
m
m
u
la
@
g
m
a
il.
co
m
1.
I
NT
RO
D
UCT
I
O
N
Ma
n
y
i
n
telli
g
e
n
t
s
y
s
te
m
s
m
i
g
h
t
b
en
ef
i
t
g
r
ea
tl
y
f
r
o
m
a
u
to
m
a
ted
em
o
tio
n
r
ec
o
g
n
itio
n
,
in
cl
u
d
in
g
th
o
s
e
u
s
ed
i
n
o
n
l
in
e
g
a
m
i
n
g
,
d
i
g
ita
l
ad
v
er
tis
i
n
g
,
h
ea
l
th
ca
r
e
a
n
d
co
n
s
u
m
er
f
ee
d
b
ac
k
co
llectio
n
.
Fo
r
in
s
ta
n
ce
,
b
y
ad
ap
tin
g
t
h
e
g
a
m
e
i
n
ter
f
ac
e
a
cc
o
r
d
in
g
to
t
h
e
u
s
er
'
s
e
m
o
tio
n
al
s
tate
,
a
n
e
m
o
t
io
n
r
ec
o
g
n
it
io
n
f
u
n
ctio
n
m
ig
h
t
p
o
ten
tiall
y
en
h
a
n
ce
p
la
y
er
e
n
g
a
g
e
m
en
t
i
n
o
n
li
n
e
g
a
m
i
n
g
.
I
n
a
s
i
m
ilar
w
a
y
a
l
iv
e
e
m
o
tio
n
d
etec
t
io
n
m
o
d
u
le
m
a
y
p
r
o
v
id
e
th
e
s
elli
n
g
f
ir
m
i
m
m
ed
iate
e
m
o
tio
n
al
f
ee
d
b
ac
k
w
h
e
n
a
cu
s
to
m
er
b
u
y
s
o
n
li
n
e,
allo
w
i
n
g
th
e
m
to
p
r
esen
t
t
h
e
c
u
s
to
m
er
n
e
w
o
f
f
er
s
.
Hea
l
th
ca
r
e
p
r
o
v
id
er
s
m
a
y
b
etter
m
o
n
ito
r
th
eir
p
atien
t
s
'
p
h
y
s
ical
a
n
d
m
en
tal
h
ea
l
th
v
ia
e
m
o
tio
n
d
etec
tio
n
,
w
h
ic
h
i
n
tu
r
n
h
elp
s
t
h
e
m
p
r
o
v
id
e
t
h
e
m
o
s
t
ap
p
r
o
p
r
iate
m
ed
icatio
n
o
r
th
er
ap
y
[
1
]
.
I
n
telli
g
en
t
co
n
v
er
s
a
tio
n
al
s
y
s
te
m
s
,
s
m
ar
t
citie
s
,
af
f
ec
t
-
a
w
a
r
e
e
-
h
ea
lt
h
,
af
f
ec
t
-
a
w
ar
e
lear
n
in
g
,
an
d
tr
av
el
r
ec
o
m
m
en
d
atio
n
s
y
s
te
m
s
ar
e
j
u
s
t
a
f
e
w
o
f
th
e
m
a
n
y
ap
p
licatio
n
s
th
a
t
ar
e
u
s
i
n
g
e
m
o
tio
n
all
y
-
a
w
ar
e
in
telli
g
e
n
t
s
y
s
te
m
s
[
2
]
.
A
lo
t
o
f
s
y
s
te
m
s
r
el
y
o
n
tex
t
u
al
o
r
e
m
o
tio
n
-
b
ased
in
p
u
ts
.
Fo
r
ex
a
m
p
le,
t
h
er
e
h
a
v
e
b
ee
n
s
u
g
g
esti
o
n
s
f
o
r
e
m
o
tio
n
-
a
w
ar
e
e
-
h
ea
lt
h
s
y
s
te
m
s
t
h
at
s
ea
r
ch
f
o
r
ce
r
tain
k
e
y
w
o
r
d
s
i
n
p
atien
t
i
n
p
u
t
i
n
o
r
d
er
to
id
en
tify
e
m
o
tio
n
s
[
3
]
.
W
e
h
av
e
d
ev
elo
p
ed
tr
ip
r
ec
o
m
m
e
n
d
atio
n
a
lg
o
r
it
h
m
s
th
at
ar
e
b
ased
o
n
co
n
tex
t
o
r
e
m
o
tio
n
a
n
d
af
f
ec
t
-
a
w
ar
e
lear
n
i
n
g
tech
n
o
lo
g
ie
s
[
4
]
–
[
6
]
.
I
m
p
r
o
v
in
g
th
e
q
u
al
it
y
lif
e
o
f
p
eo
p
le
m
ig
h
t
b
e
ac
h
iev
ed
b
y
an
a
f
f
ec
t
-
a
war
e
s
m
ar
t
cit
y
's
ab
ilit
y
to
r
ec
o
g
n
ize
a
n
d
s
h
o
w
e
m
o
tio
n
s
th
r
o
u
g
h
t
h
e
u
s
e
o
f
h
as
h
ta
g
s
,
k
e
y
w
o
r
d
s
,
an
d
em
o
tio
n
s
[
7
]
.
E
ac
h
o
f
th
ese
s
y
s
te
m
s
p
r
i
m
ar
il
y
r
elie
s
o
n
tex
t
o
r
em
o
tio
n
s
to
d
etec
t
e
m
o
tio
n
s
[
8
]
.
Evaluation Warning : The document was created with Spire.PDF for Python.
I
n
t J
R
ec
o
n
f
i
g
u
r
ab
le
&
E
m
b
ed
d
ed
Sy
s
t
I
SS
N:
2089
-
4864
Mu
ltimo
d
a
l reco
g
n
itio
n
w
ith
d
ee
p
lea
r
n
in
g
:
a
u
d
io
,
ima
g
e,
a
n
d
text
(
R
a
vi
Gu
mmu
la
)
255
Vid
eo
,
au
d
io
,
s
h
o
r
t
w
o
r
d
s
,
e
m
o
tio
n
s
,
lo
n
g
te
x
ts
,
s
h
o
r
t
m
es
s
a
g
es
,
an
d
f
ac
ial
e
x
p
r
ess
io
n
s
ar
e
s
o
m
e
o
f
th
e
i
n
p
u
t
s
th
a
t
m
a
y
b
e
u
tili
ze
d
to
d
etec
t
e
m
o
tio
n
s
.
Fo
r
th
ese
in
p
u
t
s
,
ap
p
licatio
n
s
e
m
p
lo
y
a
v
ar
iet
y
o
f
f
o
r
m
ats
.
Fo
r
in
s
ta
n
ce
,
w
h
er
ea
s
v
id
eo
is
o
f
te
n
u
s
ed
in
g
a
m
in
g
s
y
s
te
m
s
,
s
h
o
r
t
m
es
s
a
g
es
,
an
d
e
m
o
tio
n
s
ar
e
m
o
r
e
co
m
m
o
n
o
n
s
o
cial
n
et
w
o
r
k
in
g
.
A
d
d
itio
n
all
y
,
s
y
s
te
m
s
t
h
at
ca
n
id
en
ti
f
y
e
m
o
tio
n
s
f
r
o
m
el
ec
tr
o
en
ce
p
h
alo
g
r
a
m
(
E
E
G)
d
ata
h
av
e
b
ee
n
i
n
tr
o
d
u
ce
d
latel
y
[
9
]
,
[
1
0
]
.
Ho
w
e
v
er
,
w
ea
r
in
g
a
n
E
E
G
h
a
t
is
i
n
v
a
s
i
v
e
an
d
u
n
co
m
f
o
r
tab
le
f
o
r
th
e
w
ea
r
er
.
A
liter
atu
r
e
r
ev
ie
w
f
o
u
n
d
th
a
t
w
h
en
it
co
m
es
to
e
m
o
tio
n
id
e
n
ti
f
icatio
n
,
s
in
g
le
-
m
o
d
al
i
n
p
u
t o
f
te
n
f
ail
s
to
m
ee
t th
e
n
ec
e
s
s
ar
y
ac
c
u
r
ac
y
s
ta
n
d
ar
d
s
[
1
1
]
,
[
1
2
]
.
A
tec
h
n
iq
u
e
f
o
r
au
d
io
-
v
is
u
al
em
o
tio
n
r
ec
o
g
n
it
io
n
b
ased
o
n
d
ee
p
n
et
w
o
r
k
f
ea
tu
r
e
ex
tr
ac
tio
n
an
d
f
u
s
io
n
i
s
p
r
esen
ted
i
n
th
i
s
s
t
u
d
y
[
1
3
]
.
Fin
all
y
,
n
o
n
-
l
in
ea
r
f
ea
tu
r
e
f
u
s
io
n
is
e
n
s
u
r
ed
b
y
u
s
in
g
s
u
p
p
o
r
t
v
ec
to
r
m
ac
h
in
e
s
(
SVM
s
)
,
w
h
ic
h
ar
e
n
et
w
o
r
k
s
.
T
h
e
ac
cu
r
ac
y
o
f
d
ee
p
lear
n
in
g
(
D
L
)
m
o
d
el
s
i
s
d
ep
en
d
en
t
o
n
t
h
e
av
ailab
le
d
ata
an
d
th
e
s
tr
u
ct
u
r
e
o
f
th
e
m
o
d
el,
alth
o
u
g
h
it
h
a
s
s
ee
n
ex
te
n
s
i
v
e
u
s
ag
e
i
n
i
m
a
g
e,
v
id
eo
,
an
d
au
d
io
p
r
o
ce
s
s
in
g
[
1
4
]
.
T
h
er
e
ar
e
th
r
ee
th
in
g
s
th
at
t
h
is
r
esear
ch
ad
d
s
:
th
e
p
r
o
p
o
s
ed
s
y
s
te
m
ta
k
es
u
s
e
o
f
a
lar
g
e
e
m
o
tio
n
d
ataset
f
o
r
tr
ain
i
n
g
,
a
th
r
ee
-
d
i
m
e
n
s
io
n
a
l
co
n
v
o
lu
ti
o
n
al
n
e
u
r
al
n
et
w
o
r
k
(
C
NN)
w
it
h
a
n
i
n
tr
icate
k
e
y
f
r
a
m
e
s
elec
tio
n
tec
h
n
iq
u
e
f
o
r
v
id
eo
s
ig
n
al
s
an
d
a
v
ar
iety
o
f
in
f
o
r
m
ati
v
e
p
atter
n
s
f
o
r
f
ea
tu
r
e
ex
tr
ac
tio
n
,
in
cl
u
d
in
g
g
r
a
y
-
s
ca
le
k
e
y
f
r
a
m
e
i
m
ag
e
s
,
lo
ca
l
b
in
ar
y
p
atter
n
(
L
B
P
)
im
a
g
es
,
an
d
i
n
ter
lace
d
d
er
iv
ativ
e
p
att
er
n
(
I
DP
)
im
ag
e
s
.
2.
L
I
T
E
R
AT
U
RE
SU
RVE
Y
As
h
i
g
h
li
g
h
ted
b
y
Ku
d
ir
i
et
a
l.
[
1
5
]
m
o
s
t
r
esear
ch
in
t
h
i
s
f
ield
h
as
u
tili
ze
d
as
y
n
ch
r
o
n
o
u
s
d
ata
an
d
u
n
i
m
o
d
al
o
r
m
u
lti
m
o
d
al
s
y
s
te
m
s
.
As
a
r
es
u
lt,
in
co
r
r
ec
t
s
y
n
ch
r
o
n
izatio
n
h
as
b
ec
o
m
e
a
co
m
m
o
n
is
s
u
e,
in
cr
ea
s
i
n
g
s
y
s
te
m
co
m
p
le
x
it
y
,
an
d
d
ec
r
ea
s
in
g
r
esp
o
n
s
e
ti
m
e.
T
o
ad
d
r
ess
th
is
,
a
u
n
iq
u
e
m
et
h
o
d
h
as
b
ee
n
d
ev
elo
p
ed
to
an
ticip
ate
h
u
m
an
e
m
o
tio
n
s
f
r
o
m
s
p
ee
c
h
an
d
f
ac
ial
ex
p
r
ess
io
n
s
.
T
h
is
m
eth
o
d
e
m
p
lo
y
s
t
w
o
f
ea
t
u
r
e
v
ec
to
r
s
:
r
elativ
e
b
in
f
r
e
q
u
en
c
y
co
e
f
f
icie
n
t
(
R
B
F
C
)
f
o
r
v
o
ice
d
ata
an
d
r
elativ
e
s
u
b
-
i
m
a
g
e
b
ased
(
R
SB
)
co
ef
f
icie
n
t
f
o
r
v
is
u
al
d
ata.
T
h
e
f
u
s
io
n
s
tr
ateg
y
b
et
w
ee
n
th
e
t
w
o
m
o
d
alitie
s
is
b
ase
d
o
n
f
ea
t
u
r
e
-
lev
el
ca
teg
o
r
izatio
n
an
d
u
tili
ze
s
a
S
VM
w
i
th
a
r
ad
ial
b
asis
k
er
n
el.
A
cc
o
r
d
in
g
to
W
an
g
et
a
l.
[
1
6
]
esti
m
at
in
g
h
u
m
a
n
e
m
o
tio
n
s
u
s
i
n
g
a
co
m
p
u
ter
h
a
v
e
p
r
o
v
en
ch
alle
n
g
i
n
g
d
u
r
i
n
g
co
n
v
er
s
ati
o
n
al
b
r
ea
k
s
.
T
h
eir
s
t
u
d
y
u
s
e
s
a
h
y
b
r
id
ap
p
r
o
ac
h
co
m
b
in
i
n
g
s
p
ee
ch
an
d
f
ac
ial
ex
p
r
ess
io
n
s
to
m
ea
s
u
r
e
f
u
n
d
am
en
tal
e
m
o
t
io
n
s
.
T
h
e
ap
p
r
o
ac
h
e
m
p
lo
y
s
R
B
FC
f
o
r
au
d
io
d
ata
an
d
R
SB
f
ea
t
u
r
es
f
o
r
v
is
u
al
d
ata,
w
i
th
cla
s
s
i
f
ic
atio
n
p
er
f
o
r
m
ed
b
y
r
ad
ial
b
a
s
is
k
er
n
el
SVMs.
T
h
e
f
i
n
d
in
g
s
i
n
d
icate
t
h
at
t
h
e
p
r
o
p
o
s
ed
f
ea
tu
r
e
e
x
tr
ac
ti
o
n
m
eth
o
d
s
i
g
n
if
ica
n
tl
y
e
n
h
an
ce
s
t
h
e
e
m
o
tio
n
r
ec
o
g
n
it
io
n
s
y
s
te
m
.
I
t
d
e
m
o
n
s
tr
ates
th
at
t
h
e
b
i
m
o
d
al
e
m
o
tio
n
r
ec
o
g
n
itio
n
s
y
s
te
m
,
u
ti
lizi
n
g
b
o
th
s
p
ee
ch
an
d
f
ac
ial
e
x
p
r
es
s
io
n
s
,
o
u
tp
er
f
o
r
m
s
u
n
i
m
o
d
al
m
e
th
o
d
s
.
A
cc
o
r
d
in
g
to
K
h
ali
l
et
a
l.
[
1
7
]
r
ec
o
g
n
izin
g
e
m
o
tio
n
s
i
n
s
p
o
k
en
la
n
g
u
a
g
e
i
s
c
h
alle
n
g
i
n
g
p
ar
t
o
f
h
u
m
a
n
co
m
p
u
ter
in
ter
ac
tio
n
(
HC
I
)
.
As
an
alter
n
ati
v
e
to
co
n
v
e
n
tio
n
al
m
ac
h
i
n
e
lear
n
in
g
(
ML
)
m
e
th
o
d
s
,
D
L
ap
p
r
o
ac
h
es a
r
e
in
tr
o
d
u
ce
d
.
T
h
is
ar
ticle
s
u
r
v
e
y
s
v
ar
io
u
s
ap
p
r
o
ac
h
es a
n
d
e
x
a
m
in
e
s
cu
r
r
en
t r
esear
ch
o
n
e
m
o
tio
n
id
en
ti
f
icatio
n
u
s
in
g
DL
.
T
h
is
r
ev
ie
w
co
v
er
s
d
atab
ases
u
s
ed
,
en
h
an
ce
m
e
n
ts
to
s
p
ee
ch
e
m
o
tio
n
id
en
tific
atio
n
an
d
its
li
m
itatio
n
s
.
3.
P
RO
B
L
E
M
ST
AT
E
M
E
NT
T
h
is
s
tu
d
y
p
r
o
p
o
s
es
a
h
y
b
r
id
ap
p
r
o
ac
h
th
at
u
s
es
s
p
ee
ch
a
n
d
f
ac
ial
ex
p
r
ess
io
n
s
to
f
in
d
f
u
n
d
a
m
e
n
tal
e
m
o
tio
n
s
in
an
ar
s
o
n
i
s
t
d
u
r
in
g
a
co
n
v
er
s
atio
n
al
b
r
ea
k
[
1
8
]
.
Fo
r
th
e
au
d
io
an
d
v
is
u
al
d
ata
r
esp
ec
tiv
el
y
R
B
FC
s
an
d
R
SB
tire
s
ar
e
u
s
ed
.
Fo
r
class
i
f
icatio
n
a
SVM
w
i
th
a
r
ad
ial
b
asis
k
er
n
el
is
u
s
ed
.
T
h
is
s
t
u
d
y
's
f
i
n
d
in
g
s
in
d
icate
th
a
t,
in
co
n
j
u
n
ctio
n
w
it
h
t
h
e
f
u
s
io
n
ap
p
r
o
ac
h
,
th
e
m
o
s
t
s
i
g
n
if
ican
t
f
ac
to
r
in
f
l
u
en
cin
g
t
h
e
e
m
o
tio
n
r
ec
o
g
n
itio
n
s
y
s
te
m
is
f
ea
tu
r
e
ex
tr
ac
tio
n
th
r
o
u
g
h
s
p
ee
ch
an
d
f
ac
ial
ex
p
r
ess
io
n
.
W
h
ile
s
o
m
e
f
ac
to
r
s
m
a
y
h
a
v
e
an
i
m
p
ac
t
o
n
t
h
e
s
y
s
te
m
's
ab
ilit
y
to
id
en
ti
f
y
e
m
o
tio
n
s
,
th
is
i
m
p
ac
t
is
r
at
h
er
s
m
all
[
1
9
]
.
T
h
r
o
u
g
h
i
n
te
n
tio
n
a
l
f
ac
ial
e
x
p
r
ess
io
n
s
,
it
w
as
s
h
o
w
n
t
h
at
th
e
u
n
i
m
o
d
al
e
m
o
t
io
n
id
en
ti
f
icatio
n
s
y
s
te
m
o
u
tp
er
f
o
r
m
s
t
h
e
b
i
m
o
d
al
e
m
o
tio
n
d
etec
tio
n
s
y
s
te
m
i
n
ter
m
s
o
f
p
er
f
o
r
m
a
n
ce
.
A
p
r
o
p
e
r
d
atab
ase
is
em
p
lo
y
ed
to
ad
d
r
ess
th
e
p
r
o
b
lem
[
2
0
]
.
T
h
e
s
u
g
g
ested
e
m
o
tio
n
r
ec
o
g
n
itio
n
s
y
s
te
m
o
u
tp
e
r
f
o
r
m
ed
th
e
o
t
h
er
s
i
n
ter
m
s
o
f
f
u
n
d
a
m
en
tal
e
m
o
tio
n
al
cla
s
s
e
s
.
4.
P
RO
P
O
SE
D
M
O
DE
L
E
m
o
tio
n
s
ar
e
i
m
p
o
r
tan
t
to
h
u
m
an
p
er
ce
p
tio
n
an
d
co
m
m
u
n
i
ca
tio
n
an
d
h
av
e
a
s
u
b
s
ta
n
tia
l
in
f
lu
e
n
ce
o
n
ac
tio
n
s
an
d
ch
o
ices.
C
o
n
s
e
q
u
en
tl
y
,
e
m
o
tio
n
d
etec
tio
n
h
a
s
b
ee
n
tr
en
d
in
g
r
ec
en
tl
y
,
w
it
h
a
f
o
cu
s
o
n
h
u
m
a
n
e
m
o
tio
n
r
ec
o
g
n
i
tio
n
an
d
class
if
icatio
n
ac
r
o
s
s
s
ev
er
al
m
ed
ia
ty
p
es
(
e.
g
.
,
i
m
a
g
es,
tex
t
,
an
d
au
d
io
)
[
2
1
]
.
I
n
o
u
r
r
esear
ch
,
w
e
ad
o
p
t
a
m
u
lti
-
m
o
d
al
ap
p
r
o
ac
h
to
em
o
tio
n
r
ec
o
g
n
itio
n
,
en
co
m
p
a
s
s
i
n
g
tex
t,
i
m
a
g
e
,
an
d
au
d
io
m
o
d
ali
ties
.
O
u
r
g
o
al
is
to
id
en
ti
f
y
t
h
e
s
e
v
en
p
r
i
m
ar
y
e
m
o
ti
o
n
s
:
an
g
er
,
f
ea
r
,
d
is
g
u
s
t,
n
e
u
t
r
al,
h
ap
p
y
,
s
o
r
r
o
w
,
an
d
s
u
r
p
r
is
e
ac
r
o
s
s
d
if
f
er
en
t
d
ata
s
o
u
r
ce
s
,
lev
er
ag
i
n
g
C
NN
ar
ch
itectu
r
es
f
o
r
i
m
a
g
e
an
d
au
d
io
d
ata,
an
d
lo
n
g
Evaluation Warning : The document was created with Spire.PDF for Python.
I
SS
N
:
2
0
8
9
-
4864
I
n
t J
R
ec
o
n
f
i
g
u
r
ab
le
&
E
m
b
ed
d
ed
Sy
s
t
,
Vo
l.
14
,
No
.
1
,
Ma
r
c
h
2
0
2
5
:
2
5
4
-
2
64
256
s
h
o
r
t
-
ter
m
m
e
m
o
r
y
(
L
ST
M)
n
et
w
o
r
k
s
f
o
r
tex
t
u
al
d
ata.
Sim
ilar
l
y
,
f
o
r
au
d
io
-
b
ased
e
m
o
t
io
n
r
ec
o
g
n
itio
n
,
w
e
e
m
p
lo
y
C
NN
ar
ch
i
tectu
r
e
s
tr
ain
ed
o
n
d
ataset
s
li
k
e
th
e
R
A
V
DE
SS
a
u
d
io
d
ataset
.
T
h
es
e
n
et
w
o
r
k
s
an
al
y
ze
s
p
ec
tr
o
g
r
a
m
s
o
r
o
th
er
r
ep
r
esen
tatio
n
s
o
f
a
u
d
io
s
ig
n
als to
id
e
n
ti
f
y
e
m
o
tio
n
a
l c
u
es c
o
n
v
e
y
ed
th
r
o
u
g
h
s
p
ee
c
h
.
Fo
r
tex
t
-
b
ased
e
m
o
tio
n
an
al
y
s
i
s
,
w
e
e
m
p
lo
y
L
ST
M
n
etw
o
r
k
s
d
u
e
to
th
eir
ab
ilit
y
t
o
ca
p
tu
r
e
s
eq
u
e
n
tial
d
ep
en
d
en
cies
i
n
te
x
tu
a
l
d
ata.
W
e
p
r
ep
r
o
ce
s
s
co
n
v
er
s
atio
n
al
te
x
t
an
d
f
ee
d
it
i
n
to
L
ST
M
n
et
w
o
r
k
s
f
o
r
e
m
o
tio
n
clas
s
i
f
icatio
n
.
A
d
d
itio
n
all
y
,
w
e
u
tili
ze
t
h
e
ter
m
f
r
eq
u
en
c
y
-
i
n
v
er
s
e
d
o
cu
m
e
n
t
f
r
eq
u
en
c
y
(
T
F
-
I
DF)
v
ec
to
r
izer
to
tr
an
s
f
o
r
m
tex
tu
al
co
n
v
er
s
at
io
n
s
i
n
to
n
u
m
er
i
ca
l
r
ep
r
esen
tatio
n
s
,
ca
p
tu
r
in
g
th
e
i
m
p
o
r
ta
n
ce
o
f
in
d
iv
id
u
al
ter
m
s
in
e
x
p
r
ess
i
n
g
e
m
o
tio
n
s
w
it
h
i
n
th
e
co
r
p
u
s
.
T
h
r
o
u
g
h
t
h
is
i
n
te
g
r
ated
ap
p
r
o
ac
h
,
w
e
ai
m
to
lev
er
ag
e
t
h
e
s
tr
e
n
g
t
h
s
o
f
ea
ch
m
o
d
alit
y
to
en
h
a
n
ce
t
h
e
ac
cu
r
ac
y
an
d
r
o
b
u
s
t
n
es
s
o
f
e
m
o
tio
n
r
ec
o
g
n
itio
n
s
y
s
te
m
s
[
2
2
]
.
B
y
ex
p
er
i
m
en
ti
n
g
w
i
th
v
ar
io
u
s
C
NN
an
d
L
S
T
M
ar
ch
itectu
r
es
tailo
r
ed
f
o
r
i
m
a
g
e,
au
d
io
,
an
d
tex
t
m
o
d
alit
ies,
o
u
r
r
esear
ch
s
tr
iv
es
to
ad
v
a
n
ce
th
e
s
tate
-
of
-
t
h
e
-
ar
t
i
n
m
u
l
ti
-
m
o
d
al
e
m
o
tio
n
r
ec
o
g
n
itio
n
,
o
f
f
er
i
n
g
v
alu
ab
le
i
n
s
i
g
h
ts
in
t
o
th
e
co
m
p
lex
ities
o
f
h
u
m
a
n
e
m
o
tio
n
s
ex
p
r
ess
ed
th
r
o
u
g
h
lan
g
u
a
g
e,
f
ac
ial
ex
p
r
ess
io
n
s
,
an
d
s
p
ee
ch
[
2
3
]
.
−
T
h
e
p
r
o
p
o
s
e
d
m
u
lti
-
m
o
d
al
s
y
s
te
m
in
teg
r
ate
s
te
x
t,
i
m
ag
e
,
a
n
d
au
d
io
m
o
d
ali
ties
,
e
n
h
a
n
ci
n
g
ac
c
u
r
ac
y
a
n
d
r
o
b
u
s
tn
es
s
i
n
e
m
o
tio
n
r
ec
o
g
n
i
tio
n
.
−
I
t
o
f
f
er
s
a
co
m
p
r
e
h
en
s
i
v
e
u
n
d
er
s
tan
d
in
g
o
f
h
u
m
an
e
m
o
tio
n
s
,
i
m
p
r
o
v
in
g
v
er
s
atil
it
y
,
a
n
d
p
o
ten
tial
f
o
r
r
ea
l
-
w
o
r
ld
ap
p
licatio
n
s
.
Fo
r
t
h
e
p
r
o
p
o
s
ed
em
o
tio
n
r
ec
o
g
n
itio
n
s
y
s
te
m
,
w
e
h
a
v
e
d
e
v
is
ed
an
L
ST
M
ar
ch
itect
u
r
e
ta
ilo
r
ed
f
o
r
tex
t
d
ata.
T
h
e
L
ST
M
m
o
d
el
d
ep
icted
in
Fig
u
r
e
1
co
n
s
is
ts
o
f
m
u
ltip
le
la
y
er
s
d
esi
g
n
ed
to
ca
p
tu
r
e
s
eq
u
en
tia
l
d
ep
en
d
en
cies
i
n
te
x
tu
a
l
in
p
u
t
s
ef
f
ec
ti
v
el
y
.
Fi
g
u
r
e
1
o
u
tl
in
e
s
th
e
d
etailed
ar
ch
itect
u
r
e
s
p
ec
if
icatio
n
s
o
f
t
h
e
L
ST
M
m
o
d
el.
Fig
u
r
e
1
.
L
ST
M
m
o
d
el
Fo
llo
w
i
n
g
th
e
L
ST
M
la
y
er
s
,
a
f
u
ll
y
co
n
n
ec
ted
n
e
u
r
al
n
et
w
o
r
k
w
it
h
h
id
d
en
la
y
er
s
is
e
m
p
lo
y
ed
to
f
u
r
t
h
er
p
r
o
ce
s
s
th
e
lear
n
ed
f
ea
tu
r
es.
A
So
f
tMa
x
f
u
n
ct
io
n
is
th
en
ap
p
lied
to
th
e
o
u
tp
u
t
o
f
th
e
f
u
ll
y
co
n
n
ec
te
d
la
y
er
to
g
en
er
ate
p
r
o
b
ab
ilit
y
d
is
tr
ib
u
tio
n
s
o
v
er
th
e
tar
g
et
em
o
tio
n
clas
s
es.
S
u
b
s
eq
u
e
n
tl
y
,
th
e
o
u
tp
u
t
o
f
th
e
So
f
tMa
x
la
y
er
i
s
p
ass
ed
th
r
o
u
g
h
a
cla
s
s
i
f
ier
f
o
r
f
in
al
e
m
o
tio
n
clas
s
if
icatio
n
.
Ho
w
e
v
er
,
co
n
v
e
n
tio
n
a
l
ML
te
ch
n
iq
u
es
e
x
h
ib
it
li
m
itatio
n
s
i
n
ac
cu
r
atel
y
r
ec
o
g
n
iz
in
g
e
m
o
tio
n
s
f
r
o
m
tex
t
d
ata.
E
n
h
a
n
ci
n
g
t
h
e
ac
cu
r
ac
y
o
f
e
m
o
tio
n
r
ec
o
g
n
it
io
n
in
tex
t
-
b
ased
in
p
u
t
s
r
e
m
ai
n
s
a
s
i
g
n
i
f
ica
n
t
o
b
j
ec
tiv
e
in
t
h
e
d
o
m
ai
n
o
f
ar
ti
f
icial
i
n
telli
g
e
n
ce
an
d
DL
al
g
o
r
ith
m
s
.
T
r
ad
itio
n
al
te
x
t
-
b
ased
e
m
o
tio
n
r
ec
o
g
n
it
io
n
d
atasets
o
f
te
n
ac
h
iev
e
s
u
b
o
p
ti
m
al
ac
cu
r
ac
y
r
ates.
T
o
a
d
d
r
ess
th
ese
li
m
ita
tio
n
s
a
n
d
i
m
p
r
o
v
e
e
m
o
tio
n
r
ec
o
g
n
itio
n
ac
cu
r
ac
y
,
t
h
i
s
s
t
u
d
y
p
r
o
p
o
s
es th
e
f
o
llo
w
i
n
g
i
n
n
o
v
atio
n
s
.
I
n
teg
r
atio
n
o
f
a
s
u
p
er
v
i
s
ed
en
co
d
er
f
o
r
f
ea
tu
r
e
ex
tr
ac
tio
n
f
r
o
m
te
x
t
u
al
in
p
u
ts
.
Util
izatio
n
o
f
L
ST
M
n
et
w
o
r
k
s
to
an
al
y
ze
tex
t
u
al
i
n
p
u
ts
an
d
p
er
f
o
r
m
e
m
o
tio
n
r
ec
o
g
n
itio
n
.
I
m
p
le
m
en
tatio
n
o
f
n
eu
r
al
n
et
w
o
r
k
s
f
o
r
in
f
o
r
m
atio
n
co
llectio
n
an
d
v
i
s
u
aliza
tio
n
o
f
e
m
o
t
io
n
al
cu
e
s
co
n
v
e
y
ed
th
r
o
u
g
h
tex
t.
Dep
l
o
y
m
e
n
t
o
f
a
C
NN
alg
o
r
ith
m
f
o
r
an
al
y
zin
g
e
m
o
tio
n
s
f
r
o
m
te
x
t
d
ata
w
it
h
i
n
in
telli
g
e
n
t
lear
n
i
n
g
e
n
v
ir
o
n
m
en
ts
.
A
d
d
itio
n
all
y
,
class
i
f
icatio
n
en
h
a
n
ce
m
e
n
t
al
g
o
r
ith
m
s
b
ased
o
n
M
L
tec
h
n
i
q
u
es
ar
e
e
m
p
lo
y
ed
f
o
r
i
m
p
r
o
v
ed
ac
cu
r
ac
y
in
te
x
t
-
b
ased
e
m
o
tio
n
r
ec
o
g
n
itio
n
.
C
o
m
p
ar
ed
to
tr
ad
itio
n
al
te
x
t
-
b
a
s
ed
e
m
o
tio
n
r
ec
o
g
n
itio
n
ap
p
r
o
ac
h
es,
th
e
L
ST
M
ar
ch
itect
u
r
e
p
r
esen
ted
in
t
h
is
s
tu
d
y
d
e
m
o
n
s
tr
ate
s
s
u
p
er
io
r
ac
cu
r
ac
y
a
n
d
y
ield
s
b
etter
r
ec
o
g
n
itio
n
r
es
u
lt
s
.
Evaluation Warning : The document was created with Spire.PDF for Python.
I
n
t J
R
ec
o
n
f
i
g
u
r
ab
le
&
E
m
b
ed
d
ed
Sy
s
t
I
SS
N:
2089
-
4864
Mu
ltimo
d
a
l reco
g
n
itio
n
w
ith
d
ee
p
lea
r
n
in
g
:
a
u
d
io
,
ima
g
e,
a
n
d
text
(
R
a
vi
Gu
mmu
la
)
257
4
.
1
.
Da
t
a
s
et
I
t
is
im
p
o
s
s
ib
le
to
o
v
er
s
tate
th
e
s
ig
n
i
f
ica
n
ce
o
f
d
ata
w
h
i
le
d
ev
elo
p
in
g
DL
m
o
d
els.
I
n
o
r
d
e
r
to
lear
n
,
g
en
er
alize
a
n
d
d
r
a
w
ed
u
ca
ted
co
n
clu
s
io
n
s
,
al
g
o
r
ith
m
s
n
ee
d
d
ata.
T
h
is
d
ata
is
u
s
e
d
to
f
u
el
d
ev
elo
p
m
en
t
s
i
n
m
an
y
d
i
f
f
er
e
n
t
in
d
u
s
tr
ie
s
.
T
h
e
a
m
o
u
n
t,
d
iv
er
s
it
y
,
an
d
q
u
ali
t
y
o
f
t
h
e
d
ata
u
s
ed
f
o
r
tr
ain
in
g
p
la
y
a
s
i
g
n
if
ican
t
r
o
le
in
o
u
r
e
m
o
tio
n
r
ec
o
g
n
i
t
io
n
w
o
r
k
.
W
e
h
av
e
d
e
v
elo
p
ed
a
tr
u
s
t
w
o
r
t
h
y
an
d
h
i
g
h
l
y
ef
f
ec
ti
v
e
e
m
o
tio
n
r
ec
o
g
n
itio
n
m
o
d
el
u
s
in
g
a
la
r
g
e
d
ataset
th
at
i
n
clu
d
e
v
o
ic
e,
i
m
a
g
e
,
a
n
d
tex
t
d
ata.
T
h
is
s
ec
tio
n
p
r
o
v
id
es
a
d
etailed
d
escr
ip
tio
n
o
f
h
o
w
w
e
g
at
h
er
an
d
p
r
o
ce
s
s
d
ata.
T
h
e
s
elec
ted
e
m
o
tio
n
clas
s
es
ar
e
p
lace
d
ac
r
o
s
s
all
3
m
o
d
u
le
s
.
4
.
2
.
Da
t
a
prepro
ce
s
s
ing
a
nd
a
na
ly
s
is
Data
p
r
ep
ar
at
io
n
w
a
s
cr
u
cial
to
th
e
r
esear
ch
s
in
ce
it
en
ab
led
u
s
to
p
r
o
p
e
r
ly
u
s
e
o
u
r
u
n
iq
u
e
d
ata
g
ath
er
i
n
g
.
Her
e
w
e
to
o
k
t
h
e
s
tep
s
to
p
r
ep
ar
e
th
e
au
d
io
,
p
ictu
r
e
,
an
d
te
x
t
u
al
d
ata
f
o
r
m
o
d
el
a
n
al
y
s
i
s
a
n
d
tr
ain
i
n
g
.
I
n
o
r
d
er
to
p
r
o
v
id
e
a
s
o
lid
g
r
o
u
n
d
w
o
r
k
f
o
r
cr
ea
tin
g
ac
c
u
r
ate
an
d
d
ep
en
d
ab
le
e
m
o
tio
n
r
ec
o
g
n
itio
n
m
o
d
el
s
,
w
e
u
s
ed
s
y
s
te
m
atic
d
ata
p
r
ep
ar
atio
n
to
in
cr
ea
s
e
th
e
d
ataset's r
ep
r
esen
tati
v
e
n
es
s
,
b
alan
ce
,
an
d
q
u
alit
y
.
4
.
2
.
1
.
T
ex
t
T
h
e
tex
t
m
o
d
u
le
h
as
a
r
o
b
u
s
t
d
ataset
co
n
s
i
s
ti
n
g
o
f
3
2
,
5
0
0
r
ec
o
r
d
s
,
ea
ch
o
f
w
h
ich
h
a
s
t
wo
ess
en
t
ial
co
lu
m
n
s
:
"
tex
t"
an
d
"
e
m
o
tio
n
"
.
T
h
e
"
tex
t"
co
lu
m
n
lis
t
s
all
t
h
e
m
ater
ials
th
a
t
o
u
r
m
o
d
el
n
ee
d
s
f
o
r
it
s
r
ig
o
r
o
u
s
tr
ain
i
n
g
,
an
d
th
e
"
em
o
tio
n
"
c
o
lu
m
n
s
h
o
w
s
w
h
ic
h
e
m
o
tio
n
ca
teg
o
r
y
ea
ch
tex
t
ite
m
b
elo
n
g
s
to
.
Desp
ite
s
o
m
e
in
itial
s
etb
ac
k
s
,
w
e
e
v
e
n
tu
a
ll
y
lo
ca
ted
an
d
s
elec
ted
s
e
v
er
al
t
ex
t
s
o
u
r
ce
s
t
h
at
m
et
o
u
r
estab
lis
h
ed
cr
iter
ia
a
n
d
allo
w
ed
u
s
to
ac
co
m
p
li
s
h
o
u
r
r
esear
ch
g
o
al
s
,
allo
w
in
g
u
s
t
o
co
m
p
ile
a
s
izab
le
co
r
p
u
s
o
f
tex
t
d
ata.
W
e
to
o
k
g
r
ea
t
ef
f
o
r
t
to
s
elec
t
r
eliab
le
an
d
au
th
e
n
tic
s
o
u
r
ce
s
d
esp
ite
th
e
ch
allen
g
es
w
e
h
ad
w
h
i
le
g
ath
er
i
n
g
d
ata
in
o
r
d
er
to
en
s
u
r
e
t
h
at
o
u
r
d
atas
et
r
e
m
ai
n
ed
ac
cu
r
ate
an
d
ap
p
licab
le.
E
m
o
tio
n
ex
p
r
es
s
io
n
s
in
r
ea
l
-
w
o
r
ld
d
ata
s
o
u
r
ce
s
ar
e
n
at
u
r
all
y
d
is
tr
ib
u
t
ed
an
d
v
ar
iab
le,
m
ak
in
g
it
d
if
f
ic
u
lt
to
ac
h
ie
v
e
a
p
er
f
ec
t
b
alan
ce
f
o
r
all
e
m
o
t
io
n
class
es.
Nev
er
t
h
ele
s
s
,
w
e
w
er
e
ab
le
to
ca
p
tu
r
e
a
w
id
e
r
a
n
g
e
o
f
p
atter
n
s
b
y
in
ten
t
io
n
all
y
cr
af
tin
g
th
e
d
ata
s
et
w
it
h
a
n
e
m
p
h
a
s
is
o
n
i
n
cl
u
s
io
n
a
n
d
v
ar
iet
y
.
W
ith
s
e
v
en
d
is
t
in
ct
e
m
o
tio
n
s
r
ep
r
esen
ted
b
y
t
h
e
e
n
co
d
ed
class
es
in
th
e
d
ata
s
et,
th
e
r
ec
o
r
d
s
in
e
ac
h
ca
teg
o
r
y
e
x
h
ib
it
a
w
id
e
r
an
g
e
o
f
d
is
tr
ib
u
tio
n
s
.
O
u
r
s
u
b
s
eq
u
en
t
r
esear
c
h
an
d
m
o
d
el
d
ev
elo
p
m
e
n
t
m
e
ticu
lo
u
s
l
y
ad
d
r
ess
ed
an
y
p
o
ten
t
ial
class
i
m
b
alan
ce
s
to
en
s
u
r
e
th
e
tex
t
e
m
o
tio
n
r
ec
o
g
n
itio
n
(
T
E
R
)
m
o
d
el
'
s
u
n
b
iased
p
er
f
o
r
m
a
n
ce
.
T
h
e
ex
te
n
s
i
v
e
an
d
d
etailed
te
x
t
d
ata
g
a
th
er
ed
f
r
o
m
s
o
u
r
ce
s
allo
w
s
f
o
r
a
f
u
ll e
x
p
lo
r
atio
n
o
f
tex
tu
a
l e
x
p
r
ess
io
n
s
f
o
r
e
m
o
ti
o
n
r
ec
o
g
n
itio
n
.
4
.
2
.
2
.
I
m
a
g
e
W
e
u
s
ed
a
d
ataset
th
at
f
o
u
n
d
o
n
Kag
g
le
f
o
r
th
e
i
m
ag
e
m
o
d
u
le
to
co
n
s
tr
u
ct
o
u
r
s
t
u
d
y
o
n
f
ac
e
-
b
a
s
ed
e
m
o
tio
n
r
ec
o
g
n
i
tio
n
.
I
n
all,
th
ese
d
atasets
in
cl
u
d
e
ar
o
u
n
d
a
th
o
u
s
an
d
i
m
a
g
es
w
h
ic
h
h
av
e
b
ee
n
class
i
f
ied
in
to
7
d
is
tin
ct
g
r
o
u
p
in
g
s
ac
co
r
d
in
g
to
v
ar
io
u
s
e
m
o
tio
n
al
s
tate
s
as
s
h
o
w
n
i
n
Fig
u
r
e
2
.
T
o
f
ix
an
y
p
o
ten
tial
d
ata
i
m
b
alan
ce
s
an
d
i
n
cr
ea
s
e
t
h
e
i
m
a
g
e
d
ata'
s
r
an
g
e,
w
e
ap
p
lied
d
ata
au
g
m
e
n
tat
io
n
tec
h
n
iq
u
es.
Au
g
m
e
n
tatio
n
en
h
a
n
ce
s
o
u
r
m
o
d
el
's
g
en
er
al
izab
ilit
y
b
y
e
n
h
a
n
ci
n
g
th
e
d
ataset
w
it
h
m
a
n
u
f
ac
t
u
r
ed
v
er
s
i
o
n
s
o
f
t
h
e
ex
is
ti
n
g
p
ictu
r
es.
Fig
u
r
e
2
.
I
m
a
g
e
m
o
d
el
4
.
2
.
3
.
Audi
o
v
o
ice
prepro
ce
s
s
ing
T
h
e
au
d
io
f
iles
m
u
s
t
b
e
p
r
ep
a
r
ed
b
ef
o
r
e
an
y
t
h
in
g
else.
A
n
i
n
d
iv
id
u
al
'
s
d
is
ti
n
ct
ch
ar
ac
ter
i
n
th
e
f
ile
'
s
th
ir
d
d
ig
it,
w
h
ic
h
r
ep
r
esen
ts
th
e
e
m
o
tio
n
k
e
y
,
allo
w
s
th
e
s
o
u
n
d
to
r
ec
o
g
n
is
e
d
if
f
er
e
n
t
e
m
o
tio
n
s
.
Sev
e
n
Evaluation Warning : The document was created with Spire.PDF for Python.
I
SS
N
:
2
0
8
9
-
4864
I
n
t J
R
ec
o
n
f
i
g
u
r
ab
le
&
E
m
b
ed
d
ed
Sy
s
t
,
Vo
l.
14
,
No
.
1
,
Ma
r
c
h
2
0
2
5
:
2
5
4
-
2
64
258
d
is
tin
ct
e
m
o
tio
n
s
:
h
ap
p
y
,
d
is
g
u
s
t,
s
ca
r
ed
,
s
u
r
p
r
i
s
ed
,
s
ad
,
an
g
r
y
,
a
n
d
n
eu
tr
al
ar
e
p
ar
t
o
f
th
e
d
ata
s
et.
T
r
an
s
f
o
r
m
th
e
u
n
p
r
o
ce
s
s
ed
a
u
d
io
s
a
m
p
le
s
i
n
to
a
s
u
itab
le
f
o
r
m
a
t
(
s
u
ch
as
W
A
V
.
f
iles
)
.
E
d
it
t
h
e
a
u
d
i
o
s
a
m
p
les
s
u
ch
t
h
at
Mel
-
f
r
eq
u
en
c
y
ce
p
s
tr
al
co
ef
f
i
cien
ts
(
MFC
C
s
)
ar
e
n
o
t
p
r
ese
n
t.
T
o
o
b
tain
a
Mel
-
s
p
ec
tr
o
g
r
a
m
f
r
o
m
a
s
p
ee
ch
s
ig
n
al,
f
o
llo
w
t
h
ese
s
tep
s
an
d
p
r
o
ce
s
s
is
s
h
o
w
n
in
Fig
u
r
e
3
.
−
Fra
m
e
t
h
e
s
ig
n
al:
d
iv
id
e
t
h
e
s
p
ee
ch
s
ig
n
al
in
to
4
0
-
m
i
llis
ec
o
n
d
f
r
a
m
es
w
i
th
a
5
0
%
o
v
er
lap
b
et
w
ee
n
co
n
s
ec
u
tiv
e
f
r
a
m
es.
−
A
p
p
l
y
a
w
i
n
d
o
w
f
u
n
c
tio
n
:
m
u
ltip
l
y
ea
ch
f
r
a
m
e
b
y
a
h
a
m
m
i
n
g
w
i
n
d
o
w
to
r
ed
u
ce
s
p
ec
tr
al
le
ak
ag
e.
−
C
o
m
p
u
te
th
e
f
a
s
t
Fo
u
r
ier
tr
an
s
f
o
r
m
(
FF
T
)
:
p
er
f
o
r
m
an
F
FT
o
n
ea
ch
w
i
n
d
o
w
ed
f
r
a
m
e
to
co
n
v
er
t
it
f
r
o
m
th
e
ti
m
e
d
o
m
ai
n
to
th
e
f
r
eq
u
e
n
c
y
d
o
m
ai
n
.
−
Fil
ter
th
e
f
r
eq
u
e
n
cies
:
ap
p
ly
2
5
b
an
d
-
p
ass
f
ilter
s
to
th
e
f
r
eq
u
en
c
y
-
d
o
m
ain
s
i
g
n
al.
T
h
ese
f
i
lter
s
ar
e
d
esig
n
ed
to
m
atch
t
h
e
cr
itica
l
b
an
d
w
id
t
h
s
o
f
h
u
m
a
n
a
u
d
it
o
r
y
p
er
ce
p
tio
n
,
w
ith
t
h
eir
ce
n
ter
f
r
eq
u
e
n
cies
d
is
tr
ib
u
ted
ac
co
r
d
in
g
to
th
e
M
el
s
ca
le.
−
L
o
g
ar
it
h
m
ic
co
m
p
r
es
s
io
n
:
ap
p
ly
lo
g
ar
it
h
m
f
u
n
ctio
n
to
t
h
e
o
u
tp
u
t
s
o
f
f
i
lt
er
s
to
s
u
p
p
r
ess
t
h
e
d
y
n
a
m
i
c
r
an
g
e.
−
C
o
n
s
tr
u
ct
t
h
e
Me
l
-
s
p
ec
tr
o
g
r
a
m
:
ar
r
an
g
e
th
e
lo
g
ar
it
h
m
icall
y
co
m
p
r
es
s
ed
f
ilter
o
u
tp
u
ts
f
r
o
m
ea
ch
f
r
a
m
e
to
f
o
r
m
t
h
e
Me
l
-
s
p
ec
tr
o
g
r
a
m
o
f
t
h
e
s
i
g
n
a
l.
Fig
u
r
e
3
.
MFC
C
s
m
o
d
el
5.
M
E
T
H
O
D
Ou
r
g
o
al
is
to
d
ev
elo
p
a
m
u
l
ti
-
i
n
p
u
t
m
o
d
el
ca
p
ab
le
o
f
p
r
o
ce
s
s
i
n
g
te
x
t,
i
m
a
g
e
s
,
an
d
au
d
io
,
w
h
il
e
s
i
m
u
lta
n
eo
u
s
l
y
an
al
y
zi
n
g
th
e
ex
is
t
in
g
e
m
o
tio
n
r
ec
o
g
n
itio
n
m
o
d
el
s
i
n
d
etail.
T
h
e
f
ir
s
t
s
te
p
s
o
f
a
f
u
n
d
a
m
e
n
tal
tech
n
iq
u
e
w
er
e
d
ata
co
llectio
n
an
d
p
r
ep
r
o
ce
s
s
in
g
.
T
h
is
r
es
ea
r
ch
co
llects
d
ataset
s
f
r
o
m
a
v
ar
iet
y
o
f
r
ep
u
tab
le
s
o
u
r
ce
s
,
i
n
cl
u
d
in
g
ac
ad
e
m
ic
j
o
u
r
n
als,
r
ep
o
s
ito
r
ies
,
an
d
o
r
g
an
iza
tio
n
s
li
k
e
h
u
g
g
in
g
f
ac
e
,
I
n
c.
,
in
o
r
d
er
to
v
alid
ate
t
h
e
d
ata
'
s
a
u
t
h
en
ticit
y
an
d
r
elev
a
n
c
y
.
P
r
ev
io
u
s
r
e
s
ea
r
ch
er
s
co
n
tr
ib
u
tio
n
s
ar
e
g
r
ea
tl
y
ap
p
r
ec
iated
.
T
h
e
citatio
n
o
f
all
s
o
u
r
ce
s
u
s
ed
in
th
is
w
o
r
k
i
s
o
f
th
e
u
t
m
o
s
t
i
m
p
o
r
tan
ce
to
m
ai
n
tai
n
ac
ad
e
m
ic
h
o
n
es
t
y
.
Fo
llo
w
in
g
th
e
d
ata
co
llectio
n
p
h
ase,
m
et
icu
lo
u
s
d
ata
clea
n
in
g
an
d
p
r
ep
ar
atio
n
to
o
k
p
lace
.
T
o
en
s
u
r
e
d
ata
in
teg
r
it
y
a
n
d
q
u
alit
y
,
s
i
g
n
i
f
ica
n
t
u
p
d
ates
w
er
e
m
ad
e
to
th
e
d
atab
ase
s
.
T
h
e
d
ata
p
r
ep
ar
atio
n
tech
n
i
q
u
es
u
til
ized
w
il
l
b
e
d
is
cu
s
s
ed
in
f
u
r
t
h
er
d
etail
in
t
h
e
p
o
r
tio
n
s
th
at
f
o
llo
w
.
T
h
e
m
e
th
o
d
in
teg
r
ate
s
C
NN
f
o
r
im
a
g
e
a
n
d
au
d
io
d
ata
an
d
L
ST
M
w
it
h
T
F
-
I
DF
v
ec
to
r
izati
o
n
f
o
r
tex
t
d
ata
alig
n
in
g
w
it
h
t
h
e
p
r
o
p
o
s
ed
s
y
s
te
m
's
m
u
lti
-
m
o
d
al
ap
p
r
o
ac
h
[
2
4
]
.
Fo
r
im
ag
e
d
ata
C
NN
ar
ch
itect
u
r
es
ar
e
e
m
p
lo
y
ed
,
lev
er
ag
i
n
g
d
atasets
s
u
ch
as
th
e
e
m
o
tio
n
f
ac
ial
ex
p
r
ess
io
n
p
h
o
to
g
r
ap
h
s
d
ataset.
T
h
ese
C
NN
m
o
d
els
ar
e
tr
ain
ed
to
ca
p
tu
r
e
s
p
atial
f
ea
tu
r
e
s
an
d
p
atter
n
s
i
n
f
ac
ial
ex
p
r
ess
io
n
s
,
f
ac
i
litati
n
g
ac
cu
r
ate
e
m
o
tio
n
class
i
f
icatio
n
f
r
o
m
i
m
a
g
es.
Si
m
i
lar
l
y
,
f
o
r
au
d
io
d
ata
C
NN
ar
ch
itectu
r
es
tr
ai
n
ed
o
n
d
atas
ets
lik
e
t
h
e
R
AVDE
SS
a
u
d
io
d
ataset
ar
e
u
tili
ze
d
.
T
h
ese
m
o
d
el
s
an
a
l
y
ze
s
p
ec
tr
o
g
r
a
m
s
o
r
o
th
er
a
u
d
io
r
ep
r
esen
tatio
n
s
to
id
e
n
ti
f
y
e
m
o
t
io
n
al
c
u
es
co
n
v
e
y
ed
th
r
o
u
g
h
s
p
ee
c
h
.
Fo
r
tex
t
d
ata
t
h
e
m
et
h
o
d
u
tili
ze
s
L
ST
M
n
et
w
o
r
k
s
co
u
p
led
w
ith
T
F
-
I
DF
v
ec
to
r
izatio
n
.
L
ST
M
n
et
w
o
r
k
s
e
x
ce
l
at
ca
p
t
u
r
in
g
s
eq
u
e
n
tial
d
ep
en
d
en
cies
in
tex
t
u
al
d
ata,
w
h
ile
T
F
-
I
DF
v
ec
to
r
izatio
n
tr
a
n
s
f
o
r
m
s
co
n
v
er
s
atio
n
al
te
x
t
i
n
to
n
u
m
er
ical
r
ep
r
esen
tatio
n
s
,
ca
p
t
u
r
in
g
ter
m
i
m
p
o
r
ta
n
ce
.
T
h
is
co
m
b
i
n
ed
ap
p
r
o
ac
h
en
ab
les th
e
ac
cu
r
ate
class
i
f
icat
io
n
o
f
e
m
o
tio
n
s
f
r
o
m
tex
t
u
al
co
n
ten
t.
T
h
e
m
et
h
o
d
en
s
u
r
es
m
et
icu
lo
u
s
d
ata
p
r
ep
r
o
ce
s
s
in
g
to
en
h
a
n
ce
d
ata
q
u
a
lit
y
an
d
co
n
s
i
s
te
n
c
y
ac
r
o
s
s
all
m
o
d
alities
.
T
ec
h
n
iq
u
es
s
u
ch
a
s
d
ata
clea
n
s
i
n
g
a
n
d
e
n
h
a
n
ce
m
en
t
ar
e
e
m
p
lo
y
ed
to
ad
d
r
ess
ch
alle
n
g
e
s
ass
o
ciate
d
w
it
h
e
m
o
tio
n
r
ec
o
g
n
itio
n
d
ata
s
ets.
I
n
t
h
e
m
o
d
eli
n
g
p
h
ase,
i
n
d
iv
id
u
al
M
L
m
o
d
el
s
ar
e
d
ev
elo
p
ed
f
o
r
ea
ch
d
ata
m
o
d
ali
t
y
,
tailo
r
ed
to
lev
er
ag
e
th
e
u
n
iq
u
e
c
h
ar
ac
ter
is
tics
o
f
te
x
t,
i
m
a
g
e
,
an
d
au
d
io
d
ata.
T
h
is
in
cl
u
d
es
d
esig
n
i
n
g
C
NN
ar
ch
i
tectu
r
es
f
o
r
i
m
a
g
e
an
d
au
d
io
d
ata
an
d
im
p
le
m
en
tin
g
L
ST
M
n
et
w
o
r
k
s
w
it
h
T
F
-
I
DF v
ec
to
r
izatio
n
f
o
r
tex
t d
ata
.
A
k
e
y
f
ea
t
u
r
e
o
f
th
e
r
esear
ch
is
th
e
d
ev
elo
p
m
e
n
t
o
f
a
m
u
l
ti
-
in
p
u
t
m
o
d
el
ca
p
ab
le
o
f
ac
co
m
m
o
d
ati
n
g
tex
t,
i
m
a
g
e
,
an
d
s
p
ee
ch
in
p
u
ts
.
T
h
is
m
o
d
el
s
ea
m
le
s
s
l
y
d
ir
ec
t
s
in
p
u
t
s
to
ap
p
r
o
p
r
iate
s
u
b
-
m
o
d
els
b
ased
o
n
th
eir
m
o
d
ali
t
y
,
en
h
a
n
cin
g
e
m
o
tio
n
r
ec
o
g
n
itio
n
ac
cu
r
ac
y
ac
r
o
s
s
d
if
f
er
e
n
t
d
ata
ty
p
es.
E
f
f
i
cie
n
c
y
a
n
d
p
er
f
o
r
m
a
n
ce
co
n
s
id
er
atio
n
s
ar
e
ca
r
ef
u
ll
y
b
alan
ce
d
th
r
o
u
g
h
o
u
t
th
e
r
esear
ch
d
esig
n
,
en
s
u
r
i
n
g
ac
c
u
r
ac
y
w
h
ile
m
ain
tain
in
g
Evaluation Warning : The document was created with Spire.PDF for Python.
I
n
t J
R
ec
o
n
f
i
g
u
r
ab
le
&
E
m
b
ed
d
ed
Sy
s
t
I
SS
N:
2089
-
4864
Mu
ltimo
d
a
l reco
g
n
itio
n
w
ith
d
ee
p
lea
r
n
in
g
:
a
u
d
io
,
ima
g
e,
a
n
d
text
(
R
a
vi
Gu
mmu
la
)
259
p
r
ac
ticalit
y
.
O
v
er
all,
t
h
e
m
e
th
o
d
alig
n
s
clo
s
el
y
w
it
h
t
h
e
p
r
o
p
o
s
ed
s
y
s
te
m
's
o
b
j
ec
tiv
es
a
n
d
ap
p
r
o
ac
h
,
f
ac
ilit
at
in
g
a
co
m
p
r
eh
e
n
s
i
v
e
s
tu
d
y
o
f
e
m
o
tio
n
r
ec
o
g
n
itio
n
a
cr
o
s
s
tex
t,
i
m
ag
e
,
an
d
a
u
d
io
m
o
d
ali
ties
[
2
5
]
.
B
y
co
n
tr
ib
u
ti
n
g
to
th
e
d
ev
elo
p
m
e
n
t
o
f
e
m
o
tio
n
d
etec
tio
n
al
g
o
r
ith
m
s
th
a
t
h
av
e
a
d
ee
p
er
u
n
d
er
s
tan
d
i
n
g
o
f
h
u
m
a
n
e
m
o
tio
n
s
,
o
u
r
w
o
r
k
o
p
en
s
d
o
o
r
to
m
o
r
e
s
o
p
h
is
ticated
ap
p
licatio
n
s
i
n
af
f
ec
ti
v
e
co
m
p
u
ti
n
g
a
n
d
HC
I
.
6.
I
M
P
L
E
M
E
NT
AT
I
O
N
B
u
ild
in
g
ad
v
a
n
ce
d
e
m
o
tio
n
d
etec
tio
n
m
o
d
els
ca
p
ab
le
o
f
r
eliab
l
y
id
e
n
ti
f
y
i
n
g
a
n
d
class
i
f
y
in
g
e
m
o
tio
n
s
ac
r
o
s
s
d
if
f
er
e
n
t
m
o
d
alities
w
as
t
h
e
p
r
im
ar
y
g
o
al
o
f
o
u
r
s
tu
d
y
.
I
n
t
h
is
s
ec
t
io
n
,
w
e
d
etailed
th
e
s
tep
s
in
v
o
l
v
ed
i
n
cr
ea
ti
n
g
o
u
r
m
o
d
el
f
r
o
m
s
elec
ti
n
g
ap
p
r
o
p
r
ia
te
ar
ch
itect
u
r
es
a
n
d
al
g
o
r
ith
m
s
to
f
i
n
e
-
t
u
n
i
n
g
h
y
p
er
p
ar
a
m
eter
s
.
T
h
e
g
o
al
o
f
o
u
r
r
esear
ch
w
as
to
d
ev
elo
p
a
s
et
o
f
m
o
d
els
t
h
at
co
u
ld
a
cc
u
r
atel
y
a
n
ticip
ate
h
o
w
p
eo
p
le
w
ill
f
ee
l
b
ased
o
n
th
eir
in
ter
p
r
etatio
n
o
f
tex
t,
i
m
a
g
es
,
an
d
au
d
io
in
p
u
ts
,
u
ti
lizin
g
cu
tti
n
g
-
ed
g
e
tech
n
o
lo
g
y
an
d
i
n
d
u
s
tr
y
s
ta
n
d
ar
d
s
.
A
ch
iev
i
n
g
s
tate
-
of
-
t
h
e
-
ar
t
p
er
f
o
r
m
a
n
ce
w
as
th
e
m
aj
o
r
o
b
j
ec
tiv
e
o
f
o
u
r
m
o
d
eli
n
g
ef
f
o
r
t.
T
h
is
w
o
u
ld
p
r
o
p
el
th
e
d
ev
elo
p
m
e
n
t
o
f
e
m
o
tio
n
r
ec
o
g
n
itio
n
tec
h
n
o
lo
g
y
a
n
d
its
g
a
m
e
-
ch
an
g
i
n
g
ap
p
licatio
n
s
ac
r
o
s
s
s
ev
er
al
s
ec
to
r
s
.
6
.
1
.
T
ex
t
e
m
o
t
io
n r
ec
o
g
nitio
n
W
e
lo
o
k
ed
at
D
L
ar
ch
i
tectu
r
es
as
w
ell
a
s
co
n
v
e
n
tio
n
al
ML
m
o
d
els
e
x
te
n
s
i
v
el
y
f
o
r
T
E
R
.
A
s
a
f
o
u
n
d
atio
n
f
o
r
T
E
R
,
w
e
b
eg
a
n
w
it
h
lo
g
i
s
tic
r
eg
r
es
s
io
n
,
a
s
tr
aig
h
t
f
o
r
w
ar
d
m
o
d
el
th
at
w
a
s
later
ex
te
n
d
ed
to
h
an
d
le
m
u
l
ticlas
s
p
r
o
b
lem
s
.
Ou
r
n
e
x
t
s
to
p
w
a
s
to
C
NN
m
o
d
els,
w
h
ic
h
ar
e
w
ell
-
k
n
o
w
n
f
o
r
ac
cu
r
atel
y
d
ep
ictin
g
n
u
a
n
ce
d
d
ec
is
io
n
-
m
ak
in
g
li
m
its
.
W
e
r
an
test
s
u
s
in
g
a
w
id
e
r
an
g
e
o
f
k
e
r
n
el
f
u
n
ctio
n
s
an
d
r
eg
u
lar
izatio
n
p
ar
a
m
eter
s
.
W
e
ex
p
lo
r
ed
d
ec
is
io
n
tr
ee
s
an
d
r
an
d
o
m
f
o
r
ests
as
p
ar
t
o
f
o
u
r
en
s
e
m
b
le
lear
n
i
n
g
f
o
r
T
E
R
.
Nex
t,
w
e
d
elv
ed
in
to
DL
to
s
h
o
w
h
o
w
ar
ti
f
icial
n
eu
r
al
n
et
w
o
r
k
s
(
A
NN
s
)
ca
n
ad
ap
t
to
id
en
ti
f
y
e
m
o
tio
n
s
.
W
e
u
s
ed
th
e
T
F
-
I
DF
v
ec
to
r
izer
to
c
o
n
v
er
t
tex
t
u
al
in
p
u
t
in
to
n
u
m
er
ical
r
ep
r
esen
tatio
n
s
s
o
th
at
o
u
r
m
o
d
el
s
co
u
ld
p
r
o
ce
s
s
an
d
as
s
ess
t
h
e
tal
k
s
.
T
h
is
m
et
h
o
d
w
a
s
u
s
ef
u
l
f
o
r
h
i
g
h
li
g
h
ti
n
g
k
e
y
ter
m
s
w
it
h
i
n
th
e
tex
t
'
s
co
n
te
x
t,
w
h
ic
h
led
to
th
e
id
en
tif
icatio
n
o
f
s
ev
e
n
e
m
o
tio
n
s
:
s
u
r
p
r
is
e,
an
g
er
,
f
ea
r
,
d
is
g
u
s
t,
n
e
u
tr
al,
j
o
y
,
s
o
r
r
o
w
,
a
n
d
n
eu
tr
alit
y
.
W
o
r
d
clo
u
d
v
is
u
aliza
tio
n
h
elp
ed
u
s
g
r
asp
th
e
tex
tu
al
d
ata
b
et
ter
b
y
g
r
ap
h
icall
y
r
ep
r
esen
tin
g
t
h
e
m
o
s
t p
r
ev
a
le
n
t p
h
r
as
e
s
ass
o
ciate
d
w
it
h
ea
c
h
e
m
o
tio
n
.
T
h
e
co
n
v
en
t
io
n
al
M
L
m
o
d
els
in
c
lu
d
ed
in
th
e
Scik
i
t
-
lear
n
p
ac
k
a
g
e
q
u
ic
k
l
y
p
r
o
v
ed
to
b
e
u
n
d
er
w
h
el
m
in
g
.
First,
w
e
co
v
er
ed
DL
an
d
its
m
an
y
m
o
d
els.
T
h
e
class
ic
A
N
N
is
ex
c
ellen
t
at
co
llectin
g
co
m
p
le
x
d
ata
co
r
r
elatio
n
s
,
s
o
w
e
s
tar
ted
w
it
h
it.
1
D
C
NN
s
ar
e
g
r
ea
t
at
f
i
n
d
in
g
li
ttle
p
att
er
n
s
i
n
te
x
t,
s
o
w
e
lo
o
k
ed
at
th
e
m
n
e
x
t.
Utilizi
n
g
L
ST
M
n
et
w
o
r
k
s
,
w
e
w
er
e
ab
le
to
ca
p
tu
r
e
s
eq
u
en
tial
d
ep
en
d
en
cies.
T
h
e
lack
o
f
co
m
p
u
tatio
n
al
ef
f
icie
n
c
y
p
r
o
v
id
ed
b
y
g
ated
r
ec
u
r
r
en
t
u
n
it
s
(
GR
U
s
)
in
co
m
p
ar
i
s
o
n
to
L
ST
M
m
o
d
els
w
a
s
co
u
n
ter
i
n
t
u
iti
v
e
to
o
u
r
ex
p
ec
tatio
n
s
.
B
id
ir
ec
tio
n
al
lo
n
g
s
h
o
r
t
-
ter
m
m
e
m
o
r
y
(
B
i
-
L
ST
M)
an
d
o
th
er
b
id
ir
ec
tio
n
al
m
o
d
els
h
av
e
s
h
e
d
lig
h
t o
n
t
h
e
s
i
g
n
i
f
ican
ce
o
f
c
o
n
tex
t
u
al
b
id
ir
ec
tio
n
al
p
r
o
ce
s
s
in
g
.
W
e
d
ec
id
ed
to
tr
y
o
u
t
h
y
b
r
id
ar
ch
itect
u
r
e
s
af
ter
o
u
r
r
esear
ch
r
ev
ea
led
th
at
all
n
eu
r
al
n
et
w
o
r
k
s
f
u
n
ctio
n
e
d
eq
u
all
y
.
T
h
e
id
ea
b
eh
in
d
th
e
s
e
b
id
ir
ec
tio
n
all
y
in
teg
r
ated
m
o
d
el
s
w
as
to
ca
p
italize
o
n
th
eir
co
m
p
l
e
m
en
tar
y
s
tr
e
n
g
th
s
.
Fu
r
t
h
er
m
o
r
e,
a
co
m
p
lex
m
o
d
e
l
in
cl
u
d
in
g
C
NNs,
L
ST
Ms
,
an
d
Bi
-
L
ST
M
s
w
as
p
r
o
d
u
ce
d
as
a
co
n
s
eq
u
e
n
ce
o
f
th
e
m
er
g
i
n
g
o
f
t
h
ese
t
w
o
t
y
p
e
s
o
f
m
o
d
els,
w
h
ic
h
s
o
u
g
h
t
to
ex
tr
ac
t
tex
tu
al
f
ea
t
u
r
es
t
h
at
wer
e
b
o
th
lo
ca
l
an
d
g
lo
b
al.
B
u
t
t
h
ese
h
y
b
r
id
d
esi
g
n
s
w
h
er
ea
s
e
f
f
ec
ti
v
e
as
t
h
e
o
r
ig
i
n
al
v
er
s
io
n
s
.
C
o
n
s
i
s
te
n
t
r
es
u
lts
w
er
e
ac
h
ie
v
ed
u
s
i
n
g
n
e
u
r
al
n
et
w
o
r
k
m
o
d
els
t
h
at
w
er
e
tr
ain
ed
an
d
o
p
ti
m
ize
d
f
o
r
T
E
R
.
On
av
er
ag
e,
t
h
ese
m
o
d
el
s
h
a
v
e
a
7
9
%
s
u
cc
e
s
s
r
ate
w
h
e
n
it
co
m
es
to
d
etec
tin
g
co
m
p
licated
p
atter
n
s
in
te
x
t
u
al
d
ata
an
d
s
u
b
tle
e
m
o
tio
n
al
i
n
d
icato
r
s
.
A
cc
u
r
ac
y
,
p
r
ec
is
io
n
,
r
ec
all
,
an
d
F1
-
s
co
r
e,
a
m
o
n
g
o
th
er
i
n
d
u
s
tr
y
-
s
tan
d
ar
d
m
etr
ic
s
,
w
er
e
u
s
ed
to
co
n
d
u
ct
a
co
m
p
r
e
h
en
s
iv
e
e
v
al
u
atio
n
o
f
t
h
e
m
o
d
el.
Vi
s
u
al
r
ep
r
ese
n
tatio
n
s
o
f
th
e
s
e
r
es
u
lts
al
lo
w
ed
f
o
r
an
u
n
d
er
s
ta
n
d
ab
le
co
m
p
ar
is
o
n
ass
e
s
s
m
e
n
t
o
f
th
e
m
o
d
els
'
p
er
f
o
r
m
a
n
ce
in
t
h
e
co
m
p
lica
ted
task
o
f
e
m
o
tio
n
id
en
ti
f
icati
o
n
f
r
o
m
tex
t
u
al
in
p
u
t.
T
h
e
f
in
d
i
n
g
s
o
f
th
is
s
t
u
d
y
w
i
ll
p
av
e
t
h
e
w
a
y
f
o
r
f
r
u
it
f
u
l
d
is
cu
s
s
io
n
s
a
n
d
d
ec
is
io
n
s
ab
o
u
t
te
x
t
e
m
o
tio
n
id
en
ti
f
icatio
n
tec
h
n
iq
u
es.
6
.
2
.
Wo
rd
em
bedd
i
ng
T
h
e
g
o
al
o
f
w
o
r
d
em
b
ed
d
in
g
is
to
cr
ea
te
r
ea
l
-
v
alu
ed
v
ec
to
r
r
ep
r
esen
tatio
n
s
o
f
w
o
r
d
s
in
a
s
p
ec
if
ied
v
ec
to
r
s
p
ac
e.
C
o
m
p
ar
ed
to
s
u
ch
a
d
en
s
e
r
ep
r
esen
tat
io
n
,
s
p
a
r
s
e
w
o
r
d
r
ep
r
esen
tatio
n
s
ar
e
p
lain
l
y
w
o
r
s
e
d
u
e
to
th
eir
h
i
g
h
d
i
m
e
n
s
io
n
alit
y
.
T
h
e
w
o
r
d
e
m
b
ed
d
in
g
ar
ch
itect
u
r
e
is
s
h
o
w
n
i
n
Fi
g
u
r
e
4
.
T
r
an
s
f
o
r
m
i
n
g
w
o
r
d
s
in
to
d
en
s
e
v
ec
to
r
s
,
w
o
r
d
em
b
ed
d
in
g
alg
o
r
ith
m
s
(
s
ee
A
l
g
o
r
ith
m
1
)
lik
e
W
o
r
d
2
Vec
f
ac
ilit
ate
v
ar
io
u
s
NL
P
task
s
in
c
lu
d
i
n
g
te
x
t
cla
s
s
i
f
icatio
n
an
d
e
m
o
tio
n
d
etec
tio
n
.
Her
e
is
th
e
eq
u
atio
n
o
f
w
o
r
d
e
m
b
ed
d
in
g
a
s
s
h
o
w
n
i
n
(
1
)
:
,
+
1
=
,
−
∙
,
(
1
)
’
w
h
er
e
,
r
ep
r
esen
ts
t
h
e
e
m
b
ed
d
i
n
g
v
ec
to
r
o
f
w
o
r
d
‘
w
’
at
iter
at
io
n
k
.
Evaluation Warning : The document was created with Spire.PDF for Python.
I
SS
N
:
2
0
8
9
-
4864
I
n
t J
R
ec
o
n
f
i
g
u
r
ab
le
&
E
m
b
ed
d
ed
Sy
s
t
,
Vo
l.
14
,
No
.
1
,
Ma
r
c
h
2
0
2
5
:
2
5
4
-
2
64
260
‘
’
is
t
h
e
lear
n
i
n
g
r
ate.
‘
L
’
i
s
th
e
lo
s
s
f
u
n
ctio
n
.
‘
,
’
is
t
h
e
g
r
ad
in
t o
f
th
e
lo
s
s
f
u
n
ctio
n
w
it
h
r
esp
ec
t to
th
e
e
m
b
e
d
d
in
g
v
ec
to
r
.
Fig
u
r
e
4
.
W
o
r
d
em
b
ed
d
in
g
m
o
d
el
A
l
g
o
r
ith
m
1
.
W
o
r
d
em
b
ed
d
in
g
alg
o
r
it
h
m
1:
Input
: Corpus C; Target word w_I and the contextual word set {w_n}^{N}_{n=1}.
2:
Output
: Tailored word embedding of w_I.
3: Train θ and β with the corpus C.
4: for
each
word w_n
∈
{w_n}^{N}_{n=1}, n ≠ I do
5: for k
∈
(1, . . . , K) do
6: Update θ_{w_n, k} with Eq. (1).
7: end for
8: end for
9: for k
∈
(1, . . . , K) do
10: Update θ_{w_I, k} with Eq. (1).
11: end for
Usi
n
g
t
h
ese
v
ec
to
r
s
w
e
m
a
y
f
in
d
th
e
s
e
m
an
tic
r
elatio
n
s
h
ip
s
b
et
w
ee
n
w
o
r
d
s
.
Fo
r
ex
a
m
p
le,
th
e
y
p
ic
k
u
p
o
n
th
e
"
m
ale
-
f
e
m
ale"
co
n
n
ec
tio
n
b
et
w
ee
n
"
m
a
n
"
an
d
"
w
o
m
a
n
"
as
w
ell
as
"
k
in
g
"
an
d
"q
u
ee
n
"
.
T
o
to
p
it
all
o
f
f
,
t
h
e
y
ca
n
r
ec
o
g
n
ize
r
elati
o
n
s
h
ip
s
b
et
w
ee
n
d
if
f
er
en
t
ten
s
es
o
f
v
er
b
s
l
ik
e
"
w
a
lk
"
,
"
w
alk
s
"
,
"
w
a
lk
ed
"
,
an
d
"
w
al
k
i
n
g
"
.
Ou
r
L
ST
M
m
o
d
el
'
s
w
o
r
d
v
ec
to
r
s
ar
e
tr
ain
ed
in
co
n
j
u
n
ct
io
n
w
it
h
th
e
n
e
u
r
al
n
et
w
o
r
k
an
d
ar
e
f
ir
s
t
co
n
s
tr
u
cted
at
t
h
e
e
m
b
ed
d
in
g
la
y
er
.
Sin
ce
w
e
u
s
ed
an
e
m
b
e
d
d
in
g
s
ize
o
f
4
0
0
,
ea
ch
w
o
r
d
is
r
ep
r
esen
ted
in
a
400
-
d
im
e
n
s
i
o
n
al
v
ec
to
r
s
p
ac
e.
T
o
g
et
th
e
tex
t
r
ea
d
y
,
r
e
m
o
v
e
an
y
u
n
n
ec
es
s
ar
y
ch
ar
ac
ter
s
an
d
r
ep
lace
th
e
m
w
it
h
r
eg
u
lar
ch
ar
ac
ter
s
.
T
h
is
in
clu
d
e
s
tab
ch
ar
ac
ter
s
,
n
e
w
li
n
e
ch
ar
ac
ter
s
,
ex
ce
s
s
i
v
e
s
p
ac
es
,
an
d
o
th
er
s
im
ilar
ch
ar
ac
ter
s
.
T
o
k
en
izin
g
th
e
d
ata
is
d
o
n
e
u
s
in
g
t
h
e
s
p
a
C
y
s
o
f
t
war
e.
Sin
ce
s
p
aC
y
d
o
es
n
o
t
h
av
e
a
p
ar
allel/
m
u
ltico
r
e
to
k
en
izer
,
w
e
r
eso
r
t
to
u
s
in
g
th
e
f
ast.ai
p
ac
k
ag
e.
W
h
en
co
m
p
ar
ed
to
i
ts
s
er
ial
co
u
n
ter
p
ar
t,
th
e
p
ar
allel
s
p
aC
y
to
k
e
n
izer
i
s
m
u
c
h
f
aster
b
ec
a
u
s
e
i
t
m
ak
es
u
s
e
o
f
all
C
P
U
co
r
es.
Sep
ar
atin
g
th
e
tex
t
i
n
to
in
d
iv
id
u
al
to
k
e
n
s
an
d
as
s
i
g
n
i
n
g
a
u
n
iq
u
e
i
n
d
ex
to
ea
ch
to
k
en
is
t
h
e
m
ai
n
o
b
j
ec
tiv
e
o
f
to
k
en
iza
tio
n
.
I
n
o
r
d
er
f
o
r
o
u
r
m
o
d
el
to
w
o
r
k
,
w
e
n
ee
d
to
co
n
v
er
t
th
e
tex
t
in
to
in
teg
er
i
n
d
ices.
T
h
e
n
ex
t
s
tep
is
n
u
m
er
icaliza
tio
n
,
w
h
ic
h
in
v
o
lv
e
s
t
u
r
n
i
n
g
to
k
en
s
in
to
n
u
m
b
er
s
.
T
h
is
p
r
o
ce
s
s
co
m
p
r
i
s
es:
−
C
o
m
p
ili
n
g
an
o
r
d
er
ed
lis
t o
f
all
th
e
w
o
r
d
s
ap
p
ea
r
in
g
i
n
th
e
t
ex
t.
−
C
h
a
n
g
in
g
t
h
e
w
o
r
d
i
n
d
ex
in
t
h
at
lis
t to
m
atc
h
ea
ch
o
n
e.
Evaluation Warning : The document was created with Spire.PDF for Python.
I
n
t J
R
ec
o
n
f
i
g
u
r
ab
le
&
E
m
b
ed
d
ed
Sy
s
t
I
SS
N:
2089
-
4864
Mu
ltimo
d
a
l reco
g
n
itio
n
w
ith
d
ee
p
lea
r
n
in
g
:
a
u
d
io
,
ima
g
e,
a
n
d
text
(
R
a
vi
Gu
mmu
la
)
261
Ou
r
f
o
c
u
s
is
n
o
t
o
n
t
h
e
w
h
o
le
v
o
ca
b
u
lar
y
l
is
t
s
i
n
ce
s
i
n
g
u
lar
w
o
r
d
s
ar
e
m
ea
n
in
g
le
s
s
an
d
ea
s
il
y
m
is
s
ed
.
A
w
o
r
d
h
a
s
to
ap
p
ea
r
t
w
ice
o
r
m
o
r
e
ti
m
es
b
e
f
o
r
e
i
t
m
a
y
b
e
s
p
elled
p
r
o
p
er
ly
.
T
h
e
m
o
d
el
ca
n
n
o
t
b
e
tau
g
h
t
u
s
i
n
g
i
n
f
r
eq
u
e
n
t
p
h
r
a
s
es.
Stack
i
n
g
ar
ch
itect
u
r
es
i
n
DL
,
s
u
ch
as
L
ST
M
-
C
N
N
(
s
ee
A
lg
o
r
ith
m
2
)
,
lev
er
ag
e
t
h
e
d
is
ti
n
ct
ca
p
ab
ilit
i
es
o
f
s
eq
u
e
n
tial
d
ata
h
a
n
d
li
n
g
an
d
s
p
atial
p
atter
n
s
p
r
o
ce
s
s
i
n
g
,
r
esp
ec
ti
v
el
y
,
to
co
m
b
i
n
e
t
h
e
ch
ar
ac
ter
is
tic
s
o
f
b
o
th
L
ST
M
n
et
w
o
r
k
s
an
d
C
NN.
Her
e
is
th
e
eq
u
a
tio
n
o
f
L
ST
M
an
d
C
NN
A
l
g
o
r
ith
m
:
A
l
g
o
r
ith
m
2
.
L
ST
M
an
d
C
NN
s
tack
i
n
g
ar
ch
itect
u
r
e
Require: Dataset O={(a1,b1),(a2,b2),...,(aU,bU)
}
Base classifiers: LSTM, CNN;
Meta
-
classifier: Logistic Regression;
Preprocess the data O to form dataset 1D.
Choose both base classifiers, LSTM and CNN as well as the meta
-
classifier and Logistic
Regression.
Train the LSTM and CNN models using dataset 1D
′, employing five
-
fold cross
-
validation.
Generate dataset Train using the trained LSTM and CNN models to estimate the probability
values
φ^
k
and
φ^
k
CN
N
re
sp
ec
ti
ve
ly
.
Construct the stacking model and predict the result at the segment level
^
.
Obtain the result at the utterance level
^
using majority voting.
return
~
;
output:
The final result
~
.
7.
M
O
DULE
D
E
SCR
I
P
T
I
O
N
T
h
is
s
y
s
te
m
is
i
n
ten
d
ed
to
id
e
n
ti
f
y
e
m
o
tio
n
s
i
n
th
r
ee
d
is
ti
n
c
t
f
o
r
m
s
o
f
in
p
u
t:
tex
t,
s
p
ee
ch
,
an
d
f
ac
ial
ex
p
r
ess
io
n
s
.
T
h
e
m
ain
o
b
j
ec
tiv
e
i
s
to
u
s
e
C
NN,
a
k
i
n
d
o
f
d
ee
p
lear
n
in
g
m
o
d
el
m
ad
e
to
f
i
n
d
p
atter
n
s
i
n
d
ata,
to
tr
ain
d
is
tin
c
t
m
o
d
els
to
co
r
r
ec
tl
y
id
en
t
i
f
y
e
m
o
t
io
n
s
i
n
t
h
es
e
v
ar
io
u
s
s
o
u
r
ce
s
o
f
i
n
p
u
t.
T
o
s
tar
t,
d
atasets
w
it
h
tex
t,
au
d
io
,
an
d
f
ac
ial
p
h
o
to
s
r
ep
r
esen
tin
g
a
r
an
g
e
o
f
e
m
o
tio
n
s
i
n
cl
u
d
in
g
h
ap
p
in
e
s
s
,
s
ad
n
es
s
,
r
ag
e,
an
d
d
is
g
u
s
t
ar
e
p
r
ep
a
r
ed
.
A
f
ter
p
r
ep
r
o
ce
s
s
in
g
ea
ch
d
ata
s
et
to
g
u
ar
an
te
e
co
n
s
is
te
n
c
y
i
n
s
ize
an
d
q
u
alit
y
,
t
h
e
d
ata
ar
e
lab
eled
w
it
h
th
e
ap
p
r
o
p
r
iate
em
o
tio
n
s
.
W
h
en
t
h
e
d
ata
is
p
r
e
p
ar
ed
,
C
NN
m
o
d
els
ar
e
tr
ain
e
d
o
n
ea
ch
f
o
r
m
o
f
d
ata:
tex
t
f
o
r
w
r
itte
n
e
m
o
tio
n
s
,
au
d
io
f
o
r
v
o
ice,
a
n
d
p
h
o
to
s
f
o
r
f
ac
ial
e
x
p
r
ess
io
n
s
.
Fo
llo
w
i
n
g
tr
ai
n
i
n
g
,
a
n
y
n
e
w
p
ictu
r
e,
au
d
io
f
ile,
o
r
tex
t
in
p
u
t
f
r
o
m
t
h
e
u
s
er
ca
n
b
e
u
s
ed
b
y
th
e
s
y
s
te
m
to
an
ticip
ate
e
m
o
tio
n
s
.
−
Up
lo
ad
f
ac
ial
e
m
o
t
io
n
d
atase
t
:
g
at
h
er
i
n
g
i
m
a
g
es
s
h
o
w
in
g
d
if
f
er
e
n
t
f
ac
ial
e
x
p
r
ess
io
n
s
l
i
k
e
h
ap
p
y
,
s
ad
,
an
g
r
y
,
an
d
d
is
g
u
s
t.
−
P
r
ep
r
o
ce
s
s
d
ataset
:
m
a
k
e
s
u
r
e
th
e
y
ar
e
all
s
i
m
ilar
i
n
s
ize
an
d
q
u
alit
y
.
T
ak
es
ea
ch
i
m
a
g
e
a
lab
el
s
a
y
i
n
g
w
h
at
e
m
o
t
io
n
is
b
ei
n
g
s
h
o
w
n
(
lik
e
"
h
ap
p
y
"
an
d
"
s
ad
"
)
.
−
T
r
ain
f
ac
ial
e
m
o
t
io
n
C
NN
al
g
o
r
ith
m
:
it
w
ill
lear
n
to
r
ec
o
g
n
ize
p
atter
n
s
i
n
t
h
e
i
m
ag
e
th
a
t
m
atc
h
d
if
f
er
en
t
e
m
o
tio
n
s
.
T
h
is
lear
n
i
n
g
p
r
o
ce
s
s
is
ca
lled
tr
ai
n
in
g
a
n
d
g
ets b
etter
ac
cu
r
ac
y
w
it
h
m
o
r
e
tr
ai
n
i
n
g
.
−
T
r
ain
au
d
io
em
o
tio
n
C
NN
alg
o
r
ith
m
:
s
i
m
i
lar
to
th
e
f
ac
ial
em
o
tio
n
tr
ain
i
n
g
,
b
u
t
h
er
e
w
il
l
u
s
e
r
ec
o
r
d
in
g
s
.
I
t
w
ill lea
r
n
to
f
i
n
d
p
atter
n
s
i
n
s
o
u
n
d
t
h
at
m
atch
d
i
f
f
er
en
t e
m
o
tio
n
s
li
k
e
h
ap
p
in
e
s
s
a
n
d
s
ad
n
ess
.
−
T
r
ain
tex
t
e
m
o
tio
n
C
NN
alg
o
r
ith
m
:
it
w
i
ll
lear
n
to
r
ec
o
g
n
ize
p
atter
n
s
i
n
th
e
te
x
t
t
h
at
m
atc
h
d
if
f
er
en
t
e
m
o
tio
n
s
.
T
h
is
lear
n
i
n
g
p
r
o
ce
s
s
is
ca
lled
tr
ai
n
in
g
a
n
d
g
ets b
etter
ac
cu
r
ac
y
w
it
h
m
o
r
e
tr
ai
n
i
n
g
.
−
A
cc
u
r
ac
y
co
m
p
ar
i
s
o
n
g
r
ap
h
: i
t
is
s
h
o
w
n
i
n
a
g
r
ap
h
,
m
ak
i
n
g
it e
as
y
to
s
ee
w
h
ic
h
ac
cu
r
ac
y
i
s
b
etter
.
−
P
r
ed
ict
f
ac
ial
e
m
o
tio
n
: i
n
th
is
m
o
d
u
le
u
s
er
w
ill
u
p
lo
ad
test
im
ag
e
to
d
etec
t e
m
o
t
i
o
n
.
−
P
r
ed
ict
s
p
ee
ch
em
o
tio
n
: in
t
h
i
s
m
o
d
u
le
u
s
er
w
ill
u
p
lo
ad
test
au
d
io
f
ile
to
d
etec
t sp
ee
ch
.
−
P
r
ed
ict
tex
t e
m
o
tio
n
: i
n
th
i
s
m
o
d
u
le
u
s
er
w
ill
u
p
lo
ad
test
tex
t d
ata
to
d
etec
t e
m
o
tio
n
.
8.
RE
SU
L
T
S AN
D
D
I
SCU
SS
I
O
N
Fro
m
s
e
n
ti
m
e
n
t
g
r
ap
h
s
h
o
w
n
in
Fi
g
u
r
e
5
th
e
co
u
n
t
v
al
u
e
f
o
r
d
if
f
er
en
t
s
en
t
ien
t
s
is
:
an
g
r
y
:
8
,
500
;
d
is
g
u
s
ted
:
4
,
000
;
f
ea
r
f
u
l
:
2
,
000
;
h
ap
p
y
:
5
,
500
;
n
eu
tr
al
:
9
,
0
0
0
;
s
ad
:
5
,
0
0
0
;
an
d
s
u
r
p
r
is
ed
:
2
,
5
0
0
.
T
h
e
d
ataset
in
d
icate
s
a
p
r
ed
o
m
in
a
n
t
p
r
es
en
ce
o
f
n
eu
tr
al
s
en
t
i
m
e
n
t,
f
o
llo
w
ed
b
y
s
ig
n
i
f
i
ca
n
t
co
u
n
ts
o
f
s
ad
an
d
an
g
r
y
e
m
o
tio
n
s
,
r
ef
lecti
n
g
a
g
en
er
al
l
y
m
ix
ed
s
e
n
ti
m
e
n
t
w
it
h
a
s
li
g
h
t
lea
n
i
n
g
to
w
ar
d
s
n
eg
a
tiv
e
e
m
o
tio
n
s
.
T
h
e
b
lu
e
lin
e
r
ep
r
esen
ti
n
g
tr
ain
i
n
g
ac
cu
r
ac
y
s
h
o
w
s
h
o
w
w
ell
th
e
m
o
d
el
p
er
f
o
r
m
s
o
n
th
e
tr
ai
n
in
g
d
ata,
as
ti
m
e
p
r
o
g
r
ess
es
it
b
ec
o
m
e
s
b
etter
as
s
h
o
w
n
i
n
Fig
u
r
e
6
.
T
h
e
v
alid
atio
n
ac
cu
r
ac
y
(
r
ed
lin
e)
d
em
o
n
s
tr
ates
th
e
m
o
d
el
's
ab
ilit
y
to
g
en
er
al
ize
to
n
e
w
d
ata.
I
t
s
h
o
u
ld
id
ea
ll
y
b
e
v
er
y
s
i
m
i
lar
to
th
e
tr
ain
in
g
ac
cu
r
ac
y
w
i
th
litt
le
to
n
o
v
ar
ian
ce
.
Mo
n
ito
r
i
n
g
b
o
t
h
cu
r
v
es a
id
s
i
n
ass
e
s
s
i
n
g
m
o
d
el
p
er
f
o
r
m
a
n
ce
a
n
d
id
en
ti
f
y
i
n
g
o
v
er
f
i
tti
n
g
.
T
h
e
tr
ain
in
g
lo
s
s
c
u
r
v
e
(
b
l
u
e)
r
ep
r
esen
ts
h
o
w
w
ell
th
e
m
o
d
el
f
it
s
t
h
e
tr
ai
n
i
n
g
d
ata,
d
ec
r
e
asin
g
o
v
er
ep
o
ch
s
as
s
h
o
w
n
i
n
Fig
u
r
e
7
.
T
h
e
v
alid
atio
n
lo
s
s
cu
r
v
e
(
r
e
d
)
m
ir
r
o
r
s
th
is
tr
en
d
b
u
t
in
d
i
ca
tes
h
o
w
w
el
l
th
e
m
o
d
el
g
en
er
alize
s
to
u
n
s
ee
n
d
ata;
if
it
d
iv
er
g
es
s
ig
n
i
f
ica
n
tl
y
o
r
s
tar
ts
i
n
cr
ea
s
i
n
g
,
it
s
u
g
g
es
ts
o
v
er
f
itti
n
g
.
C
o
m
p
ar
in
g
t
h
e
t
w
o
h
elp
s
o
p
ti
m
ize
m
o
d
el
p
er
f
o
r
m
a
n
ce
.
Evaluation Warning : The document was created with Spire.PDF for Python.
I
SS
N
:
2
0
8
9
-
4864
I
n
t J
R
ec
o
n
f
i
g
u
r
ab
le
&
E
m
b
ed
d
ed
Sy
s
t
,
Vo
l.
14
,
No
.
1
,
Ma
r
c
h
2
0
2
5
:
2
5
4
-
2
64
262
Fig
u
r
e
5
.
Sen
ti
m
e
n
t
g
r
ap
h
Fig
u
r
e
6
.
T
r
ain
in
g
an
d
v
a
lid
ati
o
n
ac
cu
r
ac
y
g
r
ap
h
Fig
u
r
e
7
.
T
r
ain
in
g
an
d
v
a
lid
ati
o
n
lo
s
s
g
r
ap
h
T
h
e
co
n
f
u
s
io
n
m
atr
ix
p
r
o
v
id
es
in
s
i
g
h
ts
in
to
th
e
m
o
d
el
'
s
p
er
f
o
r
m
a
n
ce
ac
r
o
s
s
d
if
f
er
e
n
t
ca
teg
o
r
ies,
p
r
esen
tin
g
p
r
ec
is
io
n
,
r
ec
all
,
F
1
-
s
co
r
e
,
an
d
s
u
p
p
o
r
t
m
etr
ic
s
as
s
h
o
w
n
i
n
T
ab
le
1
.
Hig
h
p
r
ec
is
io
n
(
9
3
%)
an
d
r
ec
all
(
9
2
%)
in
d
icate
ac
cu
r
ate
id
en
ti
f
icatio
n
in
o
n
e
ca
teg
o
r
y
,
w
h
ile
s
lig
h
tl
y
lo
w
er
p
r
ec
is
io
n
(
9
5
%)
an
d
g
o
o
d
r
ec
all
(
8
4
%)
in
an
o
th
er
s
u
g
g
est
f
e
w
f
alse
n
e
g
ati
v
es.
Si
m
ilar
l
y
,
h
ig
h
p
r
ec
is
io
n
(
9
3
%)
an
d
r
ec
all
(
9
5
%)
s
h
o
w
ca
s
e
s
u
cc
ess
f
u
l
id
e
n
ti
f
ic
atio
n
,
w
h
er
ea
s
lo
w
er
p
r
ec
is
io
n
(
8
2
%)
an
d
r
ec
all
(
8
2
%)
in
a
ca
teg
o
r
y
i
n
d
icate
p
o
ten
tial
c
h
alle
n
g
e
s
.
Me
a
n
wh
ile,
h
i
g
h
p
r
ec
is
io
n
(
9
6
%)
a
n
d
r
ec
all
(
9
6
%)
s
i
g
n
if
y
e
x
ce
llen
ce
,
w
h
ile
lo
w
er
p
r
ec
is
io
n
(
7
4
%)
an
d
h
ig
h
r
ec
all
(
9
1
%)
im
p
l
y
m
o
r
e
f
alse
p
o
s
itiv
es
b
u
t
ef
f
ec
t
iv
e
id
e
n
ti
f
icatio
n
.
I
m
a
g
e
an
d
au
d
io
m
o
d
els
ac
h
ie
v
ed
th
e
h
ig
h
e
s
t
ac
cu
r
ac
y
at
9
9
%,
s
h
o
w
ca
s
i
n
g
s
u
p
er
io
r
p
er
f
o
r
m
an
ce
.
T
ex
t
m
o
d
els
ac
h
iev
ed
s
lig
h
tl
y
lo
w
er
ac
cu
r
a
c
y
at
9
6
%,
s
till
d
e
m
o
n
s
tr
ati
n
g
s
tr
o
n
g
p
er
f
o
r
m
an
ce
s
s
h
o
w
n
i
n
T
a
b
le
2
.
T
ab
le
1.
T
r
ain
in
g
p
er
f
o
r
m
a
n
ce
S.
N
o
.
P
r
e
c
i
si
o
n
r
e
c
a
l
l
F1
-
sco
r
e
S
u
p
p
o
r
t
0
0
.
9
3
0
.
9
2
0
.
9
3
2
7
5
1
0
.
9
5
0
.
8
4
0
.
8
9
2
2
4
2
0
.
9
3
0
.
9
5
0
.
9
4
5
1
5
3
0
.
8
2
0
.
8
2
0
.
8
2
1
5
9
4
0
.
9
6
0
.
9
6
0
.
9
6
5
8
1
5
0
.
7
4
0
.
9
1
0
.
8
2
66
6
0
.
9
5
0
.
9
5
0
.
9
6
1
8
0
A
c
c
u
r
a
c
y
0
.
9
2
2
0
0
0
M
a
c
r
o
a
v
g
0
.
8
9
0
.
9
0
0
.
8
9
2
0
0
0
W
e
i
g
h
t
e
d
a
v
g
0
.
9
3
0
.
9
2
0
.
9
2
2
0
0
0
Evaluation Warning : The document was created with Spire.PDF for Python.
I
n
t J
R
ec
o
n
f
i
g
u
r
ab
le
&
E
m
b
ed
d
ed
Sy
s
t
I
SS
N:
2089
-
4864
Mu
ltimo
d
a
l reco
g
n
itio
n
w
ith
d
ee
p
lea
r
n
in
g
:
a
u
d
io
,
ima
g
e,
a
n
d
text
(
R
a
vi
Gu
mmu
la
)
263
T
ab
le
2
.
Mo
d
el
an
d
ac
cu
r
ac
y
N
o
.
M
o
d
e
l
t
y
p
e
A
c
c
u
r
a
c
y
0
T
e
x
t
0
.
9
6
1
I
mag
e
0
.
9
9
2
A
u
d
i
o
0
.
9
9
9.
CO
NCLU
SI
O
N
W
e
w
a
n
t
to
e
x
ten
s
i
v
el
y
s
t
u
d
y
t
h
e
s
ta
te
-
of
-
th
e
-
ar
t
e
m
o
tio
n
d
etec
tio
n
m
o
d
el
s
an
d
d
e
v
elo
p
a
m
u
lti
-
in
p
u
t
m
o
d
el
ca
p
ab
le
o
f
in
ter
p
r
etin
g
te
x
t,
i
m
ag
e
s
,
an
d
au
d
io
.
T
h
e
p
r
im
ar
y
o
b
j
ec
tiv
e
w
a
s
to
id
en
ti
f
y
a
n
d
ca
teg
o
r
ize
h
u
m
a
n
e
m
o
t
io
n
s
a
cr
o
s
s
s
ev
er
al
m
o
d
alit
ies
u
s
i
n
g
C
NN
f
o
r
v
is
u
al
a
n
d
au
d
ito
r
y
i
n
p
u
t
an
d
L
ST
M
n
et
w
o
r
k
s
w
ith
T
F
-
I
DF
v
ec
to
r
izatio
n
f
o
r
tex
t
u
al
o
u
tp
u
t.
T
h
e
s
u
g
g
e
s
ted
e
m
o
tio
n
r
ec
o
g
n
itio
n
s
y
s
te
m
u
s
es
a
2
D
C
NN
ar
ch
itect
u
r
e
to
h
an
d
le
s
p
ee
ch
d
ata
an
d
in
co
r
p
o
r
ates
s
ev
er
al
f
u
s
io
n
s
tr
ateg
ie
s
,
o
n
e
o
f
w
h
ic
h
is
a
n
o
v
el
C
NN
-
b
ased
f
u
s
io
n
s
tr
ateg
y
.
E
m
o
tio
n
d
etec
tio
n
s
y
s
te
m
s
ar
e
m
ad
e
m
o
r
e
ac
c
u
r
ate
an
d
r
e
s
ili
en
t
b
y
th
is
m
et
h
o
d
,
w
h
ic
h
u
s
e
s
d
if
f
er
e
n
t
M
L
m
o
d
els
f
o
r
ea
c
h
k
i
n
d
o
f
i
n
p
u
t
a
n
d
g
u
ar
an
tees
ca
r
e
f
u
l
d
ata
p
r
ep
ar
atio
n
.
W
h
er
ea
s
L
ST
M
n
et
w
o
r
k
s
w
it
h
T
F
-
I
D
F
v
ec
to
r
izatio
n
w
er
e
b
e
tter
at
class
i
f
y
i
n
g
e
m
o
tio
n
s
in
tex
t,
C
NN
m
o
d
els
w
er
e
b
etter
at
ca
p
tu
r
in
g
th
e
s
p
atia
l
f
ea
t
u
r
es
an
d
p
atter
n
s
o
f
f
ac
ial
ex
p
r
ess
io
n
s
in
i
m
a
g
es
an
d
au
d
io
r
ec
o
r
d
in
g
s
.
T
h
e
p
r
im
ar
y
r
esu
lt
o
f
o
u
r
s
t
u
d
y
is
a
m
u
lti
-
i
n
p
u
t
m
o
d
el
t
h
at
i
m
p
r
o
v
es
e
m
o
tio
n
r
ec
o
g
n
itio
n
ac
cu
r
ac
y
ac
r
o
s
s
d
if
f
er
e
n
t
d
ataset
s
b
y
i
n
telli
g
e
n
tl
y
r
o
u
ti
n
g
in
p
u
ts
to
t
h
e
ap
p
r
o
p
r
iate
s
u
b
-
m
o
d
els
b
ased
o
n
th
eir
m
o
d
alit
y
.
T
h
e
s
in
g
le
m
o
d
el's
ad
ap
tab
ilit
y
a
n
d
s
u
p
p
len
es
s
to
v
ar
io
u
s
i
n
p
u
t
t
y
p
es
p
r
o
v
ed
b
etter
d
esp
ite
s
o
m
e
c
h
alle
n
g
e
s
li
k
e
p
o
ten
tial
d
ela
y
s
ca
u
s
ed
b
y
s
ev
er
al
p
r
o
ce
s
s
in
g
p
ip
eli
n
es.
O
u
r
ap
p
r
o
ac
h
is
v
er
y
co
n
g
r
u
e
n
t
with
t
h
e
ai
m
s
o
f
t
h
e
s
u
g
g
e
s
ted
s
y
s
te
m
,
w
h
ich
is
t
o
co
n
d
u
ct
co
m
p
r
e
h
en
s
iv
e
s
t
u
d
ies
o
n
e
m
o
tio
n
r
ec
o
g
n
i
tio
n
in
te
x
t,
i
m
a
g
e
,
a
n
d
au
d
io
f
o
r
m
at
s
.
I
n
th
e
f
u
t
u
r
e
,
w
e
ai
m
to
ev
al
u
ate
th
e
p
r
o
p
o
s
ed
m
eth
o
d
w
it
h
in
a
n
ed
g
e
-
a
n
d
-
c
lo
u
d
co
m
p
u
tin
g
s
etu
p
,
e
m
p
lo
y
i
n
g
te
x
t
d
ataset
s
,
a
n
d
th
e
e
m
o
tio
n
i
n
t
h
e
w
i
ld
ch
a
llen
g
e
d
atab
ases
.
A
d
d
itio
n
all
y
,
w
e
ar
e
k
ee
n
o
n
ex
p
lo
r
in
g
alter
n
ati
v
e
DL
ar
ch
itectu
r
es
to
ascer
tain
i
f
th
e
y
y
ield
im
p
r
o
v
ed
p
er
f
o
r
m
an
ce
.
T
ak
en
to
g
et
h
er
,
o
u
r
r
esear
ch
p
av
es
t
h
e
w
a
y
f
o
r
f
u
tu
r
e
e
m
o
tio
n
r
ec
o
g
n
itio
n
al
g
o
r
ith
m
s
w
i
th
a
d
ee
p
er
u
n
d
e
r
s
tan
d
in
g
o
f
h
u
m
a
n
e
m
o
tio
n
s
,
w
h
ic
h
i
n
tu
r
n
w
ill al
lo
w
f
o
r
m
o
r
e
ad
v
an
ce
d
u
s
es i
n
af
f
ec
t
iv
e
co
m
p
u
ti
n
g
an
d
HC
I
.
RE
F
E
R
E
NC
E
S
[
1
]
M
.
C
h
e
n
,
Y
.
Z
h
a
n
g
,
M
.
Q
i
u
,
N
.
G
u
i
z
a
n
i
,
a
n
d
Y
.
H
a
o
,
“
S
P
H
A
:
smar
t
p
e
r
so
n
a
l
h
e
a
l
t
h
a
d
v
i
so
r
b
a
se
d
o
n
d
e
e
p
a
n
a
l
y
t
i
c
s,
”
I
EEE
C
o
m
m
u
n
i
c
a
t
i
o
n
s
M
a
g
a
zi
n
e
,
v
o
l
.
5
6
,
n
o
.
3
,
p
p
.
1
6
4
–
1
6
9
,
M
a
r
.
2
0
1
8
,
d
o
i
:
1
0
.
1
1
0
9
/
M
C
O
M
.
2
0
1
8
.
1
7
0
0
2
7
4
.
[
2
]
F
.
D
o
c
t
o
r
,
C
.
K
a
r
y
o
t
i
s,
R
.
I
q
b
a
l
,
a
n
d
A
.
Jame
s,
“
A
n
i
n
t
e
l
l
i
g
e
n
t
f
r
a
me
w
o
r
k
f
o
r
e
mo
t
i
o
n
a
w
a
r
e
e
-
h
e
a
l
t
h
c
a
r
e
s
u
p
p
o
r
t
sy
st
e
ms,”
i
n
2
0
1
6
I
EE
E
S
y
m
p
o
s
i
u
m
S
e
ri
e
s
o
n
C
o
m
p
u
t
a
t
i
o
n
a
l
I
n
t
e
l
l
i
g
e
n
c
e
(
S
S
C
I
)
,
D
e
c
.
2
0
1
6
,
p
p
.
1
–
8
.
d
o
i
:
1
0
.
1
1
0
9
/
S
S
C
I
.
2
0
1
6
.
7
8
5
0
0
4
4
.
[
3
]
K
.
L
i
n
,
F
.
X
i
a
,
W
.
W
a
n
g
,
D
.
T
i
a
n
,
a
n
d
J.
S
o
n
g
,
“
S
y
st
e
m
d
e
si
g
n
f
o
r
b
i
g
d
a
t
a
a
p
p
l
i
c
a
t
i
o
n
i
n
e
mo
t
i
o
n
-
a
w
a
r
e
h
e
a
l
t
h
c
a
r
e
,
”
I
EE
E
Ac
c
e
ss
,
v
o
l
.
4
,
p
p
.
6
9
0
1
–
6
9
0
9
,
2
0
1
6
,
d
o
i
:
1
0
.
1
1
0
9
/
A
C
C
ESS
.
2
0
1
6
.
2
6
1
6
6
4
3
.
[
4
]
X
.
L
i
u
,
L
.
Z
h
a
n
g
,
J.
Y
a
d
e
g
a
r
,
a
n
d
N
.
K
a
mat
,
“
A
r
o
b
u
st
m
u
l
t
i
-
mo
d
a
l
e
mo
t
i
o
n
r
e
c
o
g
n
i
t
i
o
n
f
r
a
me
w
o
r
k
f
o
r
i
n
t
e
l
l
i
g
e
n
t
t
u
t
o
r
i
n
g
sy
st
e
ms,”
i
n
2
0
1
1
I
EEE
1
1
t
h
I
n
t
e
r
n
a
t
i
o
n
a
l
C
o
n
f
e
r
e
n
c
e
o
n
A
d
v
a
n
c
e
d
L
e
a
r
n
i
n
g
T
e
c
h
n
o
l
o
g
i
e
s
,
J
u
l
.
2
0
1
1
,
p
p
.
6
3
–
6
5
.
d
o
i
:
1
0
.
1
1
0
9
/
I
C
A
L
T
.
2
0
1
1
.
2
6
.
[
5
]
R
.
A
.
C
a
l
v
o
a
n
d
S
.
D
’
M
e
l
l
o
,
“
F
r
o
n
t
i
e
r
s
o
f
a
f
f
e
c
t
-
a
w
a
r
e
l
e
a
r
n
i
n
g
t
e
c
h
n
o
l
o
g
i
e
s,”
I
EEE
I
n
t
e
l
l
i
g
e
n
t
S
y
st
e
m
s
,
v
o
l
.
2
7
,
n
o
.
6
,
p
p
.
8
6
–
8
9
,
N
o
v
.
2
0
1
2
,
d
o
i
:
1
0
.
1
1
0
9
/
M
I
S
.
2
0
1
2
.
1
1
0
.
[
6
]
K
.
M
e
e
h
a
n
,
T
.
L
u
n
n
e
y
,
K
.
C
u
r
r
a
n
,
a
n
d
A
.
M
c
C
a
u
g
h
e
y
,
“
C
o
n
t
e
x
t
-
a
w
a
r
e
i
n
t
e
l
l
i
g
e
n
t
r
e
c
o
mm
e
n
d
a
t
i
o
n
sy
st
e
m
f
o
r
t
o
u
r
i
sm,
”
i
n
2
0
1
3
I
EEE
I
n
t
e
r
n
a
t
i
o
n
a
l
C
o
n
f
e
re
n
c
e
o
n
Pe
rva
s
i
v
e
C
o
m
p
u
t
i
n
g
a
n
d
C
o
m
m
u
n
i
c
a
t
i
o
n
s
W
o
rks
h
o
p
s
(
PER
C
O
M
Wo
r
k
s
h
o
p
s)
,
M
a
r
.
2
0
1
3
,
p
p
.
3
2
8
–
3
3
1
.
d
o
i
:
1
0
.
1
1
0
9
/
P
e
r
C
o
mW
.
2
0
1
3
.
6
5
2
9
5
0
8
.
[
7
]
S
.
M
e
n
g
e
t
a
l
.
,
“
P
r
i
v
a
c
y
-
a
w
a
r
e
f
a
c
t
o
r
i
z
a
t
i
o
n
-
b
a
se
d
h
y
b
r
i
d
r
e
c
o
mm
e
n
d
a
t
i
o
n
me
t
h
o
d
f
o
r
h
e
a
l
t
h
c
a
r
e
se
r
v
i
c
e
s,”
I
E
EE
T
r
a
n
sa
c
t
i
o
n
s
o
n
I
n
d
u
st
r
i
a
l
I
n
f
o
rm
a
t
i
c
s
,
v
o
l
.
1
8
,
n
o
.
8
,
p
p
.
5
6
3
7
–
5
6
4
7
,
A
u
g
.
2
0
2
2
,
d
o
i
:
1
0
.
1
1
0
9
/
TI
I
.
2
0
2
2
.
3
1
4
3
1
0
3
.
[
8
]
M
.
H
.
S
h
a
h
b
a
z
,
Z
a
i
n
-
Ul
-
A
b
i
d
i
n
,
K
.
M
a
h
b
o
o
b
,
a
n
d
F
.
A
l
i
,
“
En
h
a
n
c
i
n
g
c
o
n
t
e
x
t
u
a
l
i
z
e
d
G
N
N
s
f
o
r
mu
l
t
i
mo
d
a
l
e
mo
t
i
o
n
r
e
c
o
g
n
i
t
i
o
n
:
i
mp
r
o
v
i
n
g
a
c
c
u
r
a
c
y
a
n
d
r
o
b
u
st
n
e
ss,”
i
n
2
0
2
3
7
t
h
I
n
t
e
r
n
a
t
i
o
n
a
l
M
u
l
t
i
-
T
o
p
i
c
I
C
T
C
o
n
f
e
re
n
c
e
(
I
MTI
C
)
,
M
a
y
2
0
2
3
,
p
p
.
1
–
7
.
d
o
i
:
1
0
.
1
1
0
9
/
I
M
T
I
C
5
8
8
8
7
.
2
0
2
3
.
1
0
1
7
8
4
8
1
.
[
9
]
Y
.
L
i
,
“
R
e
se
a
r
c
h
d
i
r
e
c
t
i
o
n
o
f
smar
t
h
o
me
r
e
a
l
-
t
i
me
mo
n
i
t
o
r
i
n
g
,
”
i
n
2
0
2
0
I
n
t
e
rn
a
t
i
o
n
a
l
C
o
n
f
e
re
n
c
e
o
n
C
o
m
p
u
t
e
r
En
g
i
n
e
e
ri
n
g
a
n
d
I
n
t
e
l
l
i
g
e
n
t
C
o
n
t
ro
l
(
I
C
C
EI
C
)
,
N
o
v
.
2
0
2
0
,
p
p
.
2
2
0
–
2
3
2
.
d
o
i
:
1
0
.
1
1
0
9
/
I
C
C
EI
C
5
1
5
8
4
.
2
0
2
0
.
0
0
0
5
1
.
[
1
0
]
Y
.
J.
L
i
u
,
M
.
Y
u
,
G
.
Z
h
a
o
,
J.
S
o
n
g
,
Y
.
G
e
,
a
n
d
Y
.
S
h
i
,
“
R
e
a
l
-
t
i
me
mo
v
i
e
-
i
n
d
u
c
e
d
d
i
scre
t
e
e
mo
t
i
o
n
r
e
c
o
g
n
i
t
i
o
n
f
r
o
m
E
EG
si
g
n
a
l
s,
”
I
EEE
T
ra
n
s
a
c
t
i
o
n
s
o
n
Af
f
e
c
t
i
v
e
C
o
m
p
u
t
i
n
g
,
v
o
l
.
9
,
n
o
.
4
,
p
p
.
5
5
0
–
5
6
2
,
2
0
1
8
,
d
o
i
:
1
0
.
1
1
0
9
/
T
A
F
F
C
.
2
0
1
7
.
2
6
6
0
4
8
5
.
[
1
1
]
J.
T
e
o
a
n
d
J.
T
.
C
h
i
a
,
“
D
e
e
p
n
e
u
r
a
l
c
l
a
ss
i
f
i
e
r
s
f
o
r
EEG
-
b
a
se
d
e
mo
t
i
o
n
r
e
c
o
g
n
i
t
i
o
n
i
n
i
mm
e
r
si
v
e
e
n
v
i
r
o
n
me
n
t
s,”
i
n
2
0
1
8
I
n
t
e
r
n
a
t
i
o
n
a
l
C
o
n
f
e
re
n
c
e
o
n
S
m
a
rt
C
o
m
p
u
t
i
n
g
a
n
d
El
e
c
t
r
o
n
i
c
En
t
e
r
p
ri
s
e
(
I
C
S
C
EE)
,
J
u
l
.
2
0
1
8
,
p
p
.
1
–
6
.
d
o
i
:
1
0
.
1
1
0
9
/
I
C
S
C
EE.
2
0
1
8
.
8
5
3
8
3
8
2
.
[
1
2
]
X
.
L
i
,
X
.
Z
h
a
n
g
,
H
.
Y
a
n
g
,
W
.
D
u
a
n
,
W
.
D
a
i
,
a
n
d
L
.
Y
i
n
,
“
A
n
EEG
-
b
a
sed
m
u
l
t
i
-
mo
d
a
l
e
mo
t
i
o
n
d
a
t
a
b
a
se
w
i
t
h
b
o
t
h
p
o
se
d
a
n
d
a
u
t
h
e
n
t
i
c
f
a
c
i
a
l
a
c
t
i
o
n
s
f
o
r
e
mo
t
i
o
n
a
n
a
l
y
si
s,”
i
n
2
0
2
0
1
5
t
h
I
EEE
I
n
t
e
r
n
a
t
i
o
n
a
l
C
o
n
f
e
re
n
c
e
o
n
A
u
t
o
m
a
t
i
c
F
a
c
e
a
n
d
G
e
s
t
u
r
e
Re
c
o
g
n
i
t
i
o
n
(
FG
2
0
2
0
)
,
N
o
v
.
2
0
2
0
,
p
p
.
3
3
6
–
3
4
3
.
d
o
i
:
1
0
.
1
1
0
9
/
F
G
4
7
8
8
0
.
2
0
2
0
.
0
0
0
5
0
.
[
1
3
]
P
.
L
o
p
e
z
-
O
t
e
r
o
,
L
.
D
a
c
i
a
-
F
e
r
n
a
n
d
e
z
,
a
n
d
C
.
G
a
r
c
i
a
-
M
a
t
e
o
,
“
A
st
u
d
y
o
f
a
c
o
u
st
i
c
f
e
a
t
u
r
e
s
f
o
r
d
e
p
r
e
ssi
o
n
d
e
t
e
c
t
i
o
n
,
”
i
n
2nd
I
n
t
e
r
n
a
t
i
o
n
a
l
W
o
rks
h
o
p
o
n
B
i
o
m
e
t
r
i
c
s a
n
d
F
o
re
n
si
c
s
,
M
a
r
.
2
0
1
4
,
p
p
.
1
–
6
.
d
o
i
:
1
0
.
1
1
0
9
/
I
W
B
F
.
2
0
1
4
.
6
9
1
4
2
4
5
.
[
1
4
]
S
.
G
a
o
,
Y
.
Z
h
o
n
g
,
a
n
d
W
.
L
i
,
“
R
a
n
d
o
m
w
e
i
g
h
t
i
n
g
me
t
h
o
d
f
o
r
m
u
l
t
i
se
n
so
r
d
a
t
a
f
u
s
i
o
n
,
”
I
EEE
S
e
n
so
r
s
J
o
u
r
n
a
l
,
v
o
l
.
1
1
,
n
o
.
9
,
p
p
.
1
9
5
5
–
1
9
6
1
,
S
e
p
.
2
0
1
1
,
d
o
i
:
1
0
.
1
1
0
9
/
J
S
EN
.
2
0
1
1
.
2
1
0
7
8
9
6
.
[
1
5
]
K
.
M
.
K
u
d
i
r
i
,
A
.
M
d
S
a
i
d
,
a
n
d
M
.
Y
.
N
a
y
a
n
,
“
Emo
t
i
o
n
d
e
t
e
c
t
i
o
n
u
s
i
n
g
su
b
-
i
m
a
g
e
b
a
se
d
f
e
a
t
u
r
e
s
t
h
r
o
u
g
h
h
u
m
a
n
f
a
c
i
a
l
e
x
p
r
e
ssi
o
n
s,”
i
n
2
0
1
2
I
n
t
e
r
n
a
t
i
o
n
a
l
C
o
n
f
e
r
e
n
c
e
o
n
C
o
m
p
u
t
e
r
&
I
n
f
o
rm
a
t
i
o
n
S
c
i
e
n
c
e
(
I
C
C
I
S
)
,
Ju
n
.
2
0
1
2
,
v
o
l
.
1
,
p
p
.
3
3
2
–
3
3
5
.
d
o
i
:
1
0
.
1
1
0
9
/
I
C
C
I
S
c
i
.
2
0
1
2
.
6
2
9
7
2
6
4
.
[
1
6
]
X
.
W
a
n
g
,
X
.
C
h
e
n
,
a
n
d
C
.
C
a
o
,
“
H
u
man
e
mo
t
i
o
n
r
e
c
o
g
n
i
t
i
o
n
b
y
o
p
t
i
mal
l
y
f
u
si
n
g
f
a
c
i
a
l
e
x
p
r
e
ssi
o
n
a
n
d
s
p
e
e
c
h
f
e
a
t
u
r
e
,
”
S
i
g
n
a
l
Evaluation Warning : The document was created with Spire.PDF for Python.