T
E
L
KO
M
NIK
A
, V
ol
.
17
,
No.
5,
O
c
tob
er
20
1
9,
p
p.
2
65
9
~
2666
IS
S
N: 1
69
3
-
6
93
0
,
accr
ed
ited
F
irst
Gr
ad
e b
y K
em
en
r
istekdikti,
Decr
ee
No: 2
1/E/
K
P
T
/20
18
DOI:
10.12928/TE
LK
OM
N
IK
A
.v
1
7
i
5
.
11276
â—¼
26
59
Rec
ei
v
ed
S
ep
te
mb
er 23
,
2
01
8
;
Rev
i
s
ed
M
arc
h
18
,
20
1
9
;
A
c
c
ep
ted
A
pril
22
,
20
1
9
A
d
v
e
rti
seme
nt
billb
o
ard d
etec
t
ion
a
nd
geo
tag
gin
g
s
y
s
te
m
w
ith
ind
uct
i
v
e
trans
fer l
earnin
g
in
dee
p co
n
v
o
lu
tio
n
al ne
ural ne
t
w
o
rk
Ro
mi F
adillah
Rahm
at
*
1
,
Denn
is
2
,
O
p
im
S
a
lim
S
it
o
mp
u
l
3
,
S
ar
ah P
u
r
n
amaw
ati
4
, Rah
mat
Bu
d
iar
t
o
5
1
,2
,3
,4
Dep
a
rtm
e
n
t
o
f
In
fo
rm
a
ti
o
n
T
e
c
h
n
o
l
o
g
y
,
Uni
v
e
r
s
i
t
a
s
Su
m
a
te
r
a
Uta
ra
,
Pa
d
a
n
g
Bu
l
a
n
,
2
0
1
5
5
,
M
e
d
a
n
,
I
n
d
o
n
e
s
i
a
5
Col
l
e
g
e
o
f
Co
m
p
u
te
r S
c
i
e
n
c
e
a
n
d
I
n
fo
r
m
a
ti
o
n
T
e
c
h
n
o
l
o
g
y
,
Al
b
a
h
a
Un
i
v
e
rs
i
ty
,
Al
b
a
h
a
,
Ki
n
g
d
o
m
o
f
Sa
u
d
i
Ara
b
i
a
*
Corre
s
p
o
n
d
i
n
g
a
u
th
o
r,
e
-
m
a
i
l
:
ro
m
i
.
fa
d
i
l
l
a
h
@us
u
.a
c
.i
d
Ab
strac
t
In
th
i
s
p
a
p
e
r,
we
p
r
o
p
o
s
e
a
n
a
p
p
ro
a
c
h
t
o
d
e
t
e
c
t
a
n
d
g
e
o
ta
g
a
d
v
e
rti
s
e
m
e
n
t
b
i
l
l
b
o
a
r
d
i
n
r
e
a
l
-
ti
m
e
c
o
n
d
i
ti
o
n
.
O
u
r
a
p
p
ro
a
c
h
i
s
u
s
i
n
g
Al
e
x
Ne
t’
s
Dee
p
Co
n
v
o
l
u
t
i
o
n
a
l
N
e
u
ra
l
Net
w
o
rk
(DC
NN
)
a
s
a
p
r
e
-
tr
a
i
n
e
d
n
e
u
ra
l
n
e
two
r
k
wit
h
1
0
0
0
c
a
te
g
o
ri
e
s
fo
r
i
m
a
g
e
c
l
a
s
s
i
fi
c
a
t
i
o
n
.
T
o
i
m
p
ro
v
e
t
h
e
p
e
rfo
rm
a
n
c
e
o
f
th
e
p
r
e
-
tra
i
n
e
d
n
e
u
r
a
l
n
e
two
r
k
,
we
re
tra
i
n
th
e
n
e
two
rk
b
y
a
d
d
i
n
g
m
o
re
a
d
v
e
rti
s
e
m
e
n
t
b
i
l
l
b
o
a
rd
i
m
a
g
e
s
u
s
i
n
g
i
n
d
u
c
ti
v
e
tra
n
s
f
e
r
l
e
a
r
n
i
n
g
a
p
p
ro
a
c
h
.
Th
e
n
,
we
f
i
n
e
-
tu
n
e
d
th
e
o
u
t
p
u
t
l
a
y
e
r
i
n
t
o
a
d
v
e
rti
s
e
m
e
n
t
b
i
l
l
b
o
a
rd
re
l
a
te
d
c
a
te
g
o
ri
e
s
.
F
u
rth
e
rm
o
re
,
th
e
d
e
te
c
te
d
a
d
v
e
rti
s
e
m
e
n
t
b
i
l
l
b
o
a
rd
i
m
a
g
e
s
w
i
l
l
b
e
g
e
o
ta
g
g
e
d
b
y
i
n
s
e
rti
n
g
Ex
i
f
m
e
t
a
d
a
t
a
i
n
to
th
e
i
m
a
g
e
fi
l
e
.
Ex
p
e
ri
m
e
n
t
a
l
re
s
u
l
ts
s
h
o
w
th
a
t
th
e
a
p
p
r
o
a
c
h
a
c
h
i
e
v
e
s
9
2
.7
%
tra
i
n
i
n
g
a
c
c
u
ra
c
y
fo
r
a
d
v
e
rt
i
s
e
m
e
n
t
b
i
l
l
b
o
a
rd
d
e
te
c
ti
o
n
,
whi
l
e
fo
r
o
v
e
ra
l
l
te
s
ti
n
g
re
s
u
l
t
s
i
t
w
i
l
l
g
i
v
e
71.
8
6
%
t
e
s
ti
n
g
a
c
c
u
ra
c
y
.
Key
w
ords
:
a
d
v
e
rt
i
s
e
m
e
n
t
b
i
l
l
b
o
a
rd
d
e
t
e
c
t
i
o
n
,
a
d
v
e
rti
s
e
m
e
n
t
b
i
l
l
b
o
a
rd
g
e
o
t
a
g
g
i
n
g
,
d
e
e
p
c
o
n
v
o
l
u
t
i
o
n
a
l
n
e
u
ra
l
n
e
tw
o
rk
,
i
m
a
g
e
c
l
a
s
s
i
fi
c
a
ti
o
n
,
tra
n
s
fe
r
l
e
a
r
n
i
n
g
Copy
righ
t
©
2
0
1
9
Uni
v
e
rsi
t
a
s
Ahm
a
d
D
a
hl
a
n.
All
rig
ht
s
r
e
s
e
rve
d
.
1.
Int
r
o
d
u
ctio
n
A
d
v
erti
s
em
en
t
b
i
l
l
bo
ard
i
s
an
ef
f
ec
ti
v
e
c
om
m
erc
i
al
m
ed
i
a
f
or
ad
v
erti
s
i
ng
i
nf
orm
ati
on
ab
ou
t
produc
ts
or
s
erv
i
c
es
.
Cur
r
en
tl
y
,
ad
v
ert
i
s
em
en
t
bi
l
l
b
oa
r
d
d
ata
m
an
ag
em
en
t
ha
s
be
en
d
on
e
us
i
ng
c
on
v
en
t
i
o
na
l
a
pp
r
oa
c
h,
e.g
.
b
y
c
a
ptu
r
i
ng
ad
v
erti
s
em
en
t
bi
l
l
bo
ard
us
i
ng
c
am
era
an
d
w
r
i
ti
n
g
t
he
l
oc
ati
on
de
t
ai
l
s
i
n
n
ote
s
.
T
hi
s
ap
pro
ac
h
i
s
v
er
y
l
ab
or
-
i
nte
ns
i
v
e
an
d
t
i
m
e
-
c
on
s
u
m
i
ng
.
Henc
e,
a
f
as
ter
ap
proac
h
i
s
ne
ed
e
d
to
ex
tr
ac
t
i
nf
orm
ati
on
i
n
ad
v
ert
i
s
em
en
t
bi
l
l
b
oa
r
d
an
d
the
g
eo
gr
ap
h
i
c
l
oc
a
ti
o
n o
f
t
he
o
bj
ec
t to
i
m
prov
e t
he
da
ta
ac
qu
i
s
i
t
i
on
.
T
he
ad
v
ert
i
s
em
en
t
bi
l
l
bo
a
r
d
de
tec
t
i
on
probl
em
ha
s
be
en
ap
pro
ac
he
d
wi
t
h
m
an
y
di
f
f
erent
m
eth
od
s
i
n
r
ec
e
n
t
y
e
ars
,
m
ai
nl
y
f
or
d
ete
c
t
i
ng
a
dv
erti
s
em
en
t
bi
l
l
bo
ard
i
n
s
p
ort
T
V
.
Me
d
i
on
i
et
a
l
.
[1]
us
e
i
nte
r
es
t
po
i
nt
op
era
tor,
c
o
l
or
-
ba
s
ed
po
i
nt
f
i
l
ter,
po
i
nt
m
atc
he
r
,
pr
ec
i
s
e
l
oc
k
-
i
n
us
i
ng
S
um
o
f
S
qu
ared
Di
f
f
erenc
es
(
S
S
D)
,
a
nd
pred
i
c
tor
us
i
ng
Me
as
ur
e
of
B
el
i
ef
to
de
tec
t
a
nd
s
u
bs
ti
tu
te
b
i
l
l
b
oa
r
d
i
n
bro
ad
c
as
t
v
i
d
eo
.
T
he
r
es
ul
t
s
ho
w
s
g
oo
d
p
erf
or
m
an
c
e
i
n
de
tec
t
i
ng
ad
v
ert
i
s
em
en
t
bi
l
l
bo
ard.
C
ai
et
a
l
.
[
2]
d
ete
c
t
ad
v
erti
s
em
en
t
b
i
l
l
bo
a
r
d
i
m
ag
es
i
n
s
po
r
t
T
V
us
i
ng
F
as
t
Ho
ug
h
T
r
an
s
f
or
m
f
or
l
i
ne
de
t
ec
ti
on
an
d
h
i
s
tog
r
am
-
ba
s
ed
an
al
y
s
i
s
f
or
s
eg
m
en
tat
i
on
.
T
he
r
es
ul
t
s
ho
w
s
t
ha
t
th
e
ap
proac
h
ac
hi
e
v
es
9
0%
ac
c
urac
y
i
n
de
t
ec
ti
n
g
ad
v
erti
s
em
en
t
bi
l
l
b
oa
r
d.
A
no
t
he
r
ap
proac
h
b
y
A
l
de
r
s
ho
f
f
&
G
ev
ers
[3]
us
ed
hi
s
to
gram
ba
c
k
-
proj
ec
ti
on
to
de
tec
t
a
dv
ert
i
s
em
en
t
bi
l
l
b
oa
r
d
i
n
s
oc
c
er
broadc
as
t
v
i
d
eo
.
T
he
r
es
ul
t
s
h
o
w
s
go
od
p
erf
or
m
an
c
e
i
n
de
t
ec
ti
ng
a
dv
erti
s
em
en
t
bi
l
l
b
oa
r
d.
Ic
hi
m
ura
[4]
de
tec
t
ad
v
ert
i
s
em
en
t
bi
l
l
b
oa
r
d
i
n
m
oto
r
s
p
orts
v
i
de
o
us
i
n
g
H
es
s
i
an
-
La
pl
ac
e
de
tec
tor
an
d
G
r
a
di
e
nt
Lo
c
ati
on
-
O
r
i
e
nta
t
i
o
n
H
i
s
to
gram
(
G
LO
H)
de
s
c
r
i
pto
r
.
I
n
a
dd
i
ti
on
,
RA
nd
om
S
A
m
pl
e
Co
ns
en
s
us
(
RA
NS
A
C)
al
go
r
i
t
hm
ba
s
ed
on
ho
m
og
r
ap
h
y
i
s
us
ed
t
o
r
ec
o
gn
i
z
e
m
ul
ti
p
l
e
ad
v
ert
i
s
em
en
t
bi
l
l
b
oa
r
ds
.
W
atv
e
&
S
ural
[5]
de
tec
t
ad
v
ert
i
s
em
en
t
bi
l
l
b
oa
r
d
i
n
s
oc
c
er
v
i
de
o
us
i
ng
hu
e
s
l
i
c
i
ng
an
d
H
ou
g
h
T
r
an
s
f
or
m
.
T
he
r
es
ul
t
s
ho
w
s
tha
t
the
ap
proac
h
ac
h
i
e
v
es
9
0%
ac
c
ura
c
y
i
n
de
t
ec
ti
n
g
ad
v
erti
s
em
en
t
b
i
l
l
bo
ard.
O
r
gi
nc
[6]
us
es
ho
m
og
r
ap
h
y
es
t
i
m
ati
on
us
i
n
g
Di
r
ec
t
L
i
n
ea
r
T
r
an
s
f
or
m
ati
on
(
DLT
)
,
RA
n
do
m
S
A
m
pl
e
Cons
en
s
us
(
RA
N
S
A
C)
,
an
d
Ma
x
i
m
al
l
y
S
tab
l
e
E
x
tr
em
al
Evaluation Warning : The document was created with Spire.PDF for Python.
â—¼
IS
S
N: 16
93
-
6
93
0
T
E
L
KO
M
NIK
A
V
ol
.
17
,
No
.
5,
O
c
tob
er 20
19
:
26
5
9
-
26
66
2660
Regi
on
(
MS
E
R)
to
de
t
ec
t
ad
v
erti
s
em
en
t
b
i
l
l
b
oa
r
d
i
n
broadc
as
t
v
i
de
o.
T
he
r
es
u
l
t
s
h
o
w
s
th
at
the
ap
pro
ac
h
ac
hi
e
v
es
hi
gh
ac
c
urac
y
.
O
r
de
l
m
an
[
7]
d
ete
c
ts
a
dv
erti
s
em
en
t
bi
l
l
b
oa
r
d
us
i
n
g
tem
pl
ate
m
atc
hi
ng
wi
th
F
as
t
F
ou
r
i
er
T
r
an
s
f
or
m
,
c
ol
or
m
atc
hi
ng
wi
th
E
uc
l
i
de
an
d
i
s
ta
nc
e
c
al
c
ul
a
ti
o
n
i
n
no
r
m
al
i
z
ed
H
S
L
(
NH
S
L)
c
ol
or
s
pa
c
es
,
a
nd
ne
i
g
hb
or
v
ot
i
ng
.
T
he
r
es
ul
t
s
ho
w
s
36
%
ac
c
urac
y
i
n d
e
tec
ti
ng
a
dv
er
ti
s
em
en
t b
i
l
l
b
oa
r
ds
.
O
c
c
l
us
i
on
an
d
en
v
i
r
on
m
en
t
c
om
pl
ex
i
t
y
ha
v
e
be
en
the
di
f
f
i
c
ul
ti
es
i
n
de
tec
ti
n
g
ad
v
erti
s
em
en
t
b
i
l
l
b
oa
r
d
i
n
prev
i
ou
s
w
ork
s
.
E
dg
e
an
d
c
ol
or
de
tec
ti
on
tec
hn
i
q
ue
s
c
an
on
l
y
be
us
ed
i
n
a
dv
erti
s
em
en
t
bi
l
l
bo
ard
de
t
ec
ti
o
n
un
l
es
s
th
e
en
v
i
r
on
m
en
t
i
s
no
t
c
om
pl
ex
,
as
s
um
i
ng
the
ba
c
k
ground
i
s
p
l
a
i
n,
an
d
th
e
ob
j
ec
t
i
s
no
t
oc
c
l
ud
ed
.
F
urth
erm
ore,
th
e
prev
i
ou
s
w
ork
s
de
pe
nd
on
ed
ge
i
n
d
ete
c
t
i
ng
t
he
s
ha
p
e
of
t
he
ad
v
ert
i
s
e
m
en
t
b
i
l
l
bo
ard.
W
he
n
on
e
of
th
e
ed
g
es
i
s
c
ov
ered
w
i
th
oc
c
l
us
i
o
ns
,
the
d
ete
c
ti
on
w
i
l
l
f
ai
l
to
d
ete
c
t
ad
v
erti
s
em
en
t
b
i
l
l
b
oa
r
d.
In
ad
di
t
i
o
n,
c
ol
or
de
tec
t
i
on
a
pp
r
oa
c
h
wor
k
s
i
f
the
ad
v
ert
i
s
e
m
en
t
b
i
l
l
bo
ard
ha
s
s
p
ec
i
f
i
c
c
o
l
or
an
d
ha
s
a
c
on
tr
as
t
c
ol
or
to
t
he
ba
c
k
groun
d.
T
o
ov
erc
om
e
thi
s
prob
l
em
,
a
s
up
erv
i
s
ed
m
ac
hi
n
e
l
ea
r
n
i
ng
ap
pro
ac
h
i
s
ne
ed
ed
to
de
t
ec
t
ad
v
ert
i
s
em
en
t
b
i
l
l
bo
ard
i
n
m
ore
c
om
pl
ex
en
v
i
r
o
nm
en
t,
e.g
.
r
o
ad
s
wi
th
m
an
y
ob
s
tac
l
es
s
uc
h a
s
t
r
ee
, v
eh
i
c
l
e,
c
a
bl
e,
a
nd
p
ol
e.
Rec
en
t
l
y
,
the
f
i
e
l
d
of
m
ac
h
i
ne
l
ea
r
ni
n
g
ha
s
m
ad
e
tr
e
m
en
do
us
progr
es
s
on
ad
dr
es
s
i
ng
c
l
as
s
i
f
i
c
ati
on
wi
th
c
om
pl
ex
ob
j
ec
ts
.
Res
ea
r
c
he
r
s
ha
v
e
f
ou
nd
t
ha
t
us
i
ng
a
pre
-
t
r
ai
ne
d
ne
ura
l
ne
t
w
ork
m
od
el
wi
t
h
l
arg
e
l
ea
r
n
i
ng
c
ap
ac
i
t
y
,
e.
g.
Q
uo
c
Net,
A
l
ex
N
et,
an
d
G
o
og
l
eNet
c
ou
l
d
i
m
prov
e
i
m
ag
e
c
l
as
s
i
f
i
c
ati
on
ac
c
urac
y
.
In
a
dd
i
ti
o
n,
a
Deep
Co
nv
ol
u
ti
o
na
l
N
eu
r
al
N
et
w
or
k
(
DCNN
)
ha
s
b
ee
n
pro
v
en
t
o s
ol
v
e
i
m
ag
e c
l
as
s
i
f
i
c
ati
o
n
on
h
ard
v
i
s
u
al
r
ec
o
gn
i
ti
on
t
as
k
s
[8
].
F
or
ad
v
ert
i
s
em
en
t
b
i
l
l
bo
ard
ac
qu
i
s
i
t
i
on
,
g
eo
t
ag
g
i
n
g
pl
a
y
s
a
n
i
m
po
r
tan
t
r
o
l
e
i
n
ob
t
ai
n
i
ng
the
ge
o
grap
hi
c
a
l
l
oc
at
i
on
of
the
d
ete
c
te
d
a
dv
erti
s
e
m
en
t
b
i
l
l
bo
ard.
S
e
v
er
al
ap
proac
he
s
f
or
ge
ota
g
gi
ng
o
bj
ec
t
us
i
ng
s
m
arphon
es
ha
s
b
ee
n
do
ne
.
Ma
c
i
as
et
a
l
.
[
9
]
ad
ds
g
eo
t
ag
i
nf
orm
ati
on
i
n
v
i
de
o
us
i
n
g
an
gu
l
ar
v
a
l
u
es
f
r
o
m
s
m
artpho
ne
G
P
S
,
3G
ne
t
wo
r
k
s
,
an
d
W
i
F
i
.
T
he
r
es
ul
t s
ho
w
s
the
ge
ota
gg
i
ng
ac
hi
e
v
es
hi
gh
ac
c
urac
y
an
d c
on
s
um
es
a
l
i
tt
l
e
ba
nd
w
i
dth
.
S
ah
u
and
Ch
ak
r
ab
ort
y
[1
0]
ad
d
ge
ota
g
i
nf
orm
ati
on
b
y
i
n
s
erti
ng
E
x
c
ha
ng
ea
b
l
e
i
m
a
ge
f
i
l
e
(
E
x
i
f
)
m
eta
da
ta
i
nt
o
the
i
m
ag
e.
T
he
r
es
ul
t
s
ho
w
s
tha
t
t
he
ge
ota
g
gi
ng
ac
h
i
e
v
es
up
to
3
0
-
m
ete
r
ac
c
urac
y
f
r
om
the
m
ap
s
.
In
ad
d
i
ti
on
t
o
ov
erc
om
e
the
ge
ot
ag
g
i
n
g
prob
l
em
,
Rahm
at
et
al
[11
]
i
m
prov
e
th
e
g
eo
t
ag
g
i
n
g
a
c
c
urac
y
b
y
us
i
ng
pe
r
s
pe
c
ti
v
e
pr
oj
ec
ti
on
.
O
v
eral
l
,
th
e
ge
ota
gg
i
ng
proc
es
s
de
pe
nd
s
o
n n
e
t
w
o
r
k
c
on
ne
c
ti
o
n.
W
e
ha
v
e
r
e
v
i
e
w
ed
s
e
v
era
l
r
el
ate
d
wor
k
s
tha
t
us
e
De
ep
C
on
v
o
l
ut
i
on
al
Ne
ural
N
et
w
ork
(
DCNN
)
f
or
l
arge
-
s
c
al
e
i
m
ag
e
c
l
as
s
i
f
i
c
ati
on
.
L
i
n
&
Che
n
[1
2]
de
tec
t
pe
d
es
tr
i
an
s
us
i
ng
G
oo
gl
eNet
T
w
o
P
ara
l
l
el
D
CNN.
T
he
r
es
u
l
ts
s
ho
w
19
.57
%
r
e
gres
s
i
on
i
n
pe
de
s
t
r
i
an
de
tec
t
i
on
.
Z
ha
ng
e
t
al
.
[
13
]
c
l
as
s
i
f
y
m
a
k
ers
an
d
m
od
el
s
of
c
ars
i
m
ag
e
us
i
ng
pre
-
tr
ai
n
ed
DCNN
wi
th
tr
an
s
f
er
l
ea
r
n
i
n
g.
T
he
r
es
ul
ts
s
ho
w
79
%
ac
c
urac
y
i
n
c
l
as
s
i
f
y
i
ng
c
ars
.
Y
an
ai
&
K
a
wano
[1
4]
us
e
DCNN
f
or
f
oo
d
i
m
ag
e
c
l
a
s
s
i
f
i
c
ati
on
.
T
he
r
es
u
l
ts
s
h
o
w
78
.77
%
ac
c
urac
y
f
or
T
op
-
1
pre
di
c
t
i
on
us
i
ng
UE
C
-
F
O
O
D100
tes
ti
ng
da
tas
et
an
d
67
.57
%
ac
c
urac
y
f
or
T
op
-
1
pre
di
c
ti
on
us
i
ng
UE
C
-
F
O
O
D25
6
tes
t
i
ng
da
tas
et.
Y
an
et
al
.
[1
5]
c
l
a
s
s
i
f
y
o
bj
ec
ts
i
nt
o
1
00
0
c
ate
g
orie
s
f
r
om
ILS
V
RC
2
01
2
da
tas
e
t
us
i
n
g
Hi
erar
c
h
i
c
al
D
CNN
(
H
D
-
CNN)
.
T
he
r
es
ul
ts
s
ho
w
36
.66
%
err
or
-
r
ate
f
or
T
op
-
1
predi
c
t
i
on
a
nd
1
5.8
0%
f
or
T
op
-
5
pre
di
c
ti
on
.
P
as
qu
a
l
e
et
a
l
.
[
16
]
i
de
n
t
i
f
y
5
0
o
bj
ec
ts
f
r
o
m
i
Cub
W
orld
da
tas
e
t
us
i
ng
DCNN
.
T
he
r
es
ul
ts
s
ho
w
8
6%
f
or
i
d
en
t
i
f
y
i
n
g
50
ob
j
ec
ts
.
J
un
g
et
al
.
[1
7]
r
ec
o
gn
i
z
e
t
r
aff
i
c
s
i
gn
s
us
i
n
g
L
e
Ne
t
-
5
CNN.
T
he
r
es
ul
ts
s
ho
w
t
ha
t
the
m
eth
od
s
c
an
c
l
as
s
i
f
y
16
s
tr
e
et
s
i
gn
s
.
O
u
y
an
g
et
al
.
[18
]
r
ec
o
gn
i
z
e
c
om
m
on
ob
j
ec
ts
us
i
ng
Def
orm
ab
l
e
Deep
C
on
v
o
l
ut
i
on
al
N
eu
r
al
Ne
t
w
ork
s
(
Deep
ID
-
Net
)
.
T
he
c
l
as
s
i
f
i
c
ati
on
r
es
u
l
ts
i
n
50
.3
%
ac
c
urac
y
.
L
i
et
al
.
[19
]
us
e
G
oo
gl
e
Net
Inc
ep
ti
o
n
wi
t
h
22
c
on
v
o
l
ut
i
on
al
l
a
y
ers
f
or
c
l
as
s
i
f
y
i
ng
10
00
ob
j
ec
ts
.
T
he
c
l
as
s
i
fi
c
ati
on
r
es
ul
ts
s
ho
w
89
.4
5%
f
or
T
op
-
1
predi
c
ti
on
.
Ma
r
ti
ns
o
n
&
Y
al
l
a
[20
]
us
e
K
r
i
z
h
ev
s
k
y
’
s
DCNN
wi
th
5
c
on
v
o
l
ut
i
o
na
l
l
a
y
ers
,
3
po
ol
i
ng
l
a
y
er
s
,
an
d
3
f
ul
l
y
-
c
on
ne
c
te
d
l
a
y
ers
f
or
c
l
as
s
i
f
y
i
ng
10
00
ob
j
ec
ts
.
T
he
r
es
ul
ts
s
ho
w
90
.1
%
un
d
er
s
tr
uc
tured
l
i
gh
t
s
en
s
or
i
n
o
pe
n
l
ab
s
pa
c
e,
86
.
7%
un
d
er
s
tr
uc
tured
l
i
gh
t
s
e
ns
or
i
n
ho
m
e
en
v
i
r
o
nm
en
t,
80
.4
%
un
de
r
s
t
ereo
c
am
era
i
n
a
n
of
f
i
c
e
en
v
i
r
on
m
en
t,
a
nd
73
.9%
un
de
r
t
i
m
e
-
of
-
f
l
i
gh
t
c
am
era
i
n
a
ho
m
e e
nv
i
r
on
m
en
t.
In
th
i
s
pa
p
er,
w
e
prop
os
e
a
m
eth
od
to
de
tec
t
ad
v
ert
i
s
e
m
en
t
bi
l
l
bo
ard
b
y
us
i
ng
Deep
Con
v
ol
uti
on
a
l
N
eu
r
a
l
Net
wor
k
(
DCNN
)
.
F
i
r
s
t,
a
pre
-
tr
ai
ne
d
ne
ural
ne
t
wor
k
arc
hi
tec
t
ure
f
r
o
m
A
l
ex
N
et
i
s
us
ed
f
or
i
m
ag
e
c
l
as
s
i
f
i
c
ati
on
.
T
o
i
m
prov
e
t
he
a
dv
erti
s
em
en
t
bi
l
l
b
oa
r
d
d
ete
c
ti
on
pe
r
f
or
m
an
c
e,
we
r
etra
i
n
the
ne
t
wor
k
us
i
ng
tr
a
ns
f
er
l
ea
r
ni
ng
ap
pr
oa
c
h.
S
e
v
era
l
o
the
r
i
nf
orm
ati
on
s
s
uc
h
as
b
i
l
l
b
o
ard c
at
eg
or
i
es
an
d
n
am
es
al
s
o
prop
ag
a
ted
to
t
he
s
y
s
t
em
. In
ad
di
t
i
o
n,
f
or
the
ge
ota
g
gi
ng
proc
es
s
,
an
E
x
i
f
m
eta
da
ta
i
ns
erti
on
i
s
us
ed
to
s
t
ore
g
eo
gra
ph
i
c
al
l
oc
ati
on
of
the
d
ete
c
te
d a
dv
erti
s
em
en
t b
i
l
l
b
oa
r
d.
Evaluation Warning : The document was created with Spire.PDF for Python.
T
E
L
KO
M
NIK
A
IS
S
N: 1
69
3
-
6
93
0
â—¼
A
dv
erti
s
e
me
nt
b
i
l
l
bo
ard d
et
ec
ti
on
an
d g
e
ota
gg
i
ng
s
y
s
t
em
... (
R
om
i
Fad
i
l
l
a
h Ra
hm
at
)
2661
2.
M
eth
o
d
o
log
y
In
thi
s
r
es
ea
r
c
h,
th
e
m
eth
od
f
or
de
tec
ti
ng
an
d
d
o
ge
ot
ag
g
i
ng
ac
t
i
on
s
f
or
bi
l
l
b
oa
r
d
i
m
ag
e
b
y
us
i
ng
s
m
artpho
ne
c
an
be
de
s
c
r
i
b
ed
i
n
s
ev
er
al
p
ha
s
es
.
T
he
ph
as
es
c
an
b
e
de
s
c
r
i
be
d
as
f
ol
l
o
w
s
,
Im
ag
e
P
r
e
-
T
r
ai
ni
n
g
proc
es
s
w
h
i
c
h
w
i
l
l
b
e
c
om
bi
ne
d
wi
th
i
np
utt
e
d
i
m
ag
e
a
nd
r
etra
i
n
i
ng
proc
es
s
us
i
ng
tr
an
s
f
er
l
ea
r
ni
n
g
m
eth
od
.
A
f
ter
thi
s
proc
es
s
f
i
ni
s
he
d
an
d
t
he
s
y
s
tem
f
i
l
l
e
d
w
i
t
h
the
tr
ai
n
ed
DCNN
,
t
he
n
i
t
c
an
be
us
ed
to
i
de
n
ti
f
y
a
ne
w
i
m
ag
e
tak
en
b
y
A
n
d
r
oi
d
de
v
i
c
e
i
n
r
ea
l
-
ti
m
e
m
od
e.
T
hu
s
,
F
i
n
e
T
un
i
ng
P
r
oc
es
s
w
i
l
l
c
ate
go
r
i
z
e
s
i
x
c
l
as
s
es
,
the
y
ar
e
s
c
oreboa
r
d
,
m
on
i
tor
,
te
l
e
v
i
s
i
on
,
c
i
n
em
a
,
an
d
web
s
i
te
i
nto
on
e
c
l
as
s
na
m
ed
as
b
i
l
l
b
oa
r
d.
T
he
ne
x
t
p
ha
s
e
i
s
f
ea
ture
ex
tr
ac
ti
o
n
w
h
i
c
h
c
an
de
tec
t
b
i
l
l
bo
ard
i
m
ag
e
f
r
am
e
b
y
f
r
am
e
i
n
DCNN
,
t
he
n
a
uto
m
ati
c
i
m
ag
e
s
torag
e
pr
oc
es
s
to
the
da
t
ab
as
e
wi
th
m
i
ni
m
u
m
ac
c
urac
y
,
t
he
n
we
a
pp
l
y
g
eo
t
an
gg
i
ng
proc
es
s
wi
th
the
m
eta
da
ta
s
teg
an
op
r
a
ph
y
proc
es
s
i
n
E
x
i
f
f
i
l
e.
I
n
th
e
p
os
tproc
es
s
i
ng
p
ha
s
e,
w
e
wi
l
l
ad
d
m
ore
i
m
po
r
tan
t
i
nf
orm
ati
on
s
of
the
bi
l
l
b
oa
r
d
i
m
ag
e
an
d
do
v
a
l
i
d
ati
on
pro
c
es
s
.
A
l
l
th
es
e
proc
es
s
es
are
de
s
c
r
i
b
ed
a
nd
s
ho
wn i
n
F
i
g
ure
1.
2
.1.
D
CNN T
r
ainin
g
w
it
h
ILSV
RC
20
12
F
i
r
s
t,
w
e
us
e I
nc
ep
t
i
o
n
-
v
3
a
s
a
pre
-
tr
a
i
n
ed
m
od
el
f
or i
m
ag
e c
l
as
s
i
f
i
c
ati
on
wi
t
h 1
.
2
m
i
l
l
i
on
da
tas
et
i
m
ag
es
an
d
1
00
0
di
f
f
erent
c
l
as
s
es
f
r
o
m
I
m
ag
eN
et
La
r
g
e
S
c
a
l
e
V
i
s
u
al
Rec
o
gn
i
ti
on
Chal
l
e
ng
e
(
I
LS
V
RC)
2
01
2
.
T
hi
s
m
od
el
us
es
A
l
ex
N
et’
s
DCNN
arc
hi
t
ec
ture
wi
th
6
0
m
i
l
l
i
on
pa
r
am
ete
r
s
an
d
65
0
.
0
00
n
eu
r
on
s
,
c
on
s
i
s
ts
of
f
i
v
e
c
on
v
o
l
ut
i
on
al
l
a
y
ers
,
thr
ee
po
ol
i
ng
l
a
y
e
r
s
,
an
d
three
f
ul
l
y
-
c
o
nn
ec
te
d
l
a
y
er
s
.
T
he
ou
tpu
t
of
the
m
od
el
i
s
10
00
-
w
a
y
s
of
tm
ax
r
es
ul
ti
ng
i
n
f
i
v
e
top
predi
c
t
i
on
s
of
the
o
bj
ec
t.
T
he
ne
t
w
ork
c
on
ta
i
ns
ei
g
ht
l
a
y
ers
w
i
th
we
i
gh
ts
;
th
e
f
i
r
s
t
f
i
v
e
are
c
on
v
o
l
ut
i
o
na
l
a
nd
the
r
em
ai
ni
n
g
t
hree
are
f
ul
l
y
-
c
o
nn
ec
t
ed
.
T
he
ou
t
pu
t
of
the
l
as
t
f
ul
l
y
-
c
o
nn
ec
ted
l
a
y
er
i
s
f
ed
to
a
10
00
-
wa
y
s
of
t
m
a
x
w
hi
c
h
pro
du
c
es
a
di
s
tr
i
b
uti
on
o
v
er
the
10
0
0
c
l
as
s
l
ab
e
l
s
.
T
he
ne
t
wor
k
’
s
i
np
u
t
i
s
1
5
0,5
2
8
-
di
m
en
s
i
on
al
,
a
nd
th
e
n
um
be
r
of
ne
uro
ns
i
n
the
ne
t
wor
k
’
s
r
em
ai
ni
ng
l
a
y
ers
i
s
g
i
v
en
b
y
2
53
,
440
-
1
86
,
624
-
6
4,
89
6
-
64,
8
96
-
4
3,
2
64
-
40
96
-
4
0
96
-
10
00
.
T
ab
l
e
1
s
ho
w
s
the
DCNN
proc
es
s
i
n
ev
er
y
l
a
y
er.
T
he
f
i
r
s
t
c
on
v
ol
uti
on
a
l
l
a
y
er
f
i
l
ters
the
2
24
x
2
24
x
3
i
np
ut
i
m
ag
e
wi
th
96
k
ernel
s
of
s
i
z
e
11
x
11
x
3
wi
th
a
s
tr
i
d
e
of
4
pi
x
e
l
s
.
T
he
ou
t
pu
t
of
the
f
i
r
s
t
c
on
v
o
l
ut
i
on
al
l
a
y
e
r
w
i
l
l
b
e
us
ed
as
an
i
np
ut
to
the
s
ec
on
d
c
on
v
ol
uti
on
a
l
l
a
y
er
w
i
t
h
25
6
k
ernel
s
of
s
i
z
e
5
x
5
x
48
.
T
he
th
i
r
d,
f
ou
r
th
,
a
nd
f
i
f
th
c
on
v
o
l
ut
i
o
na
l
l
a
y
ers
are
c
o
nn
ec
te
d
t
o
o
ne
an
ot
he
r
wi
th
ou
t
an
y
i
nt
erv
en
i
ng
po
o
l
i
ng
or
n
orm
al
i
z
a
ti
on
l
a
y
ers
.
T
he
th
i
r
d
c
on
v
ol
ut
i
o
na
l
l
a
y
er
ha
s
3
84
k
ernel
s
of
s
i
z
e
3
x
3
x
25
6
c
on
n
ec
ted
to
th
e
o
utp
uts
of
the
s
ec
on
d
c
o
nv
ol
ut
i
o
na
l
l
a
y
e
r
.
T
he
f
ou
r
th
an
d
f
i
f
th
c
on
v
ol
uti
o
na
l
l
a
y
e
r
h
as
38
4
k
ernel
s
of
s
i
z
e
3
x
3
x
19
2.
T
he
f
ul
l
y
-
c
on
ne
c
ted
l
a
y
ers
ha
v
e
40
9
6 n
eu
r
on
s
ea
c
h.
T
ab
l
e 1
. D
CNN
La
y
er Det
ai
l
s
L
a
y
e
r
S
iz
e
K
e
r
n
e
l
N
e
u
r
o
n
I
n
p
u
t
:
(
R
e
s
iz
e
d
I
m
a
g
e
)
2
2
4
x
2
2
4
x
3
x
1
-
150528
L
a
y
e
r
1
:
C
o
n
v
o
lut
ion
+
M
a
x
P
o
o
l
5
5
x
5
5
x
4
8
x
2
96
290400
L
a
y
e
r
2
:
C
o
n
v
o
lut
ion
+
M
a
x
P
o
o
l
2
7
x
2
7
x
1
2
8
x
2
256
186624
L
a
y
e
r
3
:
C
o
n
v
o
lut
ion
1
3
x
1
3
x
1
9
2
x
2
384
64896
L
a
y
e
r
4
:
C
o
n
v
o
lut
ion
1
3
x
1
3
x
1
9
2
x
2
384
64896
L
a
y
e
r
5
:
C
o
n
v
o
lut
ion
+
M
a
x
P
o
o
l
1
3
x
1
3
x
1
2
8
x
2
256
43264
L
a
y
e
r
6
:
Fully
-
C
o
n
n
e
c
t
e
d
2
0
4
8
x
2
-
4096
L
a
y
e
r
7
:
Fully
-
C
o
n
n
e
c
t
e
d
2
0
4
8
x
2
-
4096
L
a
y
e
r
8
:
S
o
f
t
m
a
x
Ou
t
p
u
t
1
0
0
0
x
1
-
1000
2
.
2
. D
CNN
w
it
h
T
r
ansf
er
Lear
n
ing
T
o
i
m
prov
e
DCNN
f
ea
tur
es
,
w
e
r
etra
i
n
the
n
et
w
or
k
b
y
ad
di
ng
m
ore
a
dv
erti
s
e
m
en
t
bi
l
l
b
oa
r
d
i
m
ag
es
i
nto
t
he
pr
e
-
tr
ai
n
ed
m
od
el
us
i
n
g
i
nd
u
c
ti
v
e
tr
a
ns
f
er
l
ea
r
ni
n
g
ap
proac
h.
T
r
an
s
f
e
r
l
ea
r
n
i
n
g
i
s
a
proc
es
s
w
h
i
c
h
wi
l
l
m
od
i
f
y
a
v
al
u
e
f
r
o
m
prev
i
ou
s
l
y
tr
a
i
n
ed
d
ata
s
et,
wi
th
a
dd
i
ti
on
a
l
da
ta
pro
pa
g
ate
d
t
o
t
he
DC
NN.
T
he
f
i
r
s
t
proc
es
s
i
s
b
y
i
n
pu
tt
i
n
g
30
0
ad
di
ti
o
na
l
b
i
l
l
bo
ard
i
m
ag
e
tak
en
f
r
o
m
G
oo
gl
e
i
m
ag
e
r
an
do
m
l
y
,
a
nd
84
bi
l
l
bo
ard
i
m
ag
es
ta
k
en
f
r
o
m
A
nd
r
oi
d
s
m
artpho
ne
i
n
r
ea
l
t
i
m
e
m
od
e
t
o
t
he
Inc
ep
ti
on
-
v
3
m
od
el
a
nd
do
DCNN
R
etra
i
ni
ng
P
r
oc
es
s
.
Nex
t
proc
es
s
i
n
v
ol
v
es
a
b
ott
l
en
ec
k
proc
es
s
w
he
r
e
al
l
the
i
m
ag
es
us
ed
f
or
tr
ai
ni
n
g
w
i
l
l
b
e
an
a
l
y
z
e
d
an
d
c
al
c
ul
a
ted
.
T
he
bo
tt
l
e
ne
c
k
v
a
l
ue
s
c
on
tai
n
a
m
ea
ni
ng
f
ul
a
nd
c
om
pa
c
t
s
um
m
a
r
y
of
the
i
m
ag
es
.
B
y
us
i
n
g
tr
an
s
f
er
l
ea
r
ni
n
g,
we
c
an
tr
a
i
n
da
tas
e
t
f
as
ter
tha
n
tr
ai
n
i
n
g
f
r
o
m
s
c
r
atc
h.
A
f
t
er
we
f
i
ni
s
h
the
bo
tt
l
e
ne
c
k
proc
es
s
the
n
w
e
s
tart
us
i
n
g
80
0
0
tr
a
i
ni
n
g
s
te
ps
i
n
t
he
DCNN
whi
c
h
r
es
ul
t
ed
5 h
i
gh
es
t
prei
c
t
ed
o
bj
ec
ts
wi
th
the
ac
c
urac
y
i
ts
el
f
.
Evaluation Warning : The document was created with Spire.PDF for Python.
â—¼
IS
S
N: 16
93
-
6
93
0
T
E
L
KO
M
NIK
A
V
ol
.
17
,
No
.
5,
O
c
tob
er 20
19
:
26
5
9
-
26
66
2662
F
i
gu
r
e
1.
A
d
v
erti
s
em
en
t b
i
l
l
bo
ard
de
t
ec
ti
o
n a
n
d g
eo
ta
g
gi
n
g s
y
s
tem
arc
hi
tec
ture
Evaluation Warning : The document was created with Spire.PDF for Python.
T
E
L
KO
M
NIK
A
IS
S
N: 1
69
3
-
6
93
0
â—¼
A
dv
erti
s
e
me
nt
b
i
l
l
bo
ard d
et
ec
ti
on
an
d g
e
ota
gg
i
ng
s
y
s
t
em
... (
R
om
i
Fad
i
l
l
a
h Ra
hm
at
)
2663
2
.
3
.
F
ine
-
t
u
n
ing
W
e
f
i
ne
-
tun
ed
t
he
DCNN
wi
th
1
00
0
c
at
eg
or
i
es
us
i
n
g
tr
an
s
f
er
l
ea
r
ni
ng
ap
proa
c
h
i
nto
ad
v
erti
s
em
en
t
bi
l
l
b
oa
r
d
r
el
ate
d
c
ate
go
r
i
es
,
s
uc
h
as
s
c
orebo
ard,
s
c
r
ee
n,
m
on
i
tor,
tel
e
v
i
s
i
on
,
an
d
c
i
ne
m
a.
F
i
gu
r
e
2
s
h
o
w
s
an
ex
am
pl
e
of
f
i
ne
-
tun
i
n
g
pro
c
es
s
s
ho
w
i
ng
t
op
f
i
v
e
ob
j
e
c
t
predi
c
ti
on
s
.
T
he
hi
g
he
s
t
ad
v
erti
s
em
en
t
bi
l
l
b
oa
r
d
r
el
a
ted
pre
di
c
ti
on
wi
l
l
be
s
e
l
ec
te
d
as
the
f
i
na
l
ou
t
pu
t.
T
he
r
e
are
2
r
el
ate
d
c
at
eg
orie
s
r
e
l
ate
d
to
a
dv
erti
s
em
en
t
bi
l
l
bo
ard,
whi
c
h
ar
e
s
c
oreboa
r
d
wi
th
7
2.6
%
ac
c
urac
y
a
nd
c
i
ne
m
a
w
i
t
h
0.
54
8%
ac
c
urac
y
.
S
i
nc
e
th
e
s
c
orebo
ard
ac
c
urac
y
ha
s
hi
gh
er
ac
c
urac
y
, th
e a
c
c
urac
y
wi
l
l
be
c
ho
s
e
n a
s
th
e f
i
na
l
ac
c
u
r
ac
y
f
or the
d
ete
c
te
d o
bj
ec
t.
F
i
gu
r
e
2
.
F
i
ne
-
tu
ni
ng
ex
am
pl
e
2
.
4
.
R
ea
l
-
t
ime
A
d
v
e
r
t
ise
m
ent
Billbo
ar
d
Det
ec
t
ion
A
d
v
erti
s
em
en
t
b
i
l
l
b
oa
r
d
de
tec
ti
o
n
i
s
c
o
nd
uc
te
d
us
i
ng
A
nd
r
o
i
d
s
m
artpho
ne
i
n
r
ea
l
-
ti
m
e
r
oa
d
c
on
di
t
i
o
n
b
as
ed
on
f
r
a
m
e
b
y
f
r
am
e
i
m
ag
es
.
T
he
de
tec
t
ed
bi
l
l
b
oa
r
d
i
m
ag
e
w
i
l
l
be
au
tom
ati
c
al
l
y
ge
ota
g
ge
d
an
d s
av
ed
i
nto
th
e
da
t
ab
as
e.
2
.
5
.
G
eot
agg
ing
W
e
us
e
A
nd
r
oi
d
s
m
artpho
ne
G
P
S
an
d
4G
ne
t
wor
k
s
to
ob
ta
i
n
g
eo
ta
g
i
nf
or
m
ati
on
.
T
he
n,
E
x
c
ha
ng
ea
b
l
e
Im
ag
e
F
i
l
e
(
E
x
i
f
)
m
eta
da
ta
i
s
us
ed
t
o
s
tore
ge
og
r
ap
h
i
c
al
l
oc
at
i
o
n,
e.g
.
l
at
i
tu
de
an
d
l
on
gi
t
ud
e
v
a
l
u
e
of
th
e
de
t
ec
ted
a
dv
erti
s
em
en
t
bi
l
l
b
oa
r
d.
F
urt
he
r
m
ore,
the
ad
dres
s
of
the
ad
v
ert
i
s
em
en
t
bi
l
l
b
oa
r
d
i
m
ag
e
c
an
be
ex
tr
ac
t
ed
us
i
ng
r
e
v
ers
e
ge
oc
od
i
ng
.
R
ev
ers
e
ge
oc
od
i
n
g
r
e
pres
en
ts
a
l
oc
ati
o
n
i
n
m
ore
r
ea
da
b
l
e
f
orm
s
,
e.g
.
s
tr
e
et
na
m
e,
pl
ac
e
na
m
e,
c
ou
nt
y
,
s
tat
e,
c
ou
ntr
y
,
an
d p
os
t
al
c
od
e.
2
.
6
.
P
o
st
-
p
r
o
ce
ss
ing
A
f
ter
s
av
i
ng
i
m
ag
e
i
nto
d
ata
b
as
e,
we
a
dd
ad
d
i
t
i
on
al
i
nf
orm
ati
on
to
ad
v
ert
i
s
em
en
t
bi
l
l
b
oa
r
d
da
t
a,
s
uc
h
as
ad
v
erti
s
em
en
t
b
i
l
l
b
oa
r
d
na
m
e
an
d
c
ate
go
r
y
.
A
dv
erti
s
em
en
t
bi
l
l
b
oa
r
d
i
s
di
v
i
d
ed
i
nt
o
s
e
v
era
l
c
at
eg
o
r
i
es
,
e.
g.
f
oo
d
an
d
b
e
v
era
ge
,
t
el
ec
om
m
un
i
c
ati
on
,
ba
nk
,
i
ns
uranc
e,
tr
an
s
po
r
tat
i
o
n,
r
ea
l
es
tat
e,
ed
uc
ati
on
,
c
i
ga
r
ett
e,
e
v
en
t,
c
am
pa
i
gn
,
prom
oti
on
,
h
om
e
produc
ts
,
el
ec
tr
on
i
c
produc
ts
,
m
ed
i
a.
T
he
s
e
c
ate
go
r
i
es
i
s
us
ef
u
l
f
or
c
om
m
erc
i
al
pu
r
p
os
e.
I
n
a
dd
i
ti
on
f
or
ad
v
erti
s
em
en
t
bi
l
l
b
oa
r
d
v
eri
f
i
c
ati
on
,
w
e
n
ee
d
to
en
s
ure
i
f
the
ad
v
erti
s
em
en
t
bi
l
l
b
oa
r
d
c
ol
l
ec
t
ed
i
s
no
t
ex
pi
r
e
d
y
et.
He
nc
e,
a
r
ou
t
i
ne
up
da
t
e
i
s
ne
c
es
s
ar
y
t
o
c
h
ec
k
w
he
t
he
r
t
he
ad
v
erti
s
em
en
t
bi
l
l
b
oa
r
d
i
s
s
ti
l
l
ac
t
i
v
e o
r
ex
pi
r
ed
.
3.
T
r
ainin
g
Res
u
lt
s
Dur
i
n
g
tr
ai
ni
n
g
proc
es
s
,
ea
c
h
s
tep
c
ho
os
es
ten
i
m
ag
es
at
r
an
do
m
fr
o
m
the
tr
ai
ni
ng
s
et,
f
i
nd
the
i
r
bo
ttl
en
ec
k
v
al
u
es
,
an
d
us
e
th
em
i
nto
t
he
f
i
na
l
l
a
y
er
to
g
et
pre
di
c
i
t
i
on
s
.
T
ho
s
e
Evaluation Warning : The document was created with Spire.PDF for Python.
â—¼
IS
S
N: 16
93
-
6
93
0
T
E
L
KO
M
NIK
A
V
ol
.
17
,
No
.
5,
O
c
tob
er 20
19
:
26
5
9
-
26
66
2664
predi
c
t
i
on
s
are
th
en
c
om
pa
r
ed
a
ga
i
ns
t
th
e
ac
tu
al
l
a
be
l
s
t
o
up
da
t
e
th
e
f
i
na
l
l
a
y
e
r
’
s
wei
gh
ts
throug
h t
h
e b
ac
k
-
propag
a
ti
on
proc
es
s
.
T
he
tr
ai
ni
n
g
i
s
c
on
du
c
t
ed
i
n
two
ex
pe
r
i
m
en
ts
,
s
uc
h
as
ex
pe
r
i
m
en
t
w
i
t
h
40
0
0
tr
ai
n
i
ng
s
tep
s
an
d
8
00
0
tr
ai
n
i
n
g
s
tep
s
.
T
ab
l
e
2
s
ho
w
s
s
e
v
er
al
pa
r
am
ete
r
s
us
ed
f
or
tr
ai
ni
n
g
w
i
t
h
40
00
an
d
80
0
0
tr
a
i
ni
ng
s
te
ps
.
T
he
r
es
ul
ts
of
the
tr
a
i
n
i
ng
proc
es
s
s
ho
w
th
at
th
e
e
x
pe
r
i
m
en
t
wi
th
40
00
tr
ai
ni
n
g
s
tep
s
r
es
u
l
t
i
n
89
.
3%
ac
c
urac
y
,
where
a
s
the
ex
pe
r
i
m
en
t
w
i
th
8
00
0
tr
ai
n
i
ng
s
te
ps
r
es
ul
t
i
n
92
.
7%
ac
c
urac
y
.
T
he
s
e
s
ho
w
t
ha
t
m
ore
tr
ai
ni
n
g
s
tep
s
r
es
ul
t
i
n
h
i
g
he
r
ac
c
urac
y
.
S
i
nc
e
the
tr
a
i
n
i
ng
ac
c
urac
y
i
s
hi
g
he
r
,
w
e
w
i
l
l
us
e
t
he
m
od
el
wi
th
80
0
0
tr
a
i
n
i
ng
s
tep
s
f
or
the
de
tec
t
i
on
proc
es
s
.
T
ab
l
e
3
s
ho
w
s
t
h
e
a
dv
erti
s
em
en
t
b
i
l
l
b
oa
r
d
i
m
ag
es
tr
ai
ni
ng
r
es
ul
ts
w
i
th
80
00
tr
ai
ni
ng
s
tep
s
. O
v
era
l
l
, th
e t
r
a
i
ni
ng
r
es
ul
ts
ac
h
i
e
v
e
92
.7
% ac
c
ur
ac
y
.
T
ab
l
e
2
.
P
aram
ete
r
us
ed
f
o
r
T
r
ai
ni
ng
D
ata
s
et
P
a
r
a
m
e
t
e
r
E
x
p
e
r
im
e
n
t
1
E
x
p
e
r
im
e
n
t
2
Tr
a
inin
g
s
t
e
p
s
4000
8000
L
e
a
r
n
ing
r
a
t
e
0
.
0
1
0
.
0
1
Tes
t
ing
p
e
r
c
e
n
t
a
g
e
10%
10%
V
a
li
d
a
t
ion
p
e
r
c
e
n
t
a
g
e
10%
10%
E
v
a
l
s
t
e
p
in
t
e
r
v
a
l
10
10
Tr
a
in
b
a
t
c
h
s
iz
e
100
100
V
a
li
d
a
t
ion
b
a
t
c
h
s
iz
e
100
100
T
ab
l
e
3
.
A
d
v
ert
i
s
em
en
t B
i
l
l
bo
ard T
r
ai
n
i
ng
Res
u
l
ts
w
i
t
h
80
0
0 T
r
ai
ni
n
g
S
tep
s
S
um
m
ary
Tr
a
inin
g
S
t
e
p
s
Tr
a
inin
g
A
c
c
u
r
a
c
y
(
%
)
C
r
o
s
s
E
n
t
r
o
p
y
V
a
li
d
a
t
ion
A
c
c
u
r
a
c
y
(
%
)
0
6
0
.
0
0
.
6
4
4
5
2
1
5
6
.
0
500
9
8
.
0
0
.
0
8
5
9
3
4
7
1
.
0
1000
1
0
0
.
0
0
.
0
5
0
5
4
2
7
6
.
0
1500
1
0
0
.
0
0
.
0
2
5
9
0
6
7
4
.
0
2000
1
0
0
.
0
0
.
0
2
6
4
8
7
7
9
.
0
2500
1
0
0
.
0
0
.
0
1
7
4
2
6
8
5
.
0
3000
1
0
0
.
0
0
.
0
1
4
5
6
8
8
5
.
0
3500
1
0
0
.
0
0
.
0
1
6
3
4
9
8
1
.
0
4000
1
0
0
.
0
0
.
0
1
3
4
5
4
8
6
.
0
4500
1
0
0
.
0
0
.
0
0
7
5
7
5
8
3
.
0
5000
1
0
0
.
0
0
.
0
0
8
6
9
4
8
2
.
0
5500
1
0
0
.
0
0
.
0
0
7
3
6
8
8
4
.
0
6000
1
0
0
.
0
0
.
0
0
8
2
6
2
8
4
.
0
6500
1
0
0
.
0
0
.
0
0
6
6
6
0
8
7
.
0
7000
1
0
0
.
0
0
.
0
0
6
3
3
5
8
1
.
0
7500
1
0
0
.
0
0
.
0
0
8
0
8
3
8
3
.
0
7999
1
0
0
.
0
0
.
0
0
5
4
4
9
7
5
.
0
Fina
l
A
c
c
u
r
a
c
y
9
2
.
7
%
4.
T
es
t
ing
Res
u
lt
T
he
de
tec
t
i
on
proc
es
s
i
s
c
on
du
c
t
ed
du
r
i
ng
a
da
y
an
d
i
n
r
e
al
-
t
i
m
e
c
on
di
t
i
o
n.
T
ab
l
e
4
s
ho
w
s
tha
t
the
tes
ti
ng
r
es
ul
ts
ac
h
i
e
v
e
72.
0%
.
W
e
ev
al
ua
t
e
s
ev
eral
prob
l
em
s
aff
ec
ti
ng
the
ac
c
urac
y
of
DCNN
i
n
de
tec
t
i
ng
a
dv
erti
s
em
en
t
bi
l
l
bo
ard.
F
i
r
s
t,
gi
v
e
n
the
t
es
ti
ng
r
es
u
l
ts
i
n
T
ab
l
e
3,
w
e
c
on
c
l
ud
e
tha
t
brig
ht
ne
s
s
af
f
ec
ts
the
de
te
c
ti
on
ac
c
urac
y
.
A
n
oth
er
f
ac
tors
al
s
o
af
f
ec
t
the
de
t
ec
ti
o
n
proc
es
s
,
whi
c
h
are
oc
c
l
us
i
on
s
,
e.
g.
no
i
s
e,
el
ec
tr
i
c
a
l
c
ab
l
e,
tr
ee
,
p
ol
e,
s
tr
ee
t
s
i
gn
,
an
d
o
the
r
o
bj
ec
ts
tha
t
c
o
v
er
the
a
dv
erti
s
em
en
t
bi
l
l
bo
ard
area.
I
n
ad
di
t
i
o
n,
s
ho
oti
n
g
d
i
s
tan
c
e
af
f
ec
ts
th
e a
dv
ert
i
s
em
en
t b
i
l
l
b
oa
r
d
ac
c
urac
y
.
T
he
ne
arer
th
e
s
h
oo
t
i
ng
di
s
tan
c
e
t
o
t
he
ob
j
ec
t,
th
e
h
i
g
he
r
t
he
ac
c
urac
y
ac
hi
e
v
e
d
.
F
i
g
ure
3
s
h
o
w
s
t
w
o
ad
v
er
ti
s
em
en
t
bi
l
l
bo
ard
i
m
ag
es
wi
th
t
wo
d
i
f
f
erent
s
ho
oti
ng
di
s
tan
c
es
i
n
whi
c
h
th
e
f
ar
s
ho
oti
ng
d
i
s
tan
c
e
r
es
ul
ts
i
n
2
8.1
%
ac
c
urac
y
a
nd
th
e
n
ea
r
s
ho
o
ti
ng
d
i
s
tan
c
e
r
es
ul
ts
i
n
87
.
3%.
T
hi
s
s
ho
w
s
th
at
t
he
ac
c
urac
y
i
s
h
i
gh
er
w
h
en
t
he
o
bj
ec
t
i
s
n
ea
r
er.
S
ho
o
ti
n
g
an
g
l
e
a
l
s
o
af
f
ec
ts
de
tec
ti
o
n
ac
c
urac
y
.
F
i
g
ure
4
s
ho
ws
tw
o
a
dv
erti
s
em
en
t
bi
l
l
b
oa
r
d
i
m
ag
es
w
i
th
two
di
f
f
erent
s
ho
ot
i
ng
a
ng
l
es
i
n
whi
c
h
s
ho
oti
ng
f
r
om
fr
on
t
an
g
l
e
ac
h
i
e
v
es
86
.
7%
ac
c
urac
y
a
nd
the
s
ho
oti
ng
f
r
om
r
i
gh
t
an
gl
e
ac
hi
ev
es
66
.
1%.
T
hi
s
s
ho
w
s
tha
t
the
ac
c
urac
y
i
s
hi
gh
er
w
h
en
the
o
bj
ec
t i
s
d
ete
c
te
d i
n f
r
on
t a
n
gl
e.
In
the
f
utu
r
e,
s
e
v
er
al
ph
as
e
wi
l
l
be
ad
d
ed
i
nto
th
e
s
y
s
tem
.
W
e
w
i
l
l
tr
a
i
n
the
ad
v
ert
i
s
em
en
t
bi
l
l
bo
ard
i
m
ag
es
w
i
t
h
de
e
pe
r
DC
NN
arc
hi
tec
tur
e,
e.g
.
G
o
o
gl
eN
et’
s
DCN
N
Evaluation Warning : The document was created with Spire.PDF for Python.
T
E
L
KO
M
NIK
A
IS
S
N: 1
69
3
-
6
93
0
â—¼
A
dv
erti
s
e
me
nt
b
i
l
l
bo
ard d
et
ec
ti
on
an
d g
e
ota
gg
i
ng
s
y
s
t
em
... (
R
om
i
Fad
i
l
l
a
h Ra
hm
at
)
2665
wi
th
2
2
hi
dd
en
l
a
y
ers
[2
1]
or
wi
th
b
ett
er
m
ac
hi
ne
l
e
arni
n
g
ap
proac
h,
s
uc
h
as
Deep
R
es
i
d
ua
l
Net
w
ork
(
DRN)
[22]
.
In
ad
di
t
i
on
,
we
wi
l
l
ad
d
m
ore
ad
v
erti
s
em
en
t
b
i
l
l
bo
ard
i
m
ag
es
at
ni
gh
t
t
i
m
e
to
i
m
prov
e
the
de
tec
ti
on
at
ni
gh
t
.
F
urtherm
ore,
w
e
w
i
l
l
ad
d
op
t
i
c
al
c
ha
r
ac
t
er
r
ec
o
gn
i
t
i
o
n
(
O
CR)
to
ex
tr
ac
t
tex
t
i
n
ad
v
ert
i
s
e
m
en
t
bi
l
l
b
oa
r
d
au
tom
ati
c
al
l
y
[23]
.
Mo
r
eo
v
er,
we
wi
l
l
us
e
es
ti
m
ati
on
al
g
orit
hm
to
m
ea
s
ure
the
di
s
ta
nc
e
an
d
s
i
z
e
of
the
ad
v
ert
i
s
em
en
t
bi
l
l
b
oa
r
d
to
i
m
prov
e
the
ac
c
urac
y
of
ge
o
tag
gi
n
g
proc
es
s
[24
,
25
].
T
ab
l
e
4
.
A
d
v
ert
i
s
em
en
t
B
i
l
l
bo
ard T
es
ti
n
g Re
s
u
l
ts
Dur
i
ng
Da
y
A
d
v
e
r
t
is
e
m
e
n
t
B
il
lbo
a
r
d
I
m
a
g
e
A
c
c
u
r
a
c
y
(
%
)
A
d
v
e
r
t
is
e
m
e
n
t
B
il
lbo
a
r
d
I
m
a
g
e
A
c
c
u
r
a
c
y
(
%
)
1
9
3
.
9
16
4
4
.
5
2
7
6
.
5
17
5
0
.
2
3
8
7
.
3
18
6
7
.
5
4
7
0
.
1
19
7
4
.
6
5
3
2
.
2
20
4
9
.
7
6
5
4
.
7
21
5
9
.
1
7
7
1
.
9
22
8
0
.
8
8
86
.
7
23
8
1
.
9
9
5
6
.
2
24
8
8
.
3
10
8
5
.
6
25
8
7
.
9
11
9
7
.
1
26
9
0
.
5
12
7
6
.
7
27
6
5
.
1
13
6
5
.
1
28
6
1
.
5
14
9
0
.
3
29
7
2
.
9
15
6
9
.
0
30
6
8
.
0
A
v
e
r
a
g
e
Tes
t
ing
A
c
c
u
r
a
c
y
7
1
.
8
6
%
F
i
gu
r
e
3
.
T
w
o
ad
v
ert
i
s
em
en
t b
i
l
l
bo
ard
i
m
ag
es
wi
th
di
f
f
erent s
ho
ot
i
ng
d
i
s
tan
c
es
F
i
gu
r
e
4
.
T
w
o
ad
v
ert
i
s
em
en
t
b
i
l
l
bo
ard
i
m
ag
es
wi
th
di
f
f
erent s
ho
ot
i
ng
a
ng
l
es
4.
Co
n
clus
ion
In
t
hi
s
pa
p
er,
we
pres
en
t
De
ep
Con
v
o
l
ut
i
o
na
l
Ne
ural
Net
wor
k
(
DCNN
)
to
de
tec
t
ad
v
erti
s
em
en
t
b
i
l
l
b
oa
r
d.
T
he
D
CNN
tr
ai
ni
ng
r
es
ul
ts
ac
hi
e
v
e
92
.
7%
ac
c
urac
y
.
In
a
dd
i
ti
o
n,
the
DCNN
r
ea
l
-
ti
m
e
tes
ti
n
g
r
es
ul
ts
ac
hi
ev
e
71
.8
6%
a
c
c
urac
y
du
r
i
ng
da
y
an
d
16
.98
%
at
ni
gh
t.
T
hi
s
s
ho
w
s
t
ha
t
the
de
t
ec
ti
on
p
erf
or
m
s
be
tte
r
du
r
i
ng
d
a
y
t
i
m
e.
F
or
ge
o
tag
gi
ng
proc
es
s
,
m
os
t
o
f
the
s
a
v
ed
i
m
ag
es
c
on
ta
i
n
i
ts
ge
ot
ag
g
i
n
g
l
oc
ati
on
.
Ho
wev
er,
th
e
i
m
ag
es
are
t
ak
en
f
r
om
a
c
ar,
thu
s
w
i
l
l
ha
v
e
1
-
10
m
etres
di
f
f
erenc
e
f
r
o
m
ex
ac
t
l
oc
ati
on
.
It
m
ea
ns
the
r
ea
l
ac
c
urati
o
n
i
s
de
gre
da
te
d
be
c
a
us
e
of
r
ea
l
s
i
tua
t
i
on
i
n
th
e
f
i
el
d.
T
he
o
pti
m
al
r
an
ge
of
the
s
y
s
t
em
ac
hi
e
v
es
h
i
gh
ac
c
urac
y
un
de
r
4G
ne
t
wor
k
s
.
Ref
er
en
ce
s
[1
]
G
M
e
d
i
o
n
i
,
G
G
u
y
,
H
Rom
,
A
Fra
n
ç
o
i
s
.
Rea
l
-
Ti
m
e
Bi
l
l
b
o
a
rd
Su
b
s
ti
tu
ti
o
n
i
n
a
Vi
d
e
o
Stre
a
m
.
Pro
c
e
e
d
i
n
g
s
o
f
th
e
1
0
th
T
y
rrh
e
n
i
a
n
In
te
r
n
a
ti
o
n
a
l
W
o
r
k
s
h
o
p
o
n
Di
g
i
t
a
l
Co
m
m
u
n
i
c
a
t
i
o
n
s
.
1
9
9
8
:
1
-
1
4
.
Evaluation Warning : The document was created with Spire.PDF for Python.
â—¼
IS
S
N: 16
93
-
6
93
0
T
E
L
KO
M
NIK
A
V
ol
.
17
,
No
.
5,
O
c
tob
er 20
19
:
26
5
9
-
26
66
2666
[2
]
G
Cai
,
L
Che
n
,
J
L
i
.
Bi
l
l
b
o
a
rd
a
d
v
e
rt
i
s
i
n
g
d
e
t
e
c
t
i
o
n
i
n
s
p
o
rt
TV
.
Pro
c
e
e
d
i
n
g
s
o
f
th
e
7
th
In
te
rn
a
t
i
o
n
a
l
Sy
m
p
o
s
i
u
m
o
n
Si
g
n
a
l
Pro
c
e
s
s
i
n
g
a
n
d
I
t
s
Ap
p
l
i
c
a
t
i
o
n
s
.
2
0
0
3
:
537
-
5
4
0
.
[3
]
F
Al
d
e
rs
h
o
ff
,
T
G
e
v
e
rs
.
Vi
s
u
a
l
Tra
c
k
i
n
g
a
n
d
L
o
c
a
l
i
s
a
t
i
o
n
o
f
Bi
l
l
b
o
a
rd
s
i
n
Stre
a
m
e
d
So
c
c
e
r
M
a
tc
h
e
s
.
Sto
ra
g
e
a
n
d
R
e
tri
e
v
a
l
M
e
th
o
d
s
a
n
d
Ap
p
l
i
c
a
ti
o
n
s
fo
r M
u
l
ti
m
e
d
i
a
.
2004
;
5
3
0
7
:
4
0
8
-
4
1
6
.
[4
]
N
Ic
h
i
m
u
ra
.
Re
c
o
g
n
i
z
i
n
g
m
u
l
ti
p
l
e
b
i
l
l
b
o
a
r
d
a
d
v
e
rti
s
e
m
e
n
t
s
i
n
v
i
d
e
o
s
.
Pa
c
i
fi
c
-
Rim
Sy
m
p
o
s
i
u
m
o
n
Im
a
g
e
a
n
d
Vi
d
e
o
T
e
c
h
n
o
l
o
g
y
(PSI
VT
)
.
2
0
0
6
;
1
(
4
3
1
9
):
4
6
3
-
4
7
3
.
[5
]
AK
W
a
tv
e
,
S
Su
ra
l
.
Det
e
c
ti
o
n
o
f
o
n
-
f
i
e
l
d
a
d
v
e
rti
s
e
m
e
n
t
b
i
l
l
b
o
a
rd
s
fro
m
s
o
c
c
e
r
t
e
l
e
c
a
s
t
s
.
IE
T
In
te
rn
a
ti
o
n
a
l
Co
n
fe
re
n
c
e
o
n
V
i
s
u
a
l
I
n
fo
r
m
a
t
i
o
n
En
g
i
n
e
e
r
i
n
g
(
I
CVIE)
.
2006
:
12
-
17.
[6
]
B
O
rg
i
n
c
.
A
v
i
s
i
o
n
-
b
a
s
e
d
s
y
s
te
m
f
o
r
d
e
te
c
ti
n
g
a
n
d
tra
c
k
i
n
g
o
f
a
d
v
e
rti
s
e
m
e
n
t
b
i
l
l
b
o
a
r
d
s
.
T
h
e
s
i
s
.
L
j
u
b
l
j
a
n
a
:
Uni
v
e
r
s
i
ty
o
f
L
j
u
b
l
j
a
n
a
.
2
0
0
9
.
[7
]
J
H
S O
rd
e
l
m
a
n
.
Au
to
m
a
t
i
c
B
i
l
l
b
o
a
rd
De
te
c
ti
o
n
.
T
h
e
s
i
s
.
T
w
e
n
t:
Uni
v
e
r
s
i
ty
o
f
T
w
e
n
te
;
2
0
1
0
.
[8
]
A
Kri
z
h
e
v
s
k
y
,
I
Su
ts
k
e
v
e
r,
G
E
Hin
to
n
.
Im
a
g
e
Ne
t
Cla
s
s
i
f
i
c
a
ti
o
n
wit
h
Dee
p
Con
v
o
l
u
ti
o
n
a
l
Neu
ra
l
Net
work
s
.
Ad
v
a
n
c
e
s
i
n
Ne
u
ra
l
I
n
fo
r
m
a
ti
o
n
Pro
c
e
s
s
i
n
g
Sy
s
t
e
m
(NIPS)
.
2
0
1
2
;
1
2
(2
5
)
:
1
0
9
7
-
1105.
[9
]
E
M
a
c
i
a
s
,
H
Ab
d
e
l
fa
ta
h
,
A
S
u
a
re
z
,
A
Can
o
v
a
s
.
Fu
l
l
G
e
o
-
l
o
c
a
l
i
z
e
d
M
o
b
i
l
e
Vi
d
e
o
i
n
An
d
ro
i
d
M
o
b
i
l
e
T
e
l
e
p
h
o
n
e
.
M
a
c
ro
th
i
n
k
I
n
s
t
i
tu
t
e
Ac
a
d
e
m
i
c
J
o
u
r
n
a
l
o
f
Net
wo
rk
Pro
to
c
o
l
s
a
n
d
Al
g
o
ri
th
m
s
.
2011;
3
(1
)
:
64
-
81.
[1
0
]
I
Sa
h
u
,
I
Cha
k
r
a
b
o
rty
.
Und
e
r
s
ta
n
d
i
n
g
L
o
c
a
ti
o
n
M
a
n
a
g
e
r
i
n
An
d
ro
i
d
a
n
d
Im
p
l
e
m
e
n
t
i
n
g
a
n
O
p
ti
m
a
l
Im
a
g
e
G
e
o
ta
g
g
i
n
g
A
p
p
l
i
c
a
t
i
o
n
.
In
te
rn
a
ti
o
n
a
l
J
o
u
r
n
a
l
o
f
Co
m
p
u
te
r
Tre
n
d
s
a
n
d
Te
c
h
n
o
l
o
g
y
(IJ
CTT)
.
2013;
4
(6
)
:
1
6
8
2
-
1
6
8
6
.
[1
1
]
R
F
Rah
m
a
t
,
S
Pu
rn
a
m
a
w
a
ti
,
H
Sa
i
to
,
I
c
h
w
a
n
M
F,
L
u
b
i
s
T
M
.
An
d
ro
i
d
-
b
a
s
e
d
a
u
to
m
a
t
i
c
d
e
t
e
c
ti
o
n
a
n
d
m
e
a
s
u
re
m
e
n
t
s
y
s
t
e
m
o
f
h
i
g
h
w
a
y
b
i
l
l
b
o
a
rd
fo
r
ta
x
c
a
l
c
u
l
a
t
i
o
n
i
n
In
d
o
n
e
s
i
a
.
In
d
o
n
e
s
i
a
n
J
o
u
rn
a
l
o
f
El
e
c
tr
i
c
a
l
En
g
i
n
e
e
ri
n
g
a
n
d
Co
m
p
u
te
r Sc
i
e
n
c
e
.
2
0
1
9
:
1
4
(
2
):
877
-
8
8
6
.
[1
2
]
BY
Lin
,
CS
Che
n
.
Two
Pa
r
a
l
l
e
l
Dee
p
Con
v
o
l
u
ti
o
n
a
l
Ne
u
ra
l
Ne
two
rk
s
fo
r
Pe
d
e
s
tr
i
a
n
Det
e
c
ti
o
n
.
In
te
rn
a
ti
o
n
a
l
Co
n
fe
re
n
c
e
o
n
I
m
a
g
e
a
n
d
Vi
s
i
o
n
C
o
m
p
u
ti
n
g
N
e
w
Z
e
a
l
a
n
d
(
IVCNZ)
.
2
0
1
5
:
1
-
6.
[1
3
]
F
Zh
a
n
g
,
X
X
u
,
Y
Q
i
a
o
.
Dee
p
Cla
s
s
i
f
i
c
a
t
i
o
n
o
f
Ve
h
i
c
l
e
M
a
k
e
r
s
a
n
d
M
o
d
e
l
s
:
Th
e
E
ff
e
c
ti
v
e
n
e
s
s
o
f
Pre
-
tra
i
n
i
n
g
a
n
d
Dat
a
En
h
a
n
c
e
m
e
n
t
.
IEEE
In
te
r
n
a
ti
o
n
a
l
Con
fe
re
n
c
e
o
n
Ro
b
o
ti
c
s
a
n
d
Bi
o
m
i
m
e
tri
c
s
(RO
BIO
)
.
2015
:
2
3
1
-
2
3
6
.
[
1
4
]
K
Y
a
n
a
i
,
Y
K
a
w
a
n
o
.
F
o
o
d
i
m
a
g
e
r
e
c
o
g
n
i
t
i
o
n
u
s
i
n
g
d
e
e
p
c
o
n
v
o
l
u
t
i
o
n
a
l
n
e
u
r
a
l
n
e
t
w
o
r
k
w
i
t
h
p
r
e
-
t
r
a
i
n
i
n
g
a
n
d
f
i
n
e
-
t
u
n
i
n
g
.
I
E
E
E
I
n
t
e
r
n
a
t
i
o
n
a
l
C
o
n
f
e
r
e
n
c
e
o
n
M
u
l
t
i
m
e
d
i
a
&
Ex
p
o
W
o
r
k
s
h
o
p
s
(
I
CM
E
W
)
.
2015
:
1
-
6.
[1
5
]
Z
Y
a
n
,
H
Zh
a
n
g
,
R
Pi
ra
m
u
t
h
u
,
V
J
a
g
a
d
e
e
s
h
,
D
Dec
o
s
t
e
,
W
D
i
,
Y
Y
u
.
HD
-
CN
N:
Hie
ra
r
c
h
i
c
a
l
Dee
p
Con
v
o
l
u
ti
o
n
a
l
Neu
r
a
l
N
e
two
rk
s
fo
r
L
a
r
g
e
Sc
a
l
e
V
i
s
u
a
l
Rec
o
g
n
i
ti
o
n
.
IEEE
I
n
te
rn
a
ti
o
n
a
l
Co
n
fe
re
n
c
e
o
n
Com
p
u
t
e
r Vi
s
i
o
n
(I
CC
V)
.
2
0
1
5
:
2740
-
2
7
4
8
.
[1
6
]
G
Pa
s
q
u
a
l
e
,
C
Cil
i
b
e
rto
,
L
Ro
s
a
s
c
o
,
L
Nat
a
l
e
.
O
b
j
e
c
t
i
d
e
n
ti
f
i
c
a
t
i
o
n
fro
m
fe
w
e
x
a
m
p
l
e
s
b
y
i
m
p
ro
v
i
n
g
th
e
i
n
v
a
r
i
a
n
c
e
o
f
a
Dee
p
C
o
n
v
o
l
u
ti
o
n
a
l
Neu
r
a
l
Net
wor
k
.
IEEE/
RSJ
In
t
e
rn
a
t
i
o
n
a
l
Co
n
f
e
re
n
c
e
o
n
In
te
l
l
i
g
e
n
c
e
Ro
b
o
ts
a
n
d
Sy
s
t
e
m
s
(I
RO
S)
.
2
0
1
6
:
4
9
0
4
-
4
9
1
1
.
[1
7
]
S
J
u
n
g
,
U
L
e
e
,
J
J
u
n
g
,
DH
Sh
i
m
.
Rea
l
-
Ti
m
e
Tr
a
ff
i
c
Si
g
n
Rec
o
g
n
i
ti
o
n
Sy
s
te
m
wit
h
Dee
p
Con
v
o
l
u
ti
o
n
a
l
Neu
ra
l
Net
wo
rk
.
In
t
e
rn
a
ti
o
n
a
l
Co
n
fe
re
n
c
e
o
n
Ubi
q
u
i
t
o
u
s
Rob
o
ts
a
n
d
Am
b
i
e
n
t
In
te
l
l
i
g
e
n
c
e
(URA
I)
.
2
0
1
6
;
1
3
(
1
)
:
31
-
34.
[1
8
]
W
O
u
y
a
n
g
,
X
Ze
n
g
,
X
W
a
n
g
,
S
Q
i
u
,
P
L
u
o
,
Y
T
i
a
n
,
H
L
i
,
S
Y
a
n
g
,
Z
W
a
n
g
,
H
L
i
,
CC
L
o
y
,
K
W
a
n
g
,
J
Y
a
n
,
X
T
a
n
g
.
Dee
p
ID
-
Net
:
Def
o
rm
a
b
e
l
Dee
p
Con
v
o
l
u
ti
o
n
a
l
Neu
r
a
l
Ne
two
rk
s
fo
r
O
b
j
e
c
t
Det
e
c
ti
o
n
.
IEEE
Con
fe
re
n
c
e
o
n
Co
m
p
u
te
r Vi
s
i
o
n
a
n
d
Pa
t
t
e
rn
R
e
c
o
g
n
i
t
i
o
n
.
2
0
1
6
:
2403
-
2
4
1
2
.
[
1
9
]
H
L
i
,
P
S
u
,
Z
C
h
i
,
J
W
a
n
g
.
I
m
a
g
e
R
e
t
r
i
e
v
a
l
a
n
d
C
l
a
s
s
i
f
i
c
a
t
i
o
n
o
n
D
e
e
p
C
o
n
v
o
l
u
t
i
o
n
a
l
S
p
a
r
k
N
e
t
.
I
E
E
E
I
n
t
e
r
n
a
t
i
o
n
a
l
C
o
n
f
e
r
e
n
c
e
o
n
S
i
g
n
a
l
P
r
o
c
e
s
s
i
n
g
,
C
o
m
m
u
n
i
c
a
t
i
o
n
s
a
n
d
C
o
m
p
u
t
i
n
g
(
I
C
S
P
C
C
)
.
2016
:
1
-
6.
[2
0
]
E
M
a
rti
n
s
o
n
,
V
Y
a
l
l
a
.
Au
g
m
e
n
ti
n
g
De
e
p
Con
v
o
l
u
ti
o
n
a
l
Ne
u
ra
l
Net
work
s
wit
h
De
p
th
-
Ba
s
e
d
L
a
y
e
re
d
Det
e
c
t
i
o
n
fo
r
Hum
a
n
Det
e
c
t
i
o
n
.
IEEE/
RSJ
In
te
rn
a
ti
o
n
a
l
Con
fe
re
n
c
e
o
n
In
te
l
l
i
g
e
n
t
R
o
b
o
t
s
a
n
d
Sy
s
te
m
s
(I
RO
S)
.
2
0
1
6
:
1
0
7
3
-
1078.
[2
1
]
C
Sz
e
g
e
d
y
,
W
L
i
u
,
Y
J
i
a
,
P
Se
rm
a
n
e
t,
S
Ree
d
,
D
An
g
u
e
l
o
v
,
D
Erh
a
n
,
V
Va
n
h
o
u
c
k
e
,
A
Rab
i
n
o
v
i
c
h
.
G
o
i
n
g
D
e
e
p
e
r
wit
h
Con
v
o
l
u
ti
o
n
s
.
Pro
c
e
e
d
i
n
g
s
o
f
t
h
e
IEE
E
Con
fe
r
e
n
c
e
o
n
C
o
m
p
u
te
r
Vi
s
i
o
n
a
n
d
Pa
tt
e
rn
Re
c
o
g
n
i
t
i
o
n
.
2
0
1
5
:
1
-
9.
[2
2
]
K
He,
X
Zh
a
n
g
,
S
Ren
,
J
Su
n
.
Dee
p
Re
s
i
d
u
a
l
L
e
a
rn
i
n
g
f
o
r
I
m
a
g
e
Rec
o
g
n
i
t
i
o
n
.
IEEE
Con
f
e
re
n
c
e
o
n
Com
p
u
t
e
r Vi
s
i
o
n
a
n
d
Pa
tt
e
rn
Rec
o
g
n
i
ti
o
n
(CVPR)
.
2
0
1
6
;
7
7
0
-
778.
[2
3
]
K
Hos
o
z
a
w
a
,
R
H
W
i
j
a
y
a
,
T
D
L
i
n
h
,
H
Se
y
a
,
M
Ara
i
,
T
M
a
e
k
a
w
a
,
K
M
i
z
u
ta
n
i
.
Re
c
o
g
n
i
t
i
o
n
o
f
E
x
p
i
ra
ti
o
n
Da
te
s
W
r
i
tt
e
n
o
n
Fo
o
d
Pa
c
k
a
g
e
s
w
i
th
O
p
e
n
So
u
rc
e
O
CR
.
In
te
r
n
a
ti
o
n
a
l
J
o
u
rn
a
l
o
f
Co
m
p
u
te
r T
h
e
o
ry
a
n
d
En
g
i
n
e
e
ri
n
g
.
2
0
1
8
;
1
0
(
5
)
:
1
7
0
-
1
7
4
.
[2
4
]
L
Ba
z
z
a
n
i
,
A
Be
rg
a
m
o
,
D
An
g
u
e
l
o
v
,
L
T
o
rre
s
a
n
i
.
S
e
l
f
-
Ta
u
g
h
t
O
b
j
e
c
t
L
o
c
a
l
i
z
a
ti
o
n
wit
h
Dee
p
Net
work
s
.
IEEE
W
i
n
te
r C
o
n
fe
r
e
n
c
e
o
n
A
p
p
l
i
c
a
t
i
o
n
s
o
f
Co
m
p
u
te
r Vi
s
i
o
n
(
W
A
CV)
.
2
0
1
6
:
1
-
9.
[2
5
]
S
L
a
o
tra
k
u
n
c
h
a
i
,
A W
o
n
g
k
a
e
w
,
K
Pa
ta
n
u
k
h
o
m
.
M
e
a
s
u
re
m
e
n
t
o
f
Si
z
e
a
n
d
Dis
ta
n
c
e
o
f
O
b
j
e
c
ts
Us
i
n
g
M
o
b
i
l
e
Dev
i
c
e
s
.
In
te
r
n
a
ti
o
n
a
l
Con
fe
re
n
c
e
o
n
Si
g
n
a
l
-
Im
a
g
e
T
e
c
h
n
o
l
o
g
y
&
In
te
r
n
e
t
-
Ba
s
e
d
Sy
s
te
m
.
2013
:
156
-
161.
Evaluation Warning : The document was created with Spire.PDF for Python.