Sample design effects on soil unit prediction with machine: randomness, uncertainty, and majority map

Carvalho Junior, Waldir de; Pereira, Nilson Rendeiro; Fernandes Filho, Elpidio Inacio; Calderano Filho, Braz; Pinheiro, Helena Saraiva Koenow; Chagas, Cesar da Silva; Bhering, Silvio Barge; Pereira, Vinicius Rendeiro; Lawall, Sara

doi:10.36783/18069657rbcs20190120

Waldir de Carvalho Junior^** Corresponding author: E-mail: waldir.carvalho@embrapa.br

Empresa Brasileira de Pesquisa Agropecuária, Embrapa Solos, Rio de Janeiro, Rio de Janeiro, Brazil.

http://orcid.org/0000-0002-8619-0989

Nilson Rendeiro Pereira

Empresa Brasileira de Pesquisa Agropecuária, Embrapa Solos, Rio de Janeiro, Rio de Janeiro, Brazil.

http://orcid.org/0000-0001-5901-6662

Elpidio Inacio Fernandes Filho

Universidade Federal de Viçosa, Departamento de Solos, Viçosa, Minas Gerais, Brazil.

http://orcid.org/0000-0002-9484-1411

Braz Calderano Filho

Empresa Brasileira de Pesquisa Agropecuária, Embrapa Solos, Rio de Janeiro, Rio de Janeiro, Brazil.

http://orcid.org/0000-0002-0917-9233

Helena Saraiva Koenow Pinheiro

Universidade Federal Rural do Rio de Janeiro, Departamento de Engenharia Agrícola, Seropédica, Rio de Janeiro, Brazil.

http://orcid.org/0000-0001-5742-7556

Cesar da Silva Chagas

Empresa Brasileira de Pesquisa Agropecuária, Embrapa Solos, Rio de Janeiro, Rio de Janeiro, Brazil.

http://orcid.org/0000-0002-0549-2599

Silvio Barge Bhering

Empresa Brasileira de Pesquisa Agropecuária, Embrapa Solos, Rio de Janeiro, Rio de Janeiro, Brazil.

http://orcid.org/0000-0002-0189-5905

Vinicius Rendeiro Pereira

Universidade Federal Rural do Rio de Janeiro, Departamento de Engenharia Agrícola, Seropédica, Rio de Janeiro, Brazil.

http://orcid.org/0000-0002-1733-6163

Sara Lawall

Universidade Federal Rural do Rio de Janeiro, Departamento de Engenharia Agrícola, Seropédica, Rio de Janeiro, Brazil.

http://orcid.org/0000-0002-0583-101X

* Corresponding author: E-mail: waldir.carvalho@embrapa.br

AUTHOR CONTRIBUTIONS

Conceptualization: Waldir de Carvalho Junior (lead), Elpidio Inacio Fernandes Filho (lead), and Nilson Rendeiro Pereira (supporting).

Methodology: Elpidio Inacio Fernandes Filho (lead), Waldir de Carvalho Junior (supporting), and Nilson Rendeiro Pereira (supporting).

Software: Waldir de Carvalho Junior (lead), Elpidio Inacio Fernandes Filho (lead), and Nilson Rendeiro Pereira (supporting).

Validation: Waldir de Carvalho Junior (lead), Elpidio Inacio Fernandes Filho (supporting); Nilson Rendeiro Pereira (supporting),Braz Calderano Filho (supporting), Helena Saraiva Koenow Pinheiro (supporting), Cesar da Silva Chagas (supporting),Silvio Barge Bhering (supporting), Vinicius Rendeiro Pereira (supporting), andSara Lawall (supporting).

Formal analysis: Waldir de Carvalho Junior (lead),Elpidio Inacio Fernandes Filho (supporting), and Nilson Rendeiro Pereira (supporting).

Investigation: Waldir de Carvalho Junior (supporting), Elpidio Inacio Fernandes Filho (supporting), Nilson Rendeiro Pereira (lead), Braz Calderano Filho (supporting), Helena Saraiva Koenow Pinheiro (supporting), Cesar da Silva Chagas (supporting), Silvio Barge Bhering (supporting), Vinicius Rendeiro Pereira (supporting), and Sara Lawall (supporting).

Resources: Waldir de Carvalho Junior (lead), Elpidio Inacio Fernandes Filho (supporting), Nilson Rendeiro Pereira (lead), Braz Calderano Filho (supporting), and Helena Saraiva Koenow Pinheiro (supporting).

Data curation: Waldir de Carvalho Junior (supporting), Elpidio Inacio Fernandes Filho (supporting), Nilson Rendeiro Pereira (lead), Vinicius Rendeiro Pereira (supporting), and Sara Lawall (supporting).

Writing – original draft: Waldir de Carvalho Junior (lead), Elpidio Inacio Fernandes Filho (supporting), and Nilson Rendeiro Pereira (supporting).

Writing – review and editing: Waldir de Carvalho Junior (lead), Elpidio Inacio Fernandes Filho (supporting), and Nilson Rendeiro Pereira (supporting).

Visualization: Waldir de Carvalho Junior (lead), Elpidio Inacio Fernandes Filho (supporting), and Nilson Rendeiro Pereira (supporting).

Supervision: Waldir de Carvalho Junior (lead), Elpidio Inacio Fernandes Filho (supporting), and Nilson Rendeiro Pereira (supporting).

Project administration: Waldir de Carvalho Junior (lead), Elpidio Inacio Fernandes Filho (supporting), andNilson Rendeiro Pereira (supporting).

Funding acquisition: Waldir de Carvalho Junior (lead), Elpidio Inacio Fernandes Filho (supporting), Nilson Rendeiro Pereira (supporting), and Sara Lawall (lead).

Soil Unit	Number of ROICs⁽¹⁾	Number of single samples
CXbd (Cambisols)	15	317
LAd (Xanthic Ferralsol)	10	307
LVAd (Rhodic Ferralsol)	23	300
RLd (Dystric Leptosols)	09	312
RLd+RckO⁽²⁾	10	303
RLd+CXbd+RckO	08	305

Covariate	Representation
Elevation; aspect; slope; plan curvature; profile curvature; curvature classification; general curvature; maximal curvature; minimal curvature; standardized height; tangential curvature; total curvature; cross sectional curvature; longitudinal curvature	Local scale morphometry
Multi-resolution ridge top flatness index; multi-resolution valley bottom flatness index; mid slope position; normalized height; slope height; valley depth; euclidian distance to rivers; topographic position index	Landscape scale morphometry
slope length factor; flow accumulation; flow direction; flow line curvature; topographic wetness index; terrain ruggedness index	Hydrologic characteristics
Diffuse insolation; total insolation; direct insolation	Landscape exposure
dist_x1 to dist_x16	Spatial dependence
UTM coordinates X and Y	Geographic position

Model	Variety (% of area)						Uncertainty
Model	1	2	3	4	5	6	MIN	MEAN	MAX	SD
Dataset01
C50	7.45	12.02	26.40	36.34	17.27	0.52	0	0.317	0.78	0.188
RF	3.68	18.60	32.36	30.89	14.02	0.46	0	0.286	0.78	0.180
GBM	4.35	21.41	32.78	28.10	12.52	0.84	0	0.297	0.78	0.179
MLR	0.16	2.79	42.17	28.04	21.86	4.99	0	0.435	0.78	0.151
Dataset02
C50	4.76	14.18	29.47	40.65	10.54	0.40	0	0.317	0.74	0.177
RF	7.02	24.04	33.71	28.06	7.07	0.10	0	0.237	0.76	0.186
GBM	2.23	20.37	34.34	33.89	8.62	0.56	0	0.328	0.78	0.177
MLR	0.15	0.81	7.76	57.35	27.88	6.05	0	0.515	0.80	0.120
Dataset03
C50	2.46	16.79	27.15	33.66	18.35	1.57	0	0.363	0.74	0.169
RF	8.29	36.61	33.35	18.72	2.92	0.10	0	0.217	0.74	0.181
GBM	3.01	24.57	37.52	24.76	9.84	0.29	0	0.299	0.76	0.189
MLR	0.07	0.28	3.27	11.41	24.32	60.65	0	0.496	0.80	0.154
Dataset04
C50	2.34	13.47	28.82	35.14	17.42	2.80	0	0.363	0.74	0.172
RF	5.39	36.05	37.69	17.61	3.26	0.00	0	0.229	0.76	0.175
GBM	2.61	19.15	44.37	24.27	9.50	0.11	0	0.295	0.76	0.177
MLR	0.09	0.31	1.64	7.30	32.10	58.56	0	0.516	0.80	0.135
Dataset05
C50	35.23	33.04	23.17	6.72	1.84	0.01	0	0.152	0.76	0.177
RF	44.23	39.92	13.67	2.02	0.15	0.00	0	0.091	0.74	0.141
GBM	49.28	34.47	12.69	3.22	0.33	0.01	0	0.105	0.74	0.155
MLR	46.56	36.94	14.06	2.37	0.07	0.00	0	0.096	0.72	0.147

	RF Dataset01	GBM Dataset01	RF Dataset05
RF Dataset01
GBM Dataset01	79.9
RF Dataset05	90.6	78.1
GBM Dataset05	79.6	88.7	78.9

[1] * Corresponding author: E-mail: waldir.carvalho@embrapa.br

Brasil

Brasil

Sample design effects on soil unit prediction with machine: randomness, uncertainty, and majority map

ABSTRACT