http://dx.doi.org/10.35381/r.k.v5i2.1013
Predicción del rendimiento de cultivos agrícolas usando aprendizaje automático
Agricultural Crop Yield Prediction Using Machine Learning
Joel Junior García-Arteaga
jgarcia5169@utm.edu.ec
Universidad Técnica de Manabí, Portoviejo
Ecuador
https://orcid.org/0000-0002-9261-5066
Jesús Javier Zambrano-Zambrano
jzambrano1217@utm.edu.ec
Universidad Técnica de Manabí, Portoviejo
Ecuador
https://orcid.org/0000-0001-8986-1832
Roberth Alcivar-Cevallos
roberth.alcivar@utm.edu.ec
Universidad Técnica de Manabí, Portoviejo
Ecuador
https://orcid.org/0000-0001-6282-8493
Walter Daniel Zambrano-Romero
Universidad Técnica de Manabí, Portoviejo
Ecuador
https://orcid.org/0000-0002-0225-3955
Recepción: 05 de julio 2020
Revisado: 28 de agosto 2020
Aprobación: 17 de septiembre 2020
Publicación: 01 de octubre 2020
RESUMEN
Se aborda la predicción del rendimiento de los cultivos a través del aprendizaje automático. Se usaron dos variables predictoras: hectáreas cosechadas, y producción en toneladas. Para el primer caso, el mejor modelo fue una arquitectura de red neuronal densa (DNN), con un MSE de 0.0081, seguido de los Random Forest (RF) con un MSE de 0.0104, árboles de decisión (AD) con 0.0168, y finalmente las máquinas de soporte vectorial (SVM) con 0.0328. Cuando se predijo producción en toneladas, el mejor modelo fue el de los RF con un MSE de 0.0550, seguidos de AD con 0.1418, DNN con 0.1489, y finalmente SVM con 0.3420. El test estadístico de diferencia significativa mostró que no existe tal diferencia entre el rendimiento de los modelos cuando se predice la variable hectáreas cosechadas, pero si para el caso de producción en toneladas, donde la capacidad predictiva de RF fue de 95% aproximadamente.
Descriptores: Agricultura; investigación agrícola; inteligencia artificial. (Palabras tomadas del Tesauro UNESCO).
ABSTRACT
Crop yield prediction is addressed through machine learning. Two predictor variables were used: hectares harvested, and production in tons. For the first case, the best model was a dense neural network (DNN) architecture, with a MSE of 0.0081, followed by Random Forest (RF) with an MSE of 0.0104, decision trees (AD) with 0.0168, and finally vector support machines (SVM) with 0.0328. When production in tons was predicted, the best model was RF with a MSE of 0.0550, followed by AD with 0.1418, DNN with 0.1489, and finally SVM with 0.3420. The statistical test of significant difference showed that there is no such difference between the performance of the models when the variable hectares harvested is predicted, but in the case of production in tons, where the predictive capacity of RF was approximately 95%.
Descriptors: Agriculture; agricultural research; artificial intelligence. (Words taken from the UNESCO Thesaurus).
INTRODUCCIÓN
En el campo de la agricultura, se realizan muchos procesos que hoy en día son automatizados, en los que permiten entre varias cosas, regular, controlar y administrar de una manera aceptable los recursos que en un cultivo se requiere para una buena producción, mediante dispositivos como sensores, actuadores, que, comunicados entre sí deben operar de cierta manera para optimizar entre varios aspectos: tiempo, dinero y mano de obra (Herrara-Díaz, 2016). Una de las consecuencias más importantes de esta modernización agraria es que aumenta considerablemente la integración de la agricultura con el resto de la economía, tanto a nivel de cada país como a nivel mundial. El sistema productivo de la agricultura moderna está mucho más relacionado con todos los aspectos económicos y, por lo tanto, su evolución está vinculada, de forma creciente, a la dinámica económica general (Food and Agriculture Organization, FAO, 2002).
Es por este vínculo entre economía y agricultura, que resulta imprescindible lograr un buen rendimiento en los cultivos. Predecir los niveles de producción en Sudamérica puede ser muchas veces una tarea desafiante, puesto que es una región cuya agricultura es altamente sensible a los cambios climáticos, sobre todo a las ondas de frío y de calor, mismas que afectan directamente a la producción y seguridad de los alimentos de la región. Estos cambios climatológicos pueden afectar la producción de cultivos a largo plazo, pero también lo hace a corto plazo, aumentando costos repentinamente y afectando sobre todo a regiones con bajos ingresos económicos. Sudamérica será la región clave en cuanto a producción agrícola se refiere en el futuro, por lo que uno de los mayores retos que se tiene es ser capaz de optimizar la producción de cultivos (Marengo et al., 2014).
Realizar tareas de predicción, por otro lado, no es una tarea para nada sencilla, por cuanto en productos como la caña de azúcar, se necesita la evaluación de múltiples factores, muchas veces impredecibles, como lo es el clima. Esto hace que los agricultores tengan la difícil tarea de tomar decisiones de cómo sembrar; si sembrar poco, mucho, o en el peor de los casos, no sembrar nada. La complejidad de evaluar estos factores hace que la decisión tomada por parte de los agricultores no siempre sea la mejor, ocasionando grandes pérdidas monetarias (Laurentin, 2020).
En la literatura es posible encontrar varios estudios (Carrillo & Parraga-Alava, 2018; Parraga-Alava, et al., 2020), donde se han aplicado algoritmos de aprendizaje automático para tareas de clasificación/predicción. En el caso de predicción de cultivos, (Crane-Droesch, 2018), analizó el rendimiento del maíz en el medio oeste de Estados Unidos, aplicando un modelado que utiliza una variable semi paramétrica de una red neuronal profunda, para de esta manera ser capaces de capturar la no linealidad de los datos. El enfoque de este estudio, al igual que (Khaki & Wang, 2019), se centró en ser capaz de tratar con el problema de la alta dimensionalidad de los datos, y ser capaces de capturar gran parte de la no linealidad de estos.
El enfoque adoptado por (Khaki & Wang, 2019), consistió en el uso de dos redes neuronales profundas para predecir la producción, superó a otros modelos populares como Lasso, redes neuronales superficiales (SNN) y árboles de decisión. Este estudio reveló que los factores ambientales tienen un fuerte impacto sobre el rendimiento de los cultivos, siendo un factor más determinando que, por ejemplo, el genotipo de las plantas. Finalmente, (Van Klompenburg et al., 2020), analizó los métodos y características más utilizados, acerca de la problemática de la alta dimensionalidad que tienen los conjuntos de datos utilizados para predicción de producción en cultivos agrícolas.
La mayor parte de los estudios realizados pertenecen a regiones de Estados Unidos y Europa, y si bien en Sudamérica también se han hecho estudios acerca de la producción de cultivos, en su gran mayoría están basados en analizar cómo ha sido la producción a lo largo del tiempo, mas no en predecir. Por ejemplo, (Ferrero et al., 2018), analiza la producción en términos de estabilidad con respecto al cambio climático, viendo qué factores son los que más afectan a los cultivos.
Por otro lado, (Seo & Mendelsohn, 2008), presentaron un enfoque similar, pero esta vez centrándose en analizar las decisiones tomadas por parte de los agricultores cuando el cambio climático afectó sus cultivos. Estos estudios están centrados en el proceso de descripción de cómo ciertos factores del cambio climático han afectado al rendimiento de cultivos en Sudamérica, asimismo, analizan las decisiones tomadas por los agricultores frente al cambio climático. Es por esta razón, y dado a que Sudamérica es una región con un papel importante en la economía futura (Ferrero, et al., 2018), que surge la necesidad de crear modelos predictivos que ayuden a los agricultores a realizar mejores estimaciones sobre el rendimiento de los cultivos, y de esta forma, minimizar las pérdidas económicas que pueden surgir de una mala cosecha.
En este artículo se analizan diversos modelos de aprendizaje automático para predecir el rendimiento de los cultivos agrícolas en Argentina. La idea es, a partir de estos modelos, capturar mejor la no linealidad de los datos, y de esta manera, ofrecer predicciones más precisas que permitan tomar mejores decisiones por parte de los agricultores en cuanto a qué cantidad de cierto producto sembrar, teniendo en cuenta el posible rendimiento que este dará.
MATERIALES Y MÉTODOS
Selección de datos
Para la creación del conjunto de datos se recopilaron datos de diversas fuentes. El conjunto de datos principal (obtenido del repositorio de datos del gobierno de Argentina: https://bit.ly/33owdbK) contiene datos acerca de los productos sembrados y cosechados en Argentina desde la campaña de 1969/1970 hasta 2019/2020. Este conjunto de datos se enriqueció con datos referentes al clima (https://bit.ly/3mfDKkt), obtenidos desde el mismo repositorio del gobierno argentino; y con datos geográficos obtenidos del Centro de Información Agroclimática de Argentina (https://bit.ly/36eutnr).
Para el conjunto de datos usado en los experimentos computacionales, se seleccionaron cinco variables climáticas, entre las cuales figuran: velocidad del viento, precipitación, temperatura promedio, máxima y mínima; tres variables de las condiciones geográficas: latitud, longitud, y superficie por encima del nivel del mar; cinco variables del cultivo como tal, entre las que se encuentran: hectáreas sembradas, hectáreas cosechadas, producción y rendimiento. Note que no se consideraron variables genéticas de las plantas, puesto que en \cite{Khaki2019} se demostró que los factores genéticos no afectan tanto como los climáticos; asimismo, \cite{seo2008analysis} llegó a la conclusión de que dos de los factores que más afectan la producción de cultivos son la temperatura y la precipitación, mismas variables que hemos considerado nuestro conjunto de datos.
En total se seleccionaron 13 variables del conjunto de datos, de las cuales 2 se trataron como variables dependientes (superficie cosechada, producción), y las otras 10 como variables independientes. Las variables dependientes se usan para la predicción del rendimiento de cultivos. Una descripción del conjunto de datos se muestra en la tabla 1.
Tabla 1.
Variables del conjunto de datos utilizado.
|
Variable |
Tipo de dato |
Descripción |
|
Lat |
Continuo |
Latitud del cultivo |
|
Lon |
Continuo |
Longitud del cultivo |
|
Asnm |
Continuo |
Altura sobre el nivel del mar medida en metros |
|
Temperatura |
Continuo |
Temperatura anual promedio medida en °c |
|
Temperatura máxima |
Continuo |
Temperatura anual máxima medida en °c |
|
Temperatura mínima |
Continuo |
Temperatura anual mínima medida en °c |
|
Velocidad del viento |
Continuo |
Medida en km/h (promedio anual) |
|
Cultivo |
Categórico |
Medida en milímetros de agua (promedio anual) |
|
Precipitación |
Entero |
Nombre del cultivo a sembrar |
|
Sup. Sembrada |
Entero |
Hectáreas de tierra sembrada |
|
Sup. Cosechada |
Entero |
Hectáreas de tierra cosechada |
|
Producción |
Entero |
Toneladas producida por la cosecha |
|
Rendimiento |
Entero |
Kilogramos cosechados por hectárea |
Preprocesado
Algunos datos pertenecientes a las variables de temperatura, velocidad del viento, y precipitación estaban faltantes, por lo que se completaron usando la media de los que si estaban disponibles. Para evitar que un producto tuviera más peso que el resto, se usó el método de One Hot Encoding. Las variables pasaron un proceso de estandarización, que consiste en aproximar una dimensión a una distribución normal estándar, mediante el uso de la ecuación 1.
(1)
Donde
es el tensor de la dimensión
estandarizada,
es
el tensor a estandarizar,
es
la media de la dimensión, y finalmente
hace referencia a la desviación estándar
de la dimensión en cuestión. En este contexto,
hace referencia a la variable a
estandarizar, y representa cualquier variable numérica del conjunto de datos.
Modelado
Para predecir el rendimiento de los cultivos se modelaron soluciones usando los métodos de aprendizaje automático: redes neuronales profundas (DNN), máquinas de soporte vectorial (SVM), random forest (RF), y árboles de decisión (AD), debido a que son métodos bastante robustos capaces de capturar no linealidad en datos. Para cada uno de estos modelos se configuran para evaluación una serie de parámetros que se probarán mediante el método de grid search, a excepción de las redes neuronales, puesto que cada arquitectura debe ser diseñada y evaluada individualmente. En la tabla 2 se muestran los parámetros a considerar y sus respectivos valores para cada modelo.
Tabla 2.
Parámetro a considerar en los experimentos para cada modelo de aprendizaje automático.
|
Modelo |
Parámetro |
Valor a evaluar |
|
Random Forest |
Bootstrap |
Activo,Inactivo |
|
Estimadores |
100, 200, 500 |
|
|
Criterio |
MSE, MAE |
|
|
Árboles de decisión |
Profundidad |
10, 15, 20 |
|
Splitter |
Random, Best |
|
|
Criterio |
MSE, FMSE, MAE |
|
|
SVM |
C |
0.01, 0.1, 1, 10 |
|
|
Gamma |
0.1, 1, 10 |
|
|
Kernel |
RBF, Linear |
|
DNN |
Capas ocultas |
1, 3, 4, 8 |
|
|
Funciones de activación |
ReLU, Swish, Elu, Linear |
|
|
Épocas |
100, 250, 500 |
|
|
Batch size |
250, 500 |
Validación
Para la fase de entrenamiento se usará el 70% de los datos disponibles, y se dejará el otro 30\% para validar la capacidad de generalización alcanzada por los modelos. Para ello, se consideran las métricas error cuadrático medio (MSE) y coeficiente de determinación (R2). Para probar la capacidad de generalización real de cada modelo, realiza un segundo proceso de validación, en el cual cada modelo se entrena 30 veces, cada una, con una distribución distinta en las variables de entrenamiento, en todos los casos se garantiza la reproducibilidad de los experimentos mediante el uso de semilla.
El MSE (ecuación 2) en este contexto
indicará qué tan bien se ajustan los hiperplanos creados por cada modelo al
conjunto de datos usado en la etapa de entrenamiento, este métrica se define en
la ecuación anterior, donde n es el número de registros disponibles para
validación, yi hace referencia al valor real para el
registro i-ésimo, y la variable
es el valor predicho por el modelo de
aprendizaje automático.
(2)
El coeficiente de determinación R2
(ecuación 3) ayuda a ver qué tan bueno es un modelo en términos de cuánta
varianza logra capturar, algo de suma utilidad puesto que la variable de
producción cuenta con datos muy dispersos. El coeficiente de determinación se
define mediante la siguiente ecuación tensorial, donde
hace referencia al tensor de valores
reales para una variable predictora,
es el tensor de valores predichos por el
modelo, y por último,
es un escalar que representa la media
del tensor de valores reales de una variable predictora.
(3)
Note que en la ecuación 2 y 3 la
variable
hace
referencia al valor real de una de las variables predictoras (hectáreas
cosechadas o producción), mientras que
se refiere a la predicción hecha por el
modelo para una de estas variables.
RESULTADOS Y DISCUSIÓN
Selección de datos
Los cuatro modelos de aprendizaje automático fueron implementados en Python usando las librerías scikit-learn y keras. El conjunto de datos después de pasar por el proceso de One Hot Encoding escaló de 13 variables a 44, con un total de 83247 registros, de los cuales 58272 se usaron para entrenar los modelos y 24975 para validar su rendimiento.
En la figura 1 se muestra la correlación existente entre las diferentes variables del conjunto de datos usado. En esta se observa que las variables predictoras (sup_cosechada, produccion) tienen una correlación muy baja con las variables independientes, a excepción de las variables de sup\_cosechada con sup_sembrada que tienen una correlación de alrededor de 95%.

Figura 1. Correlación entre las variables empleadas en el conjunto de datos.
La poca cantidad de variables correlacionadas dificultó el rendimiento de modelos a la hora de aprender a generalizar la variable producción. La distribución de la precipitación es otra de las variables, en este caso, independiente, que dificultó el modelado debido a que sus registros estuvieron bastante dispersos. Como se muestra en la figura 2, si bien una gran parte de los datos se encuentran entre 950 y 1250 mm, hay una cantidad de datos considerable que cae por debajo y por encima de este este rango, sin seguir una distribución uniforme.

Figura 2. Distribución de valores de la variable precipitación (mm).
Rendimiento de los modelos
Cada uno de los modelos, a excepción de las redes neuronales (DNN), fue usado junto al método de la grid search, para que este encontrara los mejores parámetros en cada caso. Cada modelo fue valido usando el método de k-Fold con k=5. Los mejores parámetros para cada modelo de acuerdo a la grid search se muestran en la tabla 3.
Tabla 3.
Mejores parámetros obtenidos por la grid search para cada uno de los modelos considerados en la experimentación.
|
Modelo |
Parámetro |
Valor para y=cosecha |
Valor para y=produccion |
|
Random Forest |
Bootstrap |
Activo |
Activo |
|
Estimadores |
100 |
200 |
|
|
Criterio |
MSE |
MSE |
|
|
Árboles de decisión |
Profundidad |
10 |
15 |
|
Splitter |
Random |
Random |
|
|
Criterio |
MSE |
FMSE |
|
|
SVM |
C |
10 |
10 |
|
Gamma |
1 |
1 |
|
|
Kernel |
RBF |
RBF |
|
|
DNN |
Capas ocultas |
3 |
3 |
|
Funciones de activación |
ReLY, swish, elu |
ReLY, swish, elu |
|
|
Épocas |
250 |
250 |
|
|
Batch size |
250 |
500 |
En cuanto al rendimiento, como se muestra en la tabla 4, todos a excepción de los Random Forest tuvieron problemas con la variable produccion, dando un MSE superior a 0.1, que, aunque no es un mal resultado debido a que significa que la distancia entre el hiperplano generado por el modelo y los datos es bastante pequeña, pero como se puede apreciar, el coeficiente de determinación no es tan alto. Y en la SVM esta métrica indica que el modelo no fue capaz de capturar toda la varianza presente en el conjunto de datos. El modelo de Random Forest (RF) fue el modelo con los mejores resultados, aunque en la variable de hectáreas cosechadas fue superado por las redes neuronales profundas (DNN) en la métrica de MSE, este capturó mucha más varianza, llegando al 99% de captura comparado con solo el 82% que logró capturar la red neuronal.
Tabla 4.
Rendimiento de los modelos en el conjunto de validación cuando la variable a predecir es cosecha (hectáreas cosechadas).
|
Modelo |
MSE |
R2 |
Tiempo de ejecución |
|
Random Forest |
0.0197 |
0.9812 |
0.9 segundos |
|
Árboles de decisión |
0.0101 |
0.9903 |
37 segundos |
|
SVM |
0.0328 |
0.9688 |
6 minutos |
|
DNN |
0.0081 |
0.8200 |
5 minutos |
En la tabla 5 se muestra el rendimiento obtenido por cada modelo para la variable de hectáreas cosechadas (sup_cosecha). Aquí se puede apreciar que el mejor modelo fue el de Random Forest (RF), ya que, a pesar de que las redes neuronales (DNN) obtuvieron un MSE menor, el R2 indica que que estas no lograron capturar tanta varianza en comparación con los Random Forest (RF).
Tabla 5.
Rendimiento de los modelos en el conjunto de validación cuando la variable a predecir es producción (produccion).
|
Modelo |
MSE |
R2 |
Tiempo de ejecución |
|
Random Forest |
0.1164 |
0.8913 |
0.8 segundos |
|
Árboles de decisión |
0.0536 |
0.9493 |
1.5 minutos |
|
SVM |
0.3420 |
0.6805 |
6 minutos |
|
DNN |
0.1489 |
0.8609 |
5 minutos |
En la tabla 5 nuevamente se observa que el mejor modelo es el de Random Forest (RF), obtuviendo un MSE bastante bajo en comparación con los demás modelos, y obtuviendo un R2 bastante alto, indicando que logró capturar gran parte de la varianza en los datos.
El modelo Random Forest (RF) al ser el que mejores resultados obtuvo, se sometió a un segundo proceso de validación, donde fue entrenado 30 veces y para cada una de ellas se capturó el MSE y R2 promedios, así como la desviación estándar obtenida en cada métrica. Para la variable producción, promedio de MSE obtenido por el modelo fue de 0.085670, con una varianza de 0.0529, lo que en principio indicaría que el modelo realmente ha logrado converger en un punto donde fue capaz de capturar gran parte de la no linealidad de los datos.
En cuanto al R2, obtuvo una media de 0.9189 y una desviación estándar de 0.0434, confirmando que el modelo representa bastante bien la dispersión del conjunto de datos, esto en cuanto a la variable de producción. Para la variable de hectáreas cosechadas, se obtuvo un MSE de 0.0145 con una desviación estándar de 0.0053. El R2 fue de 0.9863 y una desviación estándar de 0.0049. Al igual que para la variable de producción, el modelo logró converger en un error bastante bajo y logró representar la dispersión de datos que ocurre en el conjunto de datos.
Para medir si existe una diferencia significativa en los resultados obtenidos entre los modelos evaluados se utilizó al test ANOVA, con una hipótesis nula H0 que establece que no existe una diferencia significativa entre el MSE promedio o R2 promedio de los grupos, y una hipótesis alterna H1 que establece que existe una diferencia significativa entre el rendimiento de los grupos. Para ello se usaron los datos obtenidos de los modelos probados en la tabla 4-5 sobre quince ejecuciones para cada variable predictora. Cuando la la variable a predecir era hectáreas cosechadas (sup_cosechada) se obtuvo un p-value de 0.3050 para MSE, y 0.3042 para R2, superando el nivel de significación de 0.05, por lo que concluye que no existe una diferencia significativa entre el rendimiento de los modelos testeados. Por otro lado, cuando la variable a predecir fue la producción en toneladas (produccion) se obtuvo un p-value de 1.28x10-23 para R2 y 7.251x10-19 para MSE, un resultado mucho menor que el nivel de significación de 0.05, por lo que se rechaza la hipótesis nula, y se concluye que existe una diferencia significativa entre los modelos evaluados.
CONCLUSIONES
En este trabajo se utilizaron modelos de aprendizaje automático para proponer soluciones en lo que respecta a la predicción del rendimiento de cultivos, dando resultados muy parecidos a estudios realizados que abarcan esta temática. El enfoque utilizado consideró algoritmos predictores conocidos como redes neuronales profundas (DNN), máquinas de soporte vectorial, árboles de decisión (AD) y Random Forest (RF) que fueron entrenamos para realizar la predicción considerando variables climáticas, de cultivo y condiciones geográficas
De estos modelos de aprendizaje automático fue el Random Forest (RF), el que logró obtener mejores resultados, con un MSE de 0.0101 y un R2 de 0.9903 para la variable de hectáreas cosechadas, y un MSE de 0.0536 con un R2 de 0.9493 para la variable de producción. A este modelo le siguieron los árboles de decisión (AD) con 0.0197 de MSE y 0.9812 en el R2 para la variable de hectáreas cosechadas, y para la variable de producción obtuvo un MSE de 0.1164 y un R2 de 0.8913.
Las pruebas estadísticas evidenciaron que existe diferencia significativa entre el rendimiento de los modelos cuando se predice la variable producción en toneladas, en cuyo caso, el modelo basado en Random Forest (RF) tuvo mejor capacidad predictiva al lograr capturar patrones complejos entre variables con muy poca correlación, y con menos capacidad de cómputo que los otros modelos considerados en el estudio. Por lo que este es el modelo que debe ser usado para realizar predicciones relacionados a los datos en estudio.
Para trabajos futuros se puede optar por la creación de modelos capaces de predecir los cambios climáticos que podrían suceder durante el periodo que dura la cosecha y que podrían afectar negativamente su rendimiento, siendo estos capaces de predecir posibles perturbaciones climáticas, que puedan llegar a presentarse. Además de que se podría expandir el área de muestreo, abarcando más países de Sudamérica.
FINANCIAMIENTO
No monetario
AGRADECIMIENTO
A la Universidad Técnica de Manabí, Portoviejo; por motivar el desarrollo de la investigación.
REFERENCIAS CONSULTADAS
Carrillo, J.M., Parraga-Alava, J. (2018). How Predicting The Academic Success of Students of the ESPAM MFL? A Preliminary Decision Trees Based Study. 2018 IEEE Third Ecuador Technical Chapters Meeting (ETCM), Cuenca, 2018, pp. 1-6. https://doi.org/10.1109/ETCM.2018.8580296
Crane-Droesch, A. (2018). Machine learning methods for crop yield prediction andclimate change impact assessment in agriculture. Environmental Research Letters, 13(11); 1-12. https://doi.org/10.1088/1748-9326/aae159
Ferrero, R., Lima, M. & Gonzalez‐Andujar, J. (2018), Crop production structure and stability under climate change in South America. Ann Appl Biol, 172: 65-73. https://doi.org/10.1111/aab.12402
Food and Agriculture Organization, FAO. (2002). Agricultura mundial: hacia los años 2015/2030 [World agriculture: towards the years 2015/2030]. Technical Report 1. Recuperado de https://n9.cl/n29i7
Herrera-Díaz, C. A. (2016). Implementación de un módulo de análisis estadístico y predictivo para agricultura utilizando bigdata y machine learning, integrado al sistema Iotmach. [Implementation of a statistical and predictive analysis module for agriculture using bigdata and machine learning, integrated to the Iotmach system]. Trabajo de titulación. Carrera de ingeniería de sistemas. Universidad Técnica de Machala. Recuperado de https://n9.cl/abp1
Khaki, S. & Wang, L. (2019). Crop Yield Prediction Using Deep Neural Networks. Plant Sci. 10:621. https://doi.org/10.3389/fpls.2019.00621
Laurentin, H. (2020). Importancia de la predicción del rendimiento en caña de azúcar en un contexto de transformación digital. SofOS. Recuperado de https://n9.cl/fl2vh
Marengo JA, Chou SC, Torres RR, Giarolla A, Alves LM, Lyra A. (2014). Climate change in Central and South America: Recent trends, future projections, and impacts on regional agriculture. CCAFS Working Paper no. 73. Copenhagen, Denmark: CGIAR Research Program on Climate Change, Agriculture and Food Security (CCAFS). https://hdl.handle.net/10568/41912
Parraga-Alava J., Alcivar-Cevallos R., Riascos J.A., Becerra M.A. (2020) Aphids Detection on Lemons Leaf Image Using Convolutional Neural Networks. In: Botto-Tobar M., Zamora W., Larrea Plúa J., Bazurto Roldan J., Santamaría Philco A. (eds) Systems and Information Sciences. ICCIS 2020. Advances in Intelligent Systems and Computing, vol 1273. Springer, Cham. https://doi.org/10.1007/978-3-030-59194-6_2
Seo, S. N. & Mendelsohn, R. (2008). An analysis of crop choice: Adapting to climate change in South American farms. Ecological economics, 67(1):109–116. https://doi.org/10.1016/j.ecolecon.2007.12.007
Van Klompenburg, T., Kassahun, A., & Catal, C. (2020). Crop yield prediction using machine learning: A systematic literature review. Computers and Electronics in Agriculture, 177. https://doi.org/10.1016/j.compag.2020.105709
©2020 por los autores. Este artículo es de acceso abierto y distribuido según los términos y condiciones de la licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0) (https://creativecommons.org/licenses/by-nc-sa/4.0/).