Imputex алгоритмін паидалану арқылы жетіспеитін мәліметтерді толтыру құралы
https://doi.org/10.54596/2958-0048-2024-4-195-203
Аңдатпа
Мәліметтердің жетіспеуі көптеген салаларда деректердің сапасына кері әсерін тигізетін кең таралған мәселе. Жиі кездесетін себептердің бірі - ақпараттың енгізу кезінде жоғалуы. Түрлі зерттеулер жетіспейтін мәліметтерді толтыру әдістерін ұсынады, бірақ биология, химия және медицина сияқты салаларда көпсалалы сипаттамаларға байланысты қосымша қиындықтар туындайды. Бұл зерттеудің мақсаты - үлкен мәліметтер жиышығында жетіспейтін деректерді тиімді түрде толтыратын қосымшаны жасап шығару, өңдеу уақытын азайтуға бағытталған. Қосымшаның тиімділігі әртүрлі толтыру әдістерінің классификациялық дәлдігіне негізделе отырып бағаланды. Ұсынылған қосымша R, SPSS, Stata және Microsoft Excel сияқты құралдармен салыстырғанда артықшылықтарды көрсетіп, деректер сапасын және оларды тазалау процесін жақсартады.
Авторлар туралы
Фатимах СидиМалайзия
Серданг, Селангор
Лили Нурлияна Абдулла
Малайзия
Серданг, Селангор
Мустафа Алабада
Малайзия
Серданг, Селангор
Искандар Ишак
Малайзия
Серданг, Селангор
Әдебиет тізімі
1. Phung, S., Kumar, A., & Kim, J. (2019). A deep learning technique for imputing missing healthcare data. Proceedings of the Annual International Conference of the IEEE Engineering in Medicine and Biology Society, EMBS, 6513-6516. https://doi.org/10.1109/EMBC.2019.8856760
2. Deb, R., & Liew, A.W.C. (2016). Missing value imputation for the analysis of incomplete traffic accident data. Information Sciences, 339, 274-289. https://doi.org/10.1016/i.ins.2016.01.018
3. Dhindsa, K., Bhandari, M., & Sonnadara, R.R. (2018). What’s holding up the big data revolution in healthcare? BMJ (Online), 363, 1-2. https://doi.org/10.1136/bmi.k5357
4. Tsai, C.F., & Chang, F.Y. (2016). Combining instance selection for better missing value imputation. Journal of Systems and Software, 122, 63-71. https://doi.org/10.1016/i.iss.2016.08.093
5. Janssen, M., van der Voort, H., & Wahyudi, A. (2017). Factors influencing big data decision-making quality. Journal of Business Study, 70, 338-345. https://doi.org/10.1016/i.ibusres.2016.08.007
6. Batra, S., Khurana, R., Khan, M.Z., Boulila, W., Koubaa, A., & Srivastava, P. (2022). A Pragmatic Ensemble Strategy for Missing Values Imputation in Health Records. Entropy, 24(4), 1 -20. https://doi.ore/10.3390/e24040533
7. Chen, Z., Tan, S., Chajewska, U., Rudin, C., & Caruana, R. (2023). Missing Values and Imputation in Healthcare Data: Can Interpretable Machine Learning Help? Proceedings of Machine Learning Research, 209, 86-99.
8. Feng, S., Hategeka, C., & Grepin, K.A. (2021). Addressing missing values in routine health information system data: an evaluation of imputation methods using data from the Democratic Republic of the Congo during the COVID-19 pandemic. Population Health Metrics, 19(1), 1-28. https://doi.org/10.1186/s12963-021-00274-z
9. Urda, D., Subirats, J.L., Garria-Laencina, P.J., Franco, L., Sancho-Gomez, J.L., & Jerez, J.M. (2012). WIMP: Web server tool for missing data imputation. Computer Methods and Programs in Biomedicine, 108(3), 1247-1254. https://doi.org/10.1016/i.cmpb.2012.08.006
10. Acampora, G., Vitiello, A., & Siciliano, R. (2020). MIDA: A web tool for missing data imputation based on a boosted and incremental learning algorithm. IEEE International Conference on Fuzzy Systems, 1-6. https://doi.org/10.1109/FUZZ48607.2020.9177644
11. Zhou, Y.H., & Saghapour, E. (2021). ImputEHR: A Visualization Tool of Imputation for the Prediction of Biomedical Data. Frontiers in Genetics, 12(July), 1-9. https://doi.org/10.3389/fgene.2021.691274
12. Elfadaly, F.G., Adamson, A., Patel, J., Potts, L., Potts, J., Blangiardo, M., Thompson, J., & Minelli, C. (2021). BIMAM - A tool for imputing variables missing across datasets using a Bayesian imputation and analysis model. International Journal of Epidemiology, 50(5), 1419-1425. https://doi.org/10.1093/iie/dyab177
13. Alabadla, M., Sidi, F., Ishak, I., Ibrahim, H., & Hamdan, H. (2022). ExtraImpute: A Novel Machine Learning Method for Missing Data Imputation. Journal of Advances in Information Technology, 13(5). https://doi.org/10.12720/iait.13.5.470-476
14. Alabadla, M., Sidi, F., Ishak, I., Ibrahim, H., Hamdan, H., Amir, S. I., Nurlankyzy, A.Y. (2023). AutoImpute: An Autonomous Web Tool for Data Imputation Based on Extremely Randomized Trees. In Proceedings of the 12th International Conference on Data Science, Technology and Applications (DATA2023), (Italy, Rome), 11-13 July 2023. Volume 1, pp 598-605.
15. Jabason, E., Ahmad, M.O., & Swamy, M.N.S. (2018). Missing Structural and Clinical Features Imputation for Semi-supervised Alzheimer’s Disease Classification using Stacked Sparse Autoencoder. 2018 IEEE Biomedical Circuits and Systems Conference, BioCAS 2018 - Proceedings, 1-4. https://doi.org/10.1109/BIOCAS.2018.8584844
Рецензия
Дәйектеу үшін:
Сиди Ф., Абдулла Л.Н., Алабада М., Ишак И. Imputex алгоритмін паидалану арқылы жетіспеитін мәліметтерді толтыру құралы. М. Қозыбаев атындағы Солтүстік Қазақстан Университетінің Хабаршысы. 2024;(4 (64)):195-203. https://doi.org/10.54596/2958-0048-2024-4-195-203
For citation:
Sidi F., Abdullah L.N., Alabadla M., Ishak I. Missing values imputation tool using imputex algorithm. Vestnik of M. Kozybayev North Kazakhstan University. 2024;(4 (64)):195-203. https://doi.org/10.54596/2958-0048-2024-4-195-203