Utilização do sucesso acadêmico para prever o abandono escolar de estudantes do ensino superior: um caso de estudo

2018 
Englishtudent dropout is a complex problem that affects most post-secondary undergraduate programs, all over the world. The Industrial Engineering program of the ISVOUGA Institute, located in Sta. Maria da Feira, Portugal, is no exception. This research used a dataset containing students’ general information and the students’ marks for the already assessed courses. From this dataset, 17 potential predictors have been selected: five intrinsic predictors (gender, marital status, professional status, full/part time student, and age) and 12 extrinsic ones (the marks in all the 12 courses taught during the first two semesters of the program). The main goal of this research was to predict the likelihood of a student to dropout, based on the referred predictors. A binary logistic regression was used to classify students as having a high or low probability not to re enroll the program. To validate the appropriateness of the used methodology, the accuracy of the logistic model was compared, by means of a 5-fold cross-validation, to the accuracy of three classification methods commonly used in Data Mining: One R, K Nearest Neighbors, and Naive Bayes. Four variables were significant to the logistic model (the marks in Materials Science, Electricity, Calculus 1, and Chemistry). The two most influential predictors for student dropout are failing to pass in the less challenging courses of Materials Science and Electricity. Contrary to what we would think prior to this research, we found that failing in more challenging courses such as Physics or Statistics does not have a significant influence on student dropout. portuguesO abandono escolar e um problema complexo que afeta a maioria dos programas de graduacao pos-secundaria, em todo o mundo. O curso de engenharia industrial do Instituto ISVOUGA, localizado em Santa Maria da Feira, Portugal, nao e excecao. Este estudo usou um conjunto de dados contendo informacoes gerais dos estudantes e suas notas para as unidades curriculares ja avaliadas. A partir deste conjunto de dados, foram selecionados dezessete preditores potenciais: cinco intrinsecos (genero, estado civil, situacao profissional, idade e regime de dedicacao aos estudos – integral ou parcial) e doze extrinsecos (as notas em todas as doze unidades curriculares ministradas durante os dois primeiros semestres do curso). O objetivo principal desta investigacao foi prever a probabilidade de um estudante abandonar o curso com base nos referidos preditores. Foi usada uma regressao logistica binaria para classificar os estudantes como tendo uma probabilidade alta ou baixa de nao se reinscreverem no curso. Para validar se a metodologia utilizada e apropriada para o estudo em causa, a precisao obtida com o modelo de regressao logistica foi comparada, por via de uma validacao cruzada com cinco particoes, com a precisao obtida pela utilizacao de tres metodos muito utilizados em data mining: One R, K Nearest Neighbors e Naive Bayes. O modelo de regressao logistica identificou quatro variaveis significativas na previsao do abandono escolar (as classificacoes nas unidades curriculares de ciencia dos materiais, eletricidade, calculo 1 e quimica). Os dois preditores mais influentes do abandono dos estudantes sao nao conseguir aprovacao nas unidades curriculares menos exigentes: ciencia dos materiais e eletricidade. Ao contrario do que seria de supor antes desta investigacao, descobrimos que a nao aprovacao em unidades curriculares mais exigentes, como fisica ou estatistica, nao tem influencia significativa no abandono escolar.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    16
    References
    1
    Citations
    NaN
    KQI
    []