QSPR analysis for predicting heat of sublimation of organic compounds

2015 
Abstract: The heat of sublimation (HOS) is an essential parameter used to resolve environmental problemsin the transfer of organic contaminants to the atmosphere and to assess the risk of toxic chemicals. Theexperimental measurement of the heat of sublimation is time-consuming, expensive, and complicated. In thisstudy, quantitative structural property relationships (QSPR) were used to develop a simple and predictive modelfor measuring the heat of sublimation of organic compounds. The population-based forward selection methodwas applied to select an informative subset of descriptors of learning algorithms, such as by using multiplelinear regression (MLR) and the support vector machine (SVM) method. Each individual model and consensusmodel was evaluated by internal validation using the bootstrap method and y-randomization. The predictionsof the performance of the external test set were improved by considering their applicability to the domain.Based on the results of the MLR model, we showed that the heat of sublimation was related to dispersion,H-bond, electrostatic forces, and the dipole-dipole interaction between inter-molecules. 요약: 승화열은 대기 유기 오염물질의 확산에 관련된 환경적인 문제를 해결하거나, 위험한 화학 물질의위해성을 평가하는 데에 중요한 변수이다. 하지만 실험적으로 승화열을 측정하려면 많은 시간과 비용이소모 되며, 그 실험자체도 복잡하고 위험하다. 따라서 본 연구에서는 유기화합물의 승화열을 간단하게예측하는 모델을 개발하기 위하여 정량적 구조-물성 상관관계 연구를 이용하였다. 군기반 전진선택방법을적용하여 다중선형회귀방법과 서포트 벡터 머신과 같은 학습방법에 적합한 분자표현자들을 선택하도록 하였다. 개별 모델과 복합모델들은 부스트래핑 방법과 y-임의추출법에 의해 내부검증이 되었다. 외부 테스트데이터의 예측 성능은 적용범위를 고려하므로서 개선되었다. 다중선형회귀모델에 따르면, 승화열은 분자간의 분산력, 수소결합, 정전기적 상호작용, 쌍극자-쌍극자 상호작용과 관련이 있는 것을 나타낼 수 있었다.Key words: Heat of sublimation, QSPR, MLR, SVM, consensus model
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    12
    References
    1
    Citations
    NaN
    KQI
    []