데이터프로파일링과 정규 표현식 활용 비정형 과학기술 빅데이터 품질관리 방안

2014 
과학기술정보의 공동활용이 활성화되면서 품질관리 중요성이 증가하고 있다. 현재 품질관리는 정형 데이터만 수행하고 있으며 비정형 데이터도 품질관리가 필요하다. 본 논문에서는 비정형 데이터인 과학기술 빅데이터 품질을 효율적으로 관리하기 위해 데이터프로파일링과 정규 표현식을 이용한 품질관리 모델을 개발하였다. 제안 모델을 연구보고서에 적용한 결과, 이메일, 전화번호 등 개인정보를 추출하고 마스킹하는데 탁월한 성능을 발휘하여 개인정보 유출을 방지할 수 있다.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []