본문 바로가기 주 메뉴 바로가기

산업문제 해결

문제 해결 결과

연구 시설 장비의 연구성과 가치 표현 모델 개발(2020)

작성일2020-12-01 기업국가연구시설장비진흥센터(NFEC)
모더레이터
### ※ 기업체와의 비밀유지동의서에 의한 비밀유지 의무로 인하여 개략적인 내용만 서술하였습니다. 1. 기업소개 NFEC - 국가연구시설장비진흥센터(National research Facilities & Equipment Center)는 과학기술 발전에 기반이 되는 연구개발 시설·장비의 고도화 추진을 체계적으로 지원하기 위하여 설립 2. 산업문제 - 국가 R&D 예산으로 구축한 연구 시설 장비의 연구성과(논문)를 정성 및 정량적으로 측정하기 위하여 다양한 변수(저널, 저널 분야, 논문 분야, 연간 인용 횟수, 인용 장비 비중 등)을 활용하여 가치 표현을 위한 수학적, 통계적 모델 개발 3. 해결 결과 - 논문 내 장비명 추출작업을 위해 Nature와 Science의 최근 5년의 논문을 크롤리하고 정제하여 분석 데이터 베이스 구축. 국가연구시설장비표준분류체계의 장비 영문명을 활용하여 검색 장비명 사전을 구축 - 수집된 논문 데이터에 TF-IDF를 적용하여 텍스트를 수치화하고 머신러닝 기반 분류모델인 NMF를 적용하여 논문 데이터의 토픽을 분류하는 모델을 구성함. 이를 활용하여 신규 논문의 토픽 유추 - 1000개 이상의 키워드(장비명)을 수만 건의 문서(논문)에서 효과적으로 검색하기 위해 장비명 검색 알고리즘에 FlashText 알고리즘을 적용하여 검색 시간을 단축 - 로그 정규화를 통해 IF의 비대칭성을 정규화함. 각 카테고리별 표준 변환 점수를 환산하여 새로운 표준 변환 영향력 지수를 정의함 - 표준 변환 영향력 지수는 저널 카테고리 내 순위를 유지하면서 카테고리의 특징을 반영하여 서로 다른 카테고리 간의 비교할 수 있게 함 ![](/file/8ab30cc23aa744da8640ff4d7933049c.png)
표준 변환 IF 분포 그림
4. 기대 효과 - 분야별 기준이 달라서 연구성과 활용에 대한 분석이 어려웠으나 개발된 연구성과의 수치적인 가치 표현 모델을 적용하여 분야 간 연구성과의 객관적 비교가 가능할 것으로 예상함 - 분야별 선도 저널에서 사용되는 주요 장비를 분석함으로써 국내 연구장비 우선 구축 분야 제시도 가능할 것으로 보임 - 논문 가치 수치표현 모델을 활용하여 연구 과제 정보에 연결된 논문의 성과를 수치화하여 투자 대비 가치가 높은 연구 장비 분류를 도출하고 지역별, 활용 성과별, 구축 시기별 투자 방향을 제시할 수 있는 기반 자료 작성에 활용 가능
모더레이터