top of page

BERT기반 모델을 활용한 웹페이지 하이라이터

최종 수정일: 2023년 6월 12일



팀명

AiLighter

팀원 명단

이동원, 김준현, 한현욱

지도교수

박정희 교수님

작품 배경 및 목적

현대 사회에서 웹페이지는 정보를 공유하고 습득하는데 핵심적인 수단이 되었다. 하지만 받아

들이는 정보의 양이 급격하게 늘면서 그에 따른 인지적 부하가 생겨났다. 이로 인해 사용자는

웹페이지의 내용을 신속하게 파악하기 어렵고, 원하는 정보를 찾는데 시간을 많이 소요하게

되었다. 본 연구개발의 목표는 사람들이 웹페이지의 내용을 더 쉽고 빠르게 파악할수 있도록

돕는것이다. 그것을 달성할 수 있는 한가지 방법은 중요문장에 하이라이팅을 하는것이다. 하

지만 직접 하이라이팅을 하려면 본문에 대한 사전 지식이 있어야만 한다는 문제점이 있다.

작품 내용

최근엔 자연어 처리 기술의 발달로 본문을 읽지 않고도 중요문장을 뽑아내는것이 가능해지게

되었다. 구글이 2018년에 제안한 BERT는 대용량의 데이터로 사전 학습된 언어모델을 토대

로 특정작업을 위한 신경망을 추가함으로서 다양한 태스크를 실행할수있는 전이학습 모델이

다. BERT는 특정 태스크를 위한 fine-tuning에 적은 시간을 투자해도 뛰어난 성능을 보인다

는 특징이 있다.

본 연구개발에서는 BERT에서 파생된 KorBertSum 모델을 fine-tuning하여 한국어를 추출요

약 할 수 있는 모델을 만들고 이를 이용하여 웹페이지의 중요문장을 하이라이팅 하는 웹브라

우저 확장 프로그램을 만듦으로써 사용자들이 효율적으로 온라인 문서를 읽는데 도움을 주고

자 한다.



 








조회수 97회댓글 0개

최근 게시물

전체 보기

Comments


bottom of page